In einem Skript versuche ich von fremden Websites entliehene Texte typografisch zu vereinheitlichen. So sollen typografische Anführungszeichen („ “) in die französische Variante (» «) umgewandelt werden. In meinem RegEx-Programm wird empfohlen, die Anführungszeichen mit
bzw.
zu erkennen. Das klappt aber nicht. Wenn ich es aber so versuche
bzw.
klappts. Mit letzterer Version gibt es allerdings Probleme mit meinem Editor (obwohl er das Skript in UTF-8 speichert).
Die umzuwandelnden Texte stehen als UTF-8 zur Verfügung, mein Skript setzt als default_charset ebenfalls UTF-8 ein.
Hat jemand ne Idee, ob man die Pattern auch ohne Sonderzeichen formulieren kann?
Vielen Dank!
Bodil
PHP:
$pattern = '/\\x84/';
PHP:
$pattern = '/\\x93/';
PHP:
$pattern = '/„/';
PHP:
$pattern = '/“/';
Die umzuwandelnden Texte stehen als UTF-8 zur Verfügung, mein Skript setzt als default_charset ebenfalls UTF-8 ein.
Hat jemand ne Idee, ob man die Pattern auch ohne Sonderzeichen formulieren kann?
Vielen Dank!
Bodil