• Jetzt anmelden. Es dauert nur 2 Minuten und ist kostenlos!

RegEx und UTF-8

bodil

Mitglied
In einem Skript versuche ich von fremden Websites entliehene Texte typografisch zu vereinheitlichen. So sollen typografische Anführungszeichen („ “) in die französische Variante (» «) umgewandelt werden. In meinem RegEx-Programm wird empfohlen, die Anführungszeichen mit
PHP:
$pattern = '/\\x84/';
bzw.
PHP:
$pattern = '/\\x93/';
zu erkennen. Das klappt aber nicht. Wenn ich es aber so versuche
PHP:
$pattern = '/„/';
bzw.
PHP:
$pattern = '/“/';
klappts. Mit letzterer Version gibt es allerdings Probleme mit meinem Editor (obwohl er das Skript in UTF-8 speichert).
Die umzuwandelnden Texte stehen als UTF-8 zur Verfügung, mein Skript setzt als default_charset ebenfalls UTF-8 ein.
Hat jemand ne Idee, ob man die Pattern auch ohne Sonderzeichen formulieren kann?
Vielen Dank!
Bodil
 
Werbung:
Zurück
Oben