PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Sonderzeichen


Sengi
11.08.2007, 20:58:21
HiHo,

habe folgendes Problem. Und zwar lese ich aus einer XML Datei daten aus und verarbeite diese. Dabei werden Sonderzeichen "umkodiert?" auf jedenfall kommt folgendes bei raus:

aus Grollbär wird Grollb%C3%A4r

ähnlich auch bei Kombinationen von á etc..

Durch gemütliches Suchen mittels Google oder in diversen Foren bin ich auf die FUnktion utf8-de/encode gekommen, welche mir auch nicht wirklich hilft, da ich nicht ganz versteh was zu was konvertiert wird etc...

Vielleicht könnte mir jemand kurz nen Denkanstoß geben. Würde mich sehr freuen :-)

Gruß
Sengi

sputnik72
13.08.2007, 10:21:06
Hei!

Ich bin zwar kein Zeichensatz-Experte, habe das Problem aber bereits selber beim Import von csv- bzw. txt-Dateien in eine Mysql-Datenbank gehabt. Die Lösung war hier, das man auf identische Zeichensätze achten muss. Wenn also die Datenbank mit dem Zeichensatz latin-1 (ISO-8859-1) erstellt ist, dann sollte die zu importierende Datei mit dem gleichen Zeichensatz erstellt sein. Wenn Dein Rechner z.B. auf UTF-8 eingestellt ist, werden mit einem Editor erstellte Textdateien, meines Wissens nach, in diesem Zeichensatz gespeichert. Beim Import in eine latin-1-DB bekommt man dann diese sonderbaren Zeichen anstatt der Sonderzeichen.

Vielleicht ist es ja bei Dir ein ähnliches Problem, so dass Dir das hier weiterhilft.

Gruß
Sputnik

meikel (†)
13.08.2007, 13:00:31
Und zwar lese ich aus einer XML Datei daten aus und verarbeite diese. Dabei werden Sonderzeichen "umkodiert?"
1. wie sieht das File aus?
2. wie verarbeitest Du die Daten?
auf jedenfall kommt folgendes bei raus:
aus Grollbär wird Grollb%C3%A4r
Das sieht aus wie "rawurlencodetes UTF-8".