PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : rdf und utf-8


{]Muad[}
30.08.2006, 23:53:38
Hi,

ich wollte mit php von einer anderen Seite RSS-Feeds (z.B. heise) auslesen und sie anzeigen lassen. Ich benutze SimpleXML.

Ich bekomme aber für die Sonderzeichen Zeichenschnippsel (etwa so "ü" für ü). Ich kann mir ja leider beim rss die Codierung nicht aussuchen.

Gibt es eine PHP Funktion, die das wieder gerade biegt??
Ich benutze die Zeichsatz: iso-8859-1

mfg
Muad

feuervogel
30.08.2006, 23:55:07
entweder du steigst auf utf-8 um (ist recht sinnvoll) oder du benutzt mb_convert_encoding()

{]Muad[}
30.08.2006, 23:59:39
Danke für die schnelle Antwort.

Muss ich mir überlegen, ob ich die schriftallgemein wechsel

Mal ne Frage, warum ist es sinnvoll??? Wird das ist in der Zukunft abgeschafft???

feuervogel
31.08.2006, 00:01:59
in utf-8 liegt (in meinen augen) die zukunft. die anzahl der zeichen die in den iso-zeichensätzen gespeichert werden können, ist sehr begrenzt. utf-8 sollte für die schriften der welt ausreichen, man braucht mit unicode (utf-8 ist eine art unicode) also nur noch einen zeichensatz für alle zeichen...

{]Muad[}
31.08.2006, 00:09:49
Danke,

ich denke mal, es reicht nicht aus, wenn im HTML-Kopf
<meta http-equiv="content-type" content="text/html; charset=iso-8859-1" />
durch
<meta http-equiv="content-type" content="text/html; charset="utf-8" />
ersetze oder???

Muss mich dann wohl ins Thema reinlesen....

meikel (†)
31.08.2006, 14:29:55
http://test.php-help.info/heise.de-1/ (Quelltext wird angezeigt)

{]Muad[}
31.08.2006, 17:57:39
Vielen Dank für den Link, leider funktioniert es auch nicht. Vielleicht liegt das Problem auch im Header??
Könnte sich den jemand mal anschauen...

<?xml version="1.0" ?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" dir="ltr">
<head>

<meta http-equiv="content-type" content="text/html; charset=ISO-8859-1" />
<meta name="resource-type" content="document" />
<meta name="language" content="de" />
<meta name="distribution" content="global" />
<meta name="keywords" content="" />
<meta name="description" content="" />
<meta http-equiv="content-style-type" content="text/css" />
<meta http-equiv="imagetoolbar" content="no" />

....


mfg
Muad

meikel (†)
31.08.2006, 23:06:38
Muad[}']Vielen Dank für den Link, leider funktioniert es auch nicht.
Das sollten wir mal etwas genauer klären. Wenn ich auf den Link klicke, dann sehe ich heute das:
Berliner Wissenschaftler stellen neue TV-Werbeerkennungstechnik vor
US-Regierung und Microsoft beantragen Verlängerung der Kartellrechtsaufsicht
Pioneer plant Kombilaufwerk für Blu-ray und HD DVD
Funkausstellung startet mit großen Erwartungen
Sharps Full-HD-"Glasfabrik" nimmt Betrieb auf
Grundig präsentiert Full-HD-Fernseher mit Bewegtbildoptimierung
Auch Warner, Sony und Paramount bringen deutsche Blu-ray-Titel
Was läuft auf dem Linux-Desktop?
... usw
... und nach den Links wird der Quelltext des Scriptes angezeigt.

Wieso funktioniert das bei Dir nicht?
Vielleicht liegt das Problem auch im Header??
Könnte sich den jemand mal anschauen...
Wat fürn Header? Meinst Du jetzt den HTTP Header oder den HEAD Bereich in Deinem HTML Document?

liefere:
a. das Script.
b. einen Link auf die Onlineversion
c. einen Link auf Dein phpinfo. Bin zu faul, aufzulisten, welche Deiner Configvariablen ich kennen müßte, um zu helfen.

{]Muad[}
02.09.2006, 20:54:04
Ich meine es anders. Deine Seite funktioniert sehr gut!

Bei mir hat es nicht funktioniert. Aber ich weiß auch jetzt warum, ich habe die Funktion utf8_decode() vergessen.

Ich wollte gerne Wissen wie man eine HTML-Seite in UTF-8 schreibt und mit Header meinte ich den <head>-Bereich. Sorry, habe mich wohl sehr undeutlich ausgedrückt

Das Beispiel, das ich gegeben hab ist mein <head>-Bereich

Muad

feuervogel
02.09.2006, 20:59:47
diese zeile:

<meta http-equiv="content-type" content="text/html; charset=ISO-8859-1" />

wird zu

<meta http-equiv="content-type" content="text/html; charset=UTF-8" />

jetzt müssen die html-dateien bloß noch in utf-8 gespeichert werden.

meikel (†)
02.09.2006, 22:12:23
Muad[}']Ich wollte gerne Wissen wie man eine HTML-Seite in UTF-8 schreibt und mit Header meinte ich den <head>-Bereich. Sorry, habe mich wohl sehr undeutlich ausgedrückt
Jo.

Allgemeiner Rundumschlag (betrifft nicht Dich persönlich)
Seitdem ich '98 mit PHP und der janzen Webprogrammierung angefangen hatte, wurden schon einige Säue durchs Dorf getrieben:

a. Bilder in die Datebank stopfen und nich mehr rauskriegen...
b. "XML & Co. ist die Zukunft"
c. "CSS auf Biegen und Brechen - warum einfach, wenns auch umständlich geht!"
d. und jetzt auch noch UTF-8, eigentlich deshalb definiert, um chinesische, japanische oder sonstwelche Kringel tippern zu können.

Adelt es die hiesigen Umlaute etwa, wenn sie nicht als schnödes Entity sondern UTF-8 kodiert ausgeliefert werden?

feuervogel
02.09.2006, 22:16:11
nö, aber wenn ich in der datenbank texte speichern will, die nicht den hiesigen zeichen entsprechen, dann bietet es sich an, alle texte als utf8 zu speichern - also kann ich doch auch gleich die ausgabe in utf8 gestalten, oder wäre es hier sinnvoller in ein jeweiliges iso-encoding zu übersetzen und/oder html-entitäten zu nutzen?

meikel (†)
03.09.2006, 00:53:12
nö, aber wenn ich in der datenbank texte speichern will, die nicht den hiesigen zeichen entsprechen, ...
Mann, feuervogel, Du kannst Probleme haben. Mein täglich SPAM beschränkt sich auf 7Bit-ASCII. Du aber kannst japanisch lesen und speichern. <ggg>

, oder wäre es hier sinnvoller in ein jeweiliges iso-encoding zu übersetzen und/oder html-entitäten zu nutzen?
Das ist letzten Endes Wurscht. Viel lästiger ist die Tatsache, daß man dann bei allen SQL Abfragen und Stringoperationen immer daran denken muß, daß man mit UTF-8 hantiert und nicht mit "Westeuropa ISO".

feuervogel
03.09.2006, 01:38:52
nein, ich kann kein japanisch lesen, aber ich arbeite für die automatische sprachverarbeitung und dort gibt es linguistik-teams die können chinesisch, arabisch, finnisch, griechisch, japanisch, kroatisch, russisch, türkisch und noch so einiges mehr. die wollen mit ner datenbank arbeiten und was bietet sich da sinnvolles an außer unicode?

stimmt, utf8 ist mit vorsicht zu genießen, aber bisher hatte ich noch keine ernsthaften probleme.