Okey ich hab dann also selber mal etwas rumprobiert. Hier mein Code:
PHP-Code:
<?php
$doc = new DomDocument;
$doc->validateOnParse = true;
$doc->loadHTMLFile('http://www.studivz.net/');
echo $doc->getElementById('LeftsideBox')->nodeValue;
?>
Im Prinzip funktioniert der denke ich auch ganz gut. Ich bekomme allerdings diese Warnungen:
Code:
Warning: DOMDocument::loadHTMLFile() [function.DOMDocument-loadHTMLFile]: Unexpected end tag : div in http://www.studivz.net/, line: 185 in /xxx/kasten/auslesen.php on line 4
Warning: DOMDocument::loadHTMLFile() [function.DOMDocument-loadHTMLFile]: Unexpected end tag : div in http://www.studivz.net/, line: 185 in /xxx/kasten/auslesen.php on line 4
Das ist aber nicht mein Verschulden, sondern liegt am Code von studiVZ, oder?
Die Warnungen kann ich somit also getrost ignorieren, oder?
Ein Problem gibt es aber noch: Die Typen von studiVZ schreiben leider so Zeichen wie ä, ö und ü direkt in den Quelltext anstatt ä oder so zu benutzen. Das führt dann im Umkehrschluss dazu, dass PHP diese Zeichen tötet und ein ö wurde dann gerade hierzu: ö
Also wie kann ich die Kodierung da irgendwie ändern beim einlesen?
Danke, Jakob