Nabend allerseids,
ich hab per google gesucht nach dem thema un einiges gefunden...
doch irgendwie krieg ichs net hin... das fängt schon damit an...
ich will ne website laden und in dem quellecode alle <a> </a> auslesen also alle links... und das erste problem is ladet man die seite in einen array oder in einen string... wenn man sie in einen array läd bekommt jede zeile einen platz in dem array... was is aber wenn <a> in einer zeile beginnt aber erst in der nächsten sich wieder schliesst? daher denk ich eher string... bin mir allerdings net sicher, dann is das hauptproblem das auslesen aller links... ich kriegs nur gebacken immer einen link auszulesen...
ich bin jetzt soweit das ich schon weiß das ich mit preg_match die urls dann ausschneiden kann...
kurz nochmal überflogen:
ich will ein script schreiben das eine url läd
Code:
// URL, die durchsucht werden soll
$url = $_GET["url"];
// URL öffnen
$seite = @fopen ($url,"r");
if (!$seite) {
echo "URL konnte nicht geöffnet werden.n";
exit;
}
...
jetzt ist die frage... wie les ich alle <a href.. bis zu </a> so das sie auch zeilenübergreifend sein können... falls die seite mal das haben sollte... danach will ich die links bearbeiten... welche gehen zu .html .php usw... und welche gehen zu .exe. .zip oder was auch immer... so das nur richtige links zu anderen seiten am ende gelistet werden...
wäre nett wenn ihr mir sagen könntet wie man das realisiert...
mfg Seb