kleine
*anregung* ohne irgendeinen anspruch ;)
Code:
<?php
// URL, die durchsucht werden soll
#$url = 'http://dict.leo.org/?lp=ende&lang=de&searchLoc=0&cmpType=relaxed&relink=on§Hdr=on&spellToler=std&search=parser';
$url = 'http://dict.leo.org';
$parsed_uri = parse_url($url);
// URL öffnen
if( function_exists('file_get_contents') )
{
$page = file_get_contents($url);
} else {
die('deine php-version stinkt! :D');
}
if( preg_match_all("/<as+?href="(.*)"/Uis", $page, $match))
{
unset($match[0]);
$links = array();
foreach($match[1] as $link)
{
$plink = parse_url($link);
if( empty($plink['scheme']) and empty($plink['host']))
{
// relative pfade umwandeln
$links[] = $parsed_uri['scheme'] .'://'. $parsed_uri['host'] .'/'. preg_replace('/^/+/U', '', $link);
} else {
if( !empty($plink['scheme']) and( $plink['scheme'] == 'javascript' ))
{
continue;
}
$links[] = $link;
}
}
echo "<pre>". implode("n", $links);
} else {
// keine brauchbaren links gefunden
}
?>
liefert dann sowas zur weiteren verarbeitung ab:
http://www.leo.org/
http://www.informatik.tu-muenchen.de/
http://dict.leo.org/
http://www.leo.org/
http://dict.leo.org/?lp=ende&search=
http://dict.leo.org/cgi-bin/dict/forum.cgi?lang=de&lp=ende
http://dict.leo.org/mydict/login.php?lang=de&lp=ende
http://dict.leo.org/?lp=frde&search=
http://dict.leo.org/cgi-bin/dico/forum.cgi?lang=de&lp=frde
http://dict.leo.org/mydict/login.php?lang=de&lp=frde
http://dict.leo.org/?lang=en&lp=ende&search=
http://dict.leo.org/?lp=ende&lang=de
http://dict.leo.org/?searchLoc=-1&searchLocRelinked=-1&lp=ende&search=&lp=ende
http://dict.leo.org/?searchLoc=0&searchLocRelinked=0&lp=ende&search=&lp=ende
http://dict.leo.org/?searchLoc=1&searchLocRelinked=1&lp=ende&search=&lp=ende
http://dict.leo.org/
http://dict.leo.org/pages.ende/tipps_de.html
http://ads.leo.org/bec58b2bd78735e39f6e0094ef3d712f+L+1__
http://dict.leo.org/pages.ende/tipps_de.html
http://dict.leo.org/pages.ende/tipps_de.html
http://dict.leo.org/pages.ende/tipps_de.html
http://dict.leo.org/pages.ende/tipps_de.html
http://dict.leo.org/pages.ende/tipps_de.html
http://www.dwds.de/
http://www.englishpage.com/
http://www.canoo.com/
http://www.canoo.com/wmtrans/
http://www.m-w.com/
http://www.atip.de/
http://tcts.fpms.ac.be/synthesis/mbrola.html
http://www.t-mobile.de/business/
http://www.leinhaeuser.de/
http://www.vhb.org/
http://www.last-minute-reisen-weltweit.de
http://www.zappmedia.de
http://www.zappmedia-gmbh.de
http://www.expedia.de/
http://www.schnaeppchenjagd.de/
http://www.opusforum.org/
http://www.tigerlily.ch
http://www.abnehmen.com/
http://www.osalo.net/
http://www.lastminute-ziele.de/
http://www.terracus.de
http://www.geizhals.at/eu/
http://www.idealo.de/
http://www.schoenheit-und-medizin.de
http://www.idealo-preissuche.de
http://dict.leo.org/#google
http://dict.leo.org/#new
http://dict.leo.org/#pda
http://dict.leo.org/#persp
http://dict.leo.org/#query
http://dict.leo.org/#entry
http://pda.leo.org/
http://www.pda-surftipps.de
http://www.t-mobile.de/business/
http://umfrage.perspektive-deutschland.de/621101
http://dict.leo.org/pages.ende/faq_de.html
http://dict.leo.org/pages.ende/abbrev_en.html
http://dict.leo.org/pages.ende/toolbars_de.html
http://dict.leo.org/pages.ende/sms_de.html
http://dict.leo.org/pages.ende/error_de.html
http://dict.leo.org/pages.ende/links_de.html
http://www.leo.org/dict/guestbook/guestbook_en.html
http://dict.leo.org/pages.ende/stat_de.html
http://dict.leo.org/pages.ende/koop_de.html
http://dict.leo.org/pages.ende/helpers_de.html
http://dict.leo.org/pages.ende/about_de.html
http://dict.leo.org/pages.ende/werbung_de.html
http://dict.leo.org/pages.ende/impressum_de.html
http://www.sun.de/
http://dict.leo.org/pages.ende/about_de.html?lang=de
http://www.leo.org/dict/about_de.html