PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : USER_AGENT "Java/1.6.0_17"


Xor
10.12.2009, 09:45:58
[mod: Fortsetzung von: Lösungen zu immer wiederkehrenden Problemen (http://www.selfphp.de/forum/showthread.php?p=132957)]

cx

Folgende Frage, die (möglicherweise) was mit Bots zu tun hat:
Habe mir gestern von allen Zugriffs-logs einer meiner Seiten die $_SERVER["HTTP_USER_AGENT"] ausgeben lassen. Erschreckend wieviele noch mit IE6 unterwegs sind.
Aber mein Punkt:
Um 00:17 wurde auf die Seite zugegriffen und der einzige Wert in der Variable war "Java/1.6.0_17".
Kann jemand was damit anfangen? Browser oder javageschriebener Auto-Zugriff?

Xor
10.12.2009, 12:47:25
Habe mir die IP angesehn:
Hier (http://www.projecthoneypot.org/ip_203.162.3.165)

Da bei der IP schon einmal der User-Agent "Googlebot/2.1 (+http://www.google.com/bot.html)" geloggt wurde, sie aber sicher nicht im Range von Google inbegriffen ist, kann man doch davon ausgehen, dass es sich um einen Bot handelt, oder?

Habt Ihr Erfahrung in IP Blocken von Spamlisten bzw. eine Methode, solche Bots zu erkennen?

PS: Danke fürs verschieben.

feuervogel
10.12.2009, 14:35:39
1. wozu willst du bots blocken?
2. kann man den user_agent verändern (habe mir selbst mal einen crawler geschrieben), daher ist das einzig sinnvolle: gar nichts.

urvater
10.12.2009, 18:38:26
Habt Ihr Erfahrung in IP Blocken von Spamlisten bzw. eine Methode, solche Bots zu erkennen?Die IP blocken geht recht gut, wenn man den eine zuverlässige Liste hat.

Bots erkennen wird dann schon etwas schwieriger. Kommt ja auf an gegen welche Art von Bots man vorgehen muß. Einfache Crawler nehemen ja keine Aktion vor. Sie fordern die Seite an, durchsuchen sie nach den ihnen vorgegebenen Methoden und sind wieder weg.
Bots, die Spameinträge vornehmen lassen sich hingegen mit anfänglichen Aufwand später relativ gut blocken. Hängt aber auch alles etwas vom Projekt ab.

Das Internet ist da doch recht voll mit zum Teil sehr guten Ansätzen. Allerdings lassen sich viele davon nur als Serveradmin umsetzen. DIE Lösung gibt es nicht.