PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : mod_rewrite Probleme


c4
15.06.2005, 06:39:28
Moin,

gestern fiel mir auf, dass irgendwas mit meiner rewrite-rule mächtig unrichtig läuft. Vorweg mal die .htaccess in Auszügen: RewriteEngine on

RewriteCond %{SERVER_NAME} (www\.)?dbcf\.de(.*) [NC]
RewriteCond %{HTTP_REFERER} !^$
RewriteCond %{HTTP_REFERER} !(.*)dbcf\.de(.*) [NC]
RewriteRule \.(gif|jpg|png)$ /is/htdocs/12345/www.dbcf.de/bilder/pfui.gif [L]

RewriteRule guestbook/guestbook.php gaestebuch_service/gaestebuch.php
RewriteRule guestbook/add.php gaestebuch_service/add.php

RewriteCond %{SERVER_NAME} (www\.)?dbcf\.de(.*) [NC]
RewriteCond %{REQUEST_URI} !(\.js|\.htm|\.jpg|\.gif|\.png|\.zip|\.rar|\.exe|\.txt|\.log|\.sql|\.p hp|lo/|db/|gaestebuch_service/)
RewriteRule (.*)/$ /is/htdocs/12345/www.dbcf.de/index.php?topic=$1&subdir=1 [L]

RewriteCond %{SERVER_NAME} localhost
RewriteCond %{REQUEST_URI} !(\.js|\.htm|\.jpg|\.gif|\.png|\.zip|\.rar|\.exe|\.txt|\.log|\.sql|\.p hp|lo/|db/|gaestebuch_service/)
RewriteRule (.*)/$ /dbcf/index.php?topic=$1&subdir=1 [L] Das Ziel ist es - und soweit klappt es ja auch -, dass man bei Eingabe von http://dbCF.de/blaettern/ auf der gleichen Seite landet, wie bei http://dbCF.de/index.php?topic=blaettern

Das Problem offenbarte mir Google. Ein Ausschnitt aus dem Accesslog (Accesslog wohlgemerkt, nicht Errorlog!): 66.249.65.144 - - [14/Jun/2005:13:09:20 +0200] "GET /index.php/bilder/forum/bilder/kontakt/abkuerzungen/ HTTP/1.1" 200 4771 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" "www.dbcf.de"
66.249.65.144 - - [14/Jun/2005:13:09:22 +0200] "GET /index.php/abkuerzungen/programmierung/bilder/dresden/ HTTP/1.1" 200 4771 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" "www.dbcf.de"
66.249.65.144 - - [14/Jun/2005:13:09:22 +0200] "GET /index.php/gasometer-bilder/dresden/forum/ HTTP/1.1" 200 4771 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" "www.dbcf.de"
66.249.65.144 - - [14/Jun/2005:13:09:23 +0200] "GET /index.php/sarrasani/start/abkuerzungen/abkuerzungen/ HTTP/1.1" 200 4771 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" "www.dbcf.de"
66.249.65.144 - - [14/Jun/2005:13:09:28 +0200] "GET /index.php/gasometer-bilder/programmierung/rest/ HTTP/1.1" 200 4771 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" "www.dbcf.de"
66.249.65.144 - - [14/Jun/2005:13:09:29 +0200] "GET /index.php/abkuerzungen/gaestebuch-service/abkuerzungen/dresden/ HTTP/1.1" 200 4771 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" "www.dbcf.de"
66.249.65.144 - - [14/Jun/2005:13:09:30 +0200] "GET /index.php/start/rest/kontakt/rest/forum/ HTTP/1.1" 200 4771 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" "www.dbcf.de"
66.249.65.144 - - [14/Jun/2005:13:09:31 +0200] "GET /index.php/kontakt/gaestebuch-service/besucherzaehler/start/ HTTP/1.1" 200 4771 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" "www.dbcf.de" Die angezeigte Dateigröße (4771 Bytes) lassen auf die Startseite (http://dbCF.de/start/) schließen.
Ich weiß allerdings überhaupt und absolut nicht, warum sich bei Google (bei anderen garantiert auch) die Verzeichnisse hinten anhängen. Ich kann es leider absolut nicht nachvollziehen.

Hat irgendwer irgendwelche Ideen?

Ach ja: Apache/1.3.31 (Unix) FrontPage/5.0.2.2635 PHP/4.3.10

Danke
Carsten



Edit: nach 'Beratung' mit einem Kollegen, wurden 2 Abschnitte abgeändert: RewriteCond %{SERVER_NAME} (www\.)?dbcf\.de(.*) [NC]
RewriteCond %{REQUEST_URI} !(\.php|lo/|db/|gaestebuch_service/)
RewriteRule ^(.*)/$ index.php?topic=$1&subdir=1 [L]

RewriteCond %{SERVER_NAME} localhost
RewriteCond %{REQUEST_URI} !(\.php|lo/|db/|gaestebuch_service/)
RewriteRule ^(.*)/$ index.php?topic=$1&subdir=1 [L] Problem wurde (vermutlich) nicht gelöst, aber Zeichen gespart. Warte auf nächsten Besuch von Google...

c4
22.06.2005, 08:49:19
Ab sofort wird jeder Besuch von Google gephpinfo()t und gespeichert:
--> http://dbCF.de/google/index.php

Wäre grandios, wenn mal wer einen Ansatz einer möglicherweise potentiellen Idee hätte...

c4
23.06.2005, 06:29:28
Gut, die Idee mit phpinfo() hat mir ein riesiges Problem offenbart: Google hat die falschen URLs gespeichert (gibt ja auch keinen 404er) und besucht diese natürlich immer mal wieder. Somit ist für mich nicht ersichtlich, ob es sich um von Google gespeicherte oder Folgefehler durch die Skripte auf meiner Seite handelt.

Nochmal verständlicher. Google hat mich besucht:
2005-06-22 15:01:58
2005-06-22 10:35:57
Dazwischen nicht.
In der phpinfo() von 15 Uhr steht beim REQUEST_URI "/t-abkuerzungen/forum/" Dieser Link kommt also von Google.
Somit kann ich nicht nachvollziehen, welchen Weg Google geht, um diese falschen Links zu bekommen.


Hat ausnahmsweise mal wer Ideen?




PS: Da fällt mir ein... vielleicht besteht das Problem ja gar nicht mehr, sondern nur noch im Cache von Google...
Auf alle Fälle ist das alles Mist! So.