Eichbjörnchen
28.09.2005, 10:37:42
Hallo alle zusammen,
erstmal möchte ich sagen, dass ich Anfänger in php bin :-)
So nun zu meiner Frage. Ich muss eine .txt Datei parsen. Diese sieht wie folgt aus:
"PT J
AU Nachname1, CJ
Nachname2, M
Nachname3, W
Nachname4, W
TI Hier steht der Titel der Publikation, der auch leider ein "ENTER"
drinnen hat und daher so weiter schreibt
SO Full source Title
DT Article
DE Schlüsselwörter des Autors, welche über
2 Zeilen gehen können
ID Noch mehr Schlüsselwörter
AB Und hier der Artikel, der über viele Zeilen(20+) geht, wie bei AU oder
TI. Der Text enthält auch );(,-
...
"
Es geht noch weiter, aber vom Aufbau ist es das Selbe.
Ich habe schon im Internet gesucht, in Foren gesucht, habe auch Ansätze gefunden, aber da ich Anfänger bin, komme ich nicht weiter.
wie z.B.: preg_match_all, was bedeuten da diese Zeichen, wie in preg_match_all("|<[^>]+>(.*)</[^>]+>|U", ???
oder explode.
Ich habe es auch schon mit fopen, file,... versucht. Öffnen kann ich die Datei, komplett ausgeben auch, aber halt net parsen, damit ich sie später in die Datenbank laden kann.
Ach ja, es sind mehrere Publikationen, wie das Beispiel in einer .txt. So an die 500+, dass ist auch der Grund, warum ich es net von Hand in die Datenbank schreiben will.
Ich möchte mich schon mal für jeden kleinen Hinweis bedanken. Aber denkt dran, bin noch Anfänger :-)
PS: Eigentlich sollte, wenn der Text über die Zeile hinweg in eine neue geht, direkt unter dem anderen Text stehen und nicht von vorne anfangen, will aber net so wirklich. Nur die Abkürzungen, wie AU stehen vorne.
erstmal möchte ich sagen, dass ich Anfänger in php bin :-)
So nun zu meiner Frage. Ich muss eine .txt Datei parsen. Diese sieht wie folgt aus:
"PT J
AU Nachname1, CJ
Nachname2, M
Nachname3, W
Nachname4, W
TI Hier steht der Titel der Publikation, der auch leider ein "ENTER"
drinnen hat und daher so weiter schreibt
SO Full source Title
DT Article
DE Schlüsselwörter des Autors, welche über
2 Zeilen gehen können
ID Noch mehr Schlüsselwörter
AB Und hier der Artikel, der über viele Zeilen(20+) geht, wie bei AU oder
TI. Der Text enthält auch );(,-
...
"
Es geht noch weiter, aber vom Aufbau ist es das Selbe.
Ich habe schon im Internet gesucht, in Foren gesucht, habe auch Ansätze gefunden, aber da ich Anfänger bin, komme ich nicht weiter.
wie z.B.: preg_match_all, was bedeuten da diese Zeichen, wie in preg_match_all("|<[^>]+>(.*)</[^>]+>|U", ???
oder explode.
Ich habe es auch schon mit fopen, file,... versucht. Öffnen kann ich die Datei, komplett ausgeben auch, aber halt net parsen, damit ich sie später in die Datenbank laden kann.
Ach ja, es sind mehrere Publikationen, wie das Beispiel in einer .txt. So an die 500+, dass ist auch der Grund, warum ich es net von Hand in die Datenbank schreiben will.
Ich möchte mich schon mal für jeden kleinen Hinweis bedanken. Aber denkt dran, bin noch Anfänger :-)
PS: Eigentlich sollte, wenn der Text über die Zeile hinweg in eine neue geht, direkt unter dem anderen Text stehen und nicht von vorne anfangen, will aber net so wirklich. Nur die Abkürzungen, wie AU stehen vorne.