CronJob-Service
bei SELFPHP mit ...
|
+ minütlichen Aufrufen
+ eigenem Crontab Eintrag
+ unbegrenzten CronJobs
+ Statistiken
+ Beispielaufrufen
+ Control-Bereich
Führen Sie mit den CronJobs von
SELFPHP zeitgesteuert Programme
auf Ihrem Server
aus. Weitere Infos
|
:: Anbieterverzeichnis ::
Globale Branchen
Informieren Sie sich über ausgewählte Unternehmen im Anbieterverzeichnis von SELFPHP
:: Newsletter ::
Abonnieren Sie hier den kostenlosen
SELFPHP Newsletter!
|
PHP für Fortgeschrittene und Experten Fortgeschrittene und Experten können hier über ihre Probleme und Bedenken talken |
04.03.2008, 09:49:37
|
Anfänger
|
|
Registriert seit: Mar 2008
Beiträge: 2
|
|
PDF / TXT Inhalt in MySQL einlesen
Hallo Leute,
ich bin neu hier und hoffe Ihr könnt mir bei folgendem Problem weiterhelfen:
Ich habe ca. 500 PDF Dokumente die alle das gleiche Format (Layout) haben. Das sieht ungefähr so aus:
Vorname: Max
Nachname: Mustermann
Strasse: Schlossallee usw...
Die Inhalte dieser PDF´s muss ich jetzt in eine MySQL DB eingeben.
Meine Frage ist, ob ich mit PHP jetzt die Daten aus den PDF auslesen und in die DB speichern kann?
Ich habe schon ausgiebig gegoogelt aber leider immer nur Teillösungen gefunden. Da ich im coden nicht sehr versiert bin, kann ich mir nix zusammenbasteln.
Es würde mir reichen, wenn ich die PDF´s einzeln "einlese".
Zur Not wäre es auch möglich die Dateien einzeln mittels OCR vorher in .txt umzuwandeln und dann zu durchsuchen.
Ich freue mich auf eure Antworten.
Vielen Dank
Hias
|
04.03.2008, 19:01:44
|
|
Member
|
|
Registriert seit: Jul 2006
Ort: Göttingen/Deutschland
Alter: 35
Beiträge: 586
|
|
AW: PDF / TXT Inhalt in MySQL einlesen
Man kann soetwas mit PHP machen, jedoch braucht man dazu die PDFlib, die nicht standardgemäß auf dem Server installiert ist.l
MfG, Andy
|
04.03.2008, 19:59:27
|
Anfänger
|
|
Registriert seit: Mar 2008
Beiträge: 2
|
|
AW: PDF / TXT Inhalt in MySQL einlesen
Hi Andy,
das PDFLib nicht auf jedem Server verfügbar ist, ist kein Problem, da der Server mein eigener ist.
Ich habe aber sehen müssen, das PDFLib nicht umsonst ist und deswegen leider ausfällt.
Ich kann die PDF´s wie gesagt auch in txt files umwandeln. Kennst du da eine Lösung, dei kostenlos ist?
Grüße
Hias
|
05.03.2008, 18:26:49
|
Anfänger
|
|
Registriert seit: Jan 2007
Alter: 58
Beiträge: 131
|
|
AW: PDF / TXT Inhalt in MySQL einlesen
Wenn man den Aufbau einer PDF-Datei kennt, brauch man keine PDFlib dazu - nur Regex.
Bei Adobe gibt es die Referenzen zum PDF-Format.
|
05.03.2008, 19:24:32
|
Junior Member
|
|
Registriert seit: Dec 2007
Beiträge: 151
|
|
AW: PDF / TXT Inhalt in MySQL einlesen
stichwort pdf2txt
|
05.03.2008, 19:44:39
|
|
Member
|
|
Registriert seit: Jul 2006
Ort: Göttingen/Deutschland
Alter: 35
Beiträge: 586
|
|
AW: PDF / TXT Inhalt in MySQL einlesen
Ich bezweifel, dass er ein Programm meinte, was er selbst bedienen muss. ich gehe nun einfach mal stark davon aus, dass er eine PHP-Lösung sucht.
MfG, Anfy
|
05.03.2008, 21:36:55
|
Anfänger
|
|
Registriert seit: Jan 2007
Alter: 58
Beiträge: 131
|
|
AW: PDF / TXT Inhalt in MySQL einlesen
Bin mir jetzt nicht ganz sicher, aber glaube auf phpclasses.org gibt es dazu auch Klassen.
Ich hatte mal vor einiger Zeit damit angefangen, aber wegen Zeitmangel ruht das Projekt.
|
05.03.2008, 22:19:09
|
|
Member
|
|
Registriert seit: Jul 2006
Ort: Göttingen/Deutschland
Alter: 35
Beiträge: 586
|
|
AW: PDF / TXT Inhalt in MySQL einlesen
@CIX88: Kannst du mir mal den Link zu der Referenz geben? Oder hast du vielleicht sogar noch weitere Links zu Webseiten, auf denen ich etwas über das PDF-Format erfahre. Würde mich wirklich mal interessieren. habe mich leider noch nie damit beschäftigt.
MfG, Andy
|
07.03.2008, 17:59:45
|
Anfänger
|
|
Registriert seit: Jan 2007
Alter: 58
Beiträge: 131
|
|
AW: PDF / TXT Inhalt in MySQL einlesen
http://www.adobe.com/devnet/pdf/pdf_reference.html
Da du ja nur den Text haben willst, wird das ganze sicher nicht so kompliziert werden.
Musst nur gucken, wo und in welcher Form Texte angelegt werden.
Was noch zu beachten wäre, wenn das PDF komprimiert (FlatDecode -> gzcompress) ist, aber auch das steht alles in den Referenzen.
|
10.03.2008, 12:34:07
|
Junior Member
|
|
Registriert seit: Dec 2007
Beiträge: 151
|
|
AW: PDF / TXT Inhalt in MySQL einlesen
das Problem ist dass gewisse PDFs encodeirt sind bzw. dass der Text nicht als klartext enthalten ist. pdf2txt.exe extrahiert den Text schön sauber in ein .txt file, welches dann problemlos in PHP eingelesen werden kann.
|
Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
|
|
Forumregeln
|
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.
HTML-Code ist aus.
|
|
|
Alle Zeitangaben in WEZ +2. Es ist jetzt 19:41:26 Uhr.
|