myGully.com Boerse.SH - BOERSE.AM - BOERSE.IO - BOERSE.IM Boerse.BZ .TO Nachfolger
Zurück   myGully.com > Computer & Technik > Programmierung
Seite neu laden

Dateien automatisiert auslesen und einen Index erstellen..

Willkommen

myGully

Links

Forum

 
 
 
Themen-Optionen Ansicht
Prev Vorheriger Beitrag   Nächster Beitrag Next
Ungelesen 06.03.19, 16:01   #1
Thorasan
Suppen Moderator
 
Registriert seit: Jan 2010
Beiträge: 6.300
Bedankt: 7.017
Thorasan leckt gerne myGully Deckel in der Kanalisation! | 777444181 Respekt PunkteThorasan leckt gerne myGully Deckel in der Kanalisation! | 777444181 Respekt PunkteThorasan leckt gerne myGully Deckel in der Kanalisation! | 777444181 Respekt PunkteThorasan leckt gerne myGully Deckel in der Kanalisation! | 777444181 Respekt PunkteThorasan leckt gerne myGully Deckel in der Kanalisation! | 777444181 Respekt PunkteThorasan leckt gerne myGully Deckel in der Kanalisation! | 777444181 Respekt PunkteThorasan leckt gerne myGully Deckel in der Kanalisation! | 777444181 Respekt PunkteThorasan leckt gerne myGully Deckel in der Kanalisation! | 777444181 Respekt PunkteThorasan leckt gerne myGully Deckel in der Kanalisation! | 777444181 Respekt PunkteThorasan leckt gerne myGully Deckel in der Kanalisation! | 777444181 Respekt PunkteThorasan leckt gerne myGully Deckel in der Kanalisation! | 777444181 Respekt Punkte
Standard Dateien automatisiert auslesen und einen Index erstellen..

Hey,

geht darum, dass mehrere tausend Dateien vorhanden sind - pdf mit OCR.
Nun soll eine (Webbasierte) Maske erstellt werden, die diese Dateien durchsuchbar macht (ähnlich wie google books die pdf Dateien nach Wörtern durchsucht). Wenn ich dann bestimmte Wörter in die Suche eintrage, sollen die Dokumente, die in Frage kommen, ausgegeben werden.

Hat da jemand eine Idee oder einen Tip, wie und womit sowas am besten umsetzbar wäre?

Meine Idee wäre eben eine Indexierung, wobei man bei tausenden Dokumenten und Büchern unmöglich von Hand einen entsprechenden Index erstellen kann. Das würde den Traffic auch senken, weil nicht immer der gesamte Inhalt gescannt werden müsste, sondern nur der entsprechende Index...
__________________
Urlaubsmodus
Thorasan ist offline   Mit Zitat antworten
 


Forumregeln
Du kannst keine neue Themen eröffnen
Du kannst keine Antworten verfassen
Du kannst keine Anhänge posten
Du kannst nicht deine Beiträge editieren

BB code is An
Smileys sind An.
[IMG] Code ist An.
HTML-Code ist Aus.

Gehe zu


Alle Zeitangaben in WEZ +1. Es ist jetzt 11:06 Uhr.


Sitemap

().