Für die Volltextsuche wird der Text aus dem Dokument extrahiert und in den Index der Archivdatenbank geschrieben. Die Konvertierung von PDF-Dokumenten in Textdaten erfolgt seit Version 23.1 standardmäßig mit programminternen Funktionen.
In seltenen Fällen ist neben der Textinformation aber auch das Dokumentenlayout interessant. Beispielsweise muss bei der Dokumentenerkennung mit AutoCaptFindMask der gesuchte Wert neben dem Schlüsselwort stehen:
Rechnungsnr. 12345
Lieferdatum: 29.01.2025
Kundennr. 5678
Bei einem tabellarischen PDF-Layout wird der Text aber ev. folgendermaßen extrahiert:
Rechnungsnr.
Lieferdatum:
Kundennr.
12345
29.01.2025
5678
In so einem Fall kann auf eine alternative Funktion mit der Debenu-DLL zum Lesen des Textes umgestellt werden. Fügen Sie dazu folgenden Eintrag in die admin.ini ein:
[FullTextIndex]
UseDebenuPDF=1