AutoCapt: Automatische Dokumentenerkennung

<< Hilfenavigation einblenden

Home > Handbuch > Entwicklerhilfe > Makro-Referenz OmAPI > AutoCapt: Automatische Dokumentenerkennung

AutoCapt: Automatische Dokumentenerkennung

Makrofunktionen für die automatisierte Belegerkennung.

Attribut- und Belegerkennung

Die Auto Capture-Funktionen ermöglichen eine automatisierte oder vollautomatische Archivierung von Dokumenten. Die gewünschten Attribute, wie zum Beispiel Belegnummer, Datum, Kontakt oder Kategorie, werden dabei aus dem Dokumenteninhalt ermittelt. Bei gescannten Papiervorlagen muss zuvor eine OCR-Texterkennung ausgeführt werden.

Möglichkeiten

Feste Position (Bereich-OCR)
Bei der Erkennung von Ausgangsrechnungen und anderen Dokumenten Ihrer Warenwirtschaft stehen die Attribute immer an der gleichen Position des Dokuments. Hier werden die Funktionen AcroExchGetTextFromRect, PDFGetTextFromRect und ImgGetTextFromRect verwendet. Sie geben beispielsweise an, dass die Rechnungsnummer 2cm von links und 7cm vom oberen Papierrand entfernt zu finden ist.

Masken-Erkennung
Die Dokumentennummer steht an einer beliebiger Position, sie hat aber immer die gleiche Syntax. Beispielsweise 2 Zeichen, einen Punkt und 4 Zahlen: "AA.0000".
Siehe AutoCaptFindMask, FtiFindMask, AutoCaptFindDate und AutoCaptSelectionListFindItem

Schlüsselwort-Suche
Das gesuchte Attribut folgt auf ein fest vorgegebenes Schlüsselwort. Beispielsweise steht vor der Belegnummer immer der Text "Rechnung-Nr:".
Siehe AutoCaptKeywordValue und FtiGetKeywordValue

Wort-Suche
Insbesondere für die Erkennung der Kategorie, wie z. B. Rechnung, Angebot oder Lieferschein. Der Funktion wird eine Liste möglicher Wörter übergeben. Sie gibt das Wort zurück, welches zuerst im Dokument vorkommt.
Siehe AutoCaptFirstCrspWord und FtiGetFirstCrspWord

Strukturierte Daten
Auswertung einer E-Rechnung gemäß dem XRechnung- und ZUGFeRD-Standard sowie Einlesen von E-Mail-Attributen.
Siehe AutoCaptEInvoice, MailGetProperty und InifileReadStr

Künstliche Intelligenz (KI)
Lokal installierte GPT und die Cloud-Funktionen von Microsoft Azure erkennen beispielsweise die Daten auf menschenlesbaren Rechnungen.
Siehe AutoCaptGPT und AutoCaptAzureAI

Weitere Möglichkeiten
Die Attribute werden häufig auch aus dem Speicherpfad ermittelt. Zum Beispiel: das Projekt setzt sich aus dem zweiten bis vierten Teil des Verzeichnisses zusammen und der Kundenname entspricht dem fünften Unterverzeichnis. Oder der Dateiname beinhaltet mehrere Attribute, die mit einem vorgegebenen Zeichen getrennt sind.
Erweiterte Dateieigenschaften, wie Titel und Thema von Office-Dokumenten oder die Metadaten von Digitalfotos.

Verwendung

Die Funktionen werden häufig in Scan- und Importprofilen verwendet. Wechseln Sie dort auf die Seite Feldwerte, wählen Sie die erforderlichen Algorithmen bei Dokumentenerkennung aus und hinterlegen Sie hinter den Feldnamen die gewünschten Variablen oder Funktionen.

Initialisierung und Freigabe der automatischen Belegerfassung

Makrofunktionen

Auto Capture

Nutzen Sie diese bevorzugt, wenn mehrere Funktionen für dasselbe Dokument verwendet werden.

AutoCaptCreate initialisiert die o. g. Dokumentenerkennung in einem Makro

AutoCaptCreateTxt initialisiert die Dokumentenerkennung mit einem Text statt einer Datei

AutoCaptDestroy beendet Auto-Capture eines Dokuments

AutoCaptDefault ruft die Standard-Dokumentenerkennung auf

AutoCaptDocumentText enthält den gesamten Dokumententext

AutoCaptFtiText beinhaltet alle indexierten Wörter des Dokuments

AutoCaptFindMask Masken-Erkennung

AutoCaptFirstCrspWord sucht passendes Wort aus einer Liste

AutoCaptKeywordValue Schlüsselwort-Suche

AutoCaptFtiWord gibt ein bestimmtes Wort zurück

AutoCaptSelectionListFindItem sucht passende Einträge in Auswahllisten, automatische Projektzuordnung

AutoCaptEInvoice gibt Daten einer elektronischen Rechnung gemäß dem ZUGFeRD-Standard zurück

Alleinstehende Erkennungsfunktionen

Die Funktionen werden nicht mit AutoCaptCreate eingeleitet. Jeder Aufruf wertet das Dokument erneut aus.

AcroExchGetTextFromRect Text von fester Position im PDF-Dokument lesen

CSVGetCell CSV-Daten auswerten, beispielsweise für Scanner-Indexdatei

FtiFindMask Masken-Erkennung

FtiGetFirstCrspWord sucht passendes Wort aus einer Liste

FtiGetKeywordValue Schlüsselwort-Suche

ImgGetTextFromRect Text von fester Position in Grafik-Datei lesen

ImgReadBarcode Barcode-Erkennung

MailGetProperty E-Mail-Eigenschaften

Pfad und Dateiattribute

FileAttr einfache Dateiattribute

Formatparameter DirPart und Separate

ImgExtractMetaWords Meta-Daten von Grafiken

SelectionListFindItem sucht passende Einträge in Auswahllisten, automatische Projektzuordnung.

OleDocumentSummaryInformation erweiterte Dateiattribute

OleSummaryInformation

OleUserDefinedProperties

Hilfsfunktionen

ExecuteOCR OCR-Texterkennung ausführen

ExtractAttachment Dateianlagen extrahieren

ExtractDocumentText Dokumentinhalt

GetFirstNotEmpty ermöglicht die Verwendung von alternativen Erkennungsfunktionen