Home > Handbuch > Entwicklerhilfe > Makro-Referenz OmAPI > AutoCapt: Automatische Dokumentenerkennung AutoCapt: Automatische Dokumentenerkennung |
Makrofunktionen für die automatisierte Belegerkennung.
Die Auto Capture-Funktionen ermöglichen eine automatisierte oder vollautomatische Archivierung von Dokumenten. Die gewünschten Attribute, wie zum Beispiel Belegnummer, Datum, Kontakt oder Kategorie, werden dabei aus dem Dokumenteninhalt ermittelt. Bei gescannten Papiervorlagen muss zuvor eine OCR-Texterkennung ausgeführt werden.
•Feste Position (Bereich-OCR)
Bei der Erkennung von Ausgangsrechnungen und anderen Dokumenten Ihrer Warenwirtschaft stehen die Attribute immer an der gleichen Position des Dokuments. Hier werden die Funktionen AcroExchGetTextFromRect, PDFGetTextFromRect und ImgGetTextFromRect verwendet. Sie geben beispielsweise an, dass die Rechnungsnummer 2cm von links und 7cm vom oberen Papierrand entfernt zu finden ist.
•Masken-Erkennung
Die Dokumentennummer steht an einer beliebiger Position, sie hat aber immer die gleiche Syntax. Beispielsweise 2 Zeichen, einen Punkt und 4 Zahlen: "AA.0000".
Siehe AutoCaptFindMask, FtiFindMask, AutoCaptFindDate und AutoCaptSelectionListFindItem
•Schlüsselwort-Suche
Das gesuchte Attribut folgt auf ein fest vorgegebenes Schlüsselwort. Beispielsweise steht vor der Belegnummer immer der Text "Rechnung-Nr:".
Siehe AutoCaptKeywordValue und FtiGetKeywordValue
•Wort-Suche
Insbesondere für die Erkennung der Kategorie, wie z. B. Rechnung, Angebot oder Lieferschein. Der Funktion wird eine Liste möglicher Wörter übergeben. Sie gibt das Wort zurück, welches zuerst im Dokument vorkommt.
Siehe AutoCaptFirstCrspWord und FtiGetFirstCrspWord
•Strukturierte Daten
Auswertung einer E-Rechnung gemäß dem XRechnung- und ZUGFeRD-Standard sowie Einlesen von E-Mail-Attributen.
Siehe AutoCaptEInvoice, MailGetProperty und InifileReadStr
•Künstliche Intelligenz (KI)
Lokal installierte GPT und die Cloud-Funktionen von Microsoft Azure erkennen beispielsweise die Daten auf menschenlesbaren Rechnungen.
Siehe AutoCaptGPT und AutoCaptAzureAI
•Weitere Möglichkeiten
Die Attribute werden häufig auch aus dem Speicherpfad ermittelt. Zum Beispiel: das Projekt setzt sich aus dem zweiten bis vierten Teil des Verzeichnisses zusammen und der Kundenname entspricht dem fünften Unterverzeichnis. Oder der Dateiname beinhaltet mehrere Attribute, die mit einem vorgegebenen Zeichen getrennt sind.
Erweiterte Dateieigenschaften, wie Titel und Thema von Office-Dokumenten oder die Metadaten von Digitalfotos.
Die Funktionen werden häufig in Scan- und Importprofilen verwendet. Wechseln Sie dort auf die Seite Feldwerte, wählen Sie die erforderlichen Algorithmen bei Dokumentenerkennung aus und hinterlegen Sie hinter den Feldnamen die gewünschten Variablen oder Funktionen.
Nutzen Sie diese bevorzugt, wenn mehrere Funktionen für dasselbe Dokument verwendet werden.
•AutoCaptCreate initialisiert die o. g. Dokumentenerkennung in einem Makro
•AutoCaptCreateTxt initialisiert die Dokumentenerkennung mit einem Text statt einer Datei
•AutoCaptDestroy beendet Auto-Capture eines Dokuments
•AutoCaptDefault ruft die Standard-Dokumentenerkennung auf
•AutoCaptDocumentText enthält den gesamten Dokumententext
•AutoCaptFtiText beinhaltet alle indexierten Wörter des Dokuments
•AutoCaptFindMask Masken-Erkennung
•AutoCaptFirstCrspWord sucht passendes Wort aus einer Liste
•AutoCaptKeywordValue Schlüsselwort-Suche
•AutoCaptFtiWord gibt ein bestimmtes Wort zurück
•AutoCaptSelectionListFindItem sucht passende Einträge in Auswahllisten, automatische Projektzuordnung
•AutoCaptEInvoice gibt Daten einer elektronischen Rechnung gemäß dem ZUGFeRD-Standard zurück
Die Funktionen werden nicht mit AutoCaptCreate eingeleitet. Jeder Aufruf wertet das Dokument erneut aus.
•AcroExchGetTextFromRect Text von fester Position im PDF-Dokument lesen
•CSVGetCell CSV-Daten auswerten, beispielsweise für Scanner-Indexdatei
•FtiFindMask Masken-Erkennung
•FtiGetFirstCrspWord sucht passendes Wort aus einer Liste
•FtiGetKeywordValue Schlüsselwort-Suche
•ImgGetTextFromRect Text von fester Position in Grafik-Datei lesen
•ImgReadBarcode Barcode-Erkennung
•MailGetProperty E-Mail-Eigenschaften
•FileAttr einfache Dateiattribute
•Formatparameter DirPart und Separate
•ImgExtractMetaWords Meta-Daten von Grafiken
•SelectionListFindItem sucht passende Einträge in Auswahllisten, automatische Projektzuordnung.
•OleDocumentSummaryInformation erweiterte Dateiattribute
•ExecuteOCR OCR-Texterkennung ausführen
•ExtractAttachment Dateianlagen extrahieren
•ExtractDocumentText Dokumentinhalt
•GetFirstNotEmpty ermöglicht die Verwendung von alternativen Erkennungsfunktionen