Home > Handbuch > Entwicklerhilfe > Makro-Referenz OmAPI > ImgGetTextFromRect ImgGetTextFromRect |
Bereich-OCR: Extrahiert Text aus einer Bilddatei, der sich an der angegebenen Position befindet.
Syntax
{ImgGetTextFromRect:FileName,PageNum,Left,Right,Top,Bottom,Relative[,TestFileName]}
FileName: Dateiname der Grafik- oder PDF-Datei (z. B. {Source}) oder Sonderfall StackScanImg.
PageNum: Seitennummer bei PDF-Dokumenten und mehrseitigen TIFF-Dateien.
Left, Right, Top, Bottom: Definiert ein Rechteck auf der Seite, in dem sich der zu extrahierende Text befindet. Left und Right geben den Abstand vom linken Seitenrand, Top und Bottom den Abstand vom oberen Rand an. Es sind nur ganze Zahlen erlaubt. Tipp: der Wert von Top ist immer kleiner als Bottom, Left ist kleiner als Right.
Relative: 0, 1 oder 2. Bei 0 wird das Rechteck in absoluten Pixel angegeben.
Bei 1 enthalten Left, Right, Top und Bottom prozentuale Werte, wobei Left=10 beispielsweise 10% der Seitenbreite angibt.
2 ist ebenfalls relativ, jedoch mit einer berechneten Auflösung von 10.000 statt 100 (Left=1000 gibt 10% der Seitenbreite).
Beachten Sie bitte, dass die Pixel mit der Scanner-Auflösung variieren, verwenden Sie bevorzugt die relative Werte.
TestFileName: Wenn dieser optionale Parameter angegeben ist, wird der Grafikausschnitt in der angegebenen Bilddatei gespeichert. Sie können überprüfen, ob der korrekte Ausschnitt definiert wurde. Der Parameter sollte nach erfolgreichen Tests wieder entfernt werden. Geben Sie den Dateinamen bitte ohne Endung an, z. B. "C:\Temp\Test". Wenn die Datei bereits vorhanden ist, wird automatisch eine Zahl angehängt.
Von der OCR erkannter Text.
Beschreibung
Die Funktion gibt den Text zurück, der sich im vorgegebenen Rechteck auf dem Bilddokument befindet. Es werden diverse Grafikformate (bmp, jpeg, tiff und viele andere) unterstützt. Das Bild kann auch in einem PDF-Dokument eingebettet sein. Der Text wird mit Hilfe der OCR-Software erkannt.
Die Funktion wird beispielsweise beim Scannen von Formularen verwendet, um die Dokumentattribute, wie Kategorie oder Kundenname, automatisch vom Papier zu lesen.
Tipp: Wenn Sie Dokumente im PDF-Format scannen und anschließend eine OCR-Software ausführen, können Sie alternativ die Funktion AcroExchGetTextFromRect verwenden.
Hinweis: Bei PDF-Dokumenten wird immer die erste Grafik auf der Seite verwendet.
Systemvoraussetzungen:
Office Manager Enterprise-Version
OCR-Software OmniPage, Transsym, Tesseract oder WindowsRT. Falls eine andere OCR-Software eingestellt ist, wird Tesseract verwendet.
Siehe auch