OCR erkennt Text in Adobe Acrobat Professional nicht

Die optische Zeichenerkennung bietet eine nahezu automatisierte Möglichkeit, Text von gescannten Seiten zu digitalisieren, sodass keine erneute Eingabe erforderlich ist. Adobe Acrobat Professional umfasst OCR-Funktionen, mit denen Sie die gescannten Ergebnisse direkt im Rich Text-Format oder den DOC- und DOCX-Dateitypen von Microsoft Word speichern können. Wenn Sie ein Dokument in Acrobat Professional öffnen, das Programm jedoch keinen Text erkennt, der auf der Seite deutlich sichtbar ist, überprüfen Sie die Quelldatei auf einige häufig auftretende Probleme, die OCR-Probleme verursachen können.

Live-Text

Die offensichtlichste Ursache für OCR-Fehler in Acrobat Professional ist möglicherweise der, wenn Sie versuchen, eine Seite zu digitalisieren, die bereits Live-Text enthält. Wenn Sie OCR unbedingt auf Text ausführen müssen, den Sie in die Zwischenablage kopieren und in ein Textverarbeitungsprogramm einfügen oder direkt aus Acrobat in ein Textverarbeitungsformat exportieren können, müssen Sie den Live-Text Ihrer Datei zuerst in Pixel konvertieren. Andernfalls wird eine Fehlermeldung angezeigt, die einen Erkennungsfehler meldet.

Quelle schief oder verschwommen

Scans mit niedriger Auflösung von weniger als 150 Pixel pro Zoll bieten schlechtes Ausgangsmaterial für die OCR-Funktionen von Acrobat Professional und für andere OCR-Programme. Wenn Ihre Scans schief laufen, verringert sich die Wahrscheinlichkeit, gute Ergebnisse zu erzielen. Das Beheben von Problemen mit niedriger Auflösung erfordert in der Regel ein erneutes Scannen der Quelle mit einem höheren ppi-Wert, vorzugsweise 300 ppi. Wenn Sie gedruckte Seiten mit einem Grafikscanner scannen, dem kein Vorlageneinzug zur Verfügung steht, nehmen Sie sich einen Moment Zeit, um das Papier ordnungsgemäß auf dem Vorlagenglas zu positionieren, oder öffnen Sie die Scans in einem Programm, das Sie beim Begradigen unterstützen kann, beispielsweise in Adobe Photoshop.

Niedrige Qualität Original

Obwohl hochauflösende Scans die OCR-Ergebnisse verbessern, indem Sie Acrobat Professional mit besserem Quellmaterial versorgen, gilt das alte Sprichwort "Müll rein, Müll raus", wenn Ihr Original eine schlechte Qualität aufweist. Scans von Faxmaterial und Ausdrucken von einem Mikrofilm- oder Mikrofichedrucker können zu schlechteren OCR-Ergebnissen führen. Wenn Quellen wie diese Ihre einzige Eingabemöglichkeit sind, sollten Sie die erforderliche Zeit investieren, um die OCR-Ausgabe zu korrigieren, oder den Text erneut eingeben, wenn er zu kurz ist.

Formulare und Grafiken

OCR-Software funktioniert am besten, wenn Sie sie mit klaren, ununterbrochenen Textläufen in ganzseitigen Spalten präsentieren. Wenn Ihr Quellmaterial geschachtelten Text enthält, z. B. das Format in einem Formular oder große Mengen an Grafikmaterial, kann die OCR-Qualität beeinträchtigt werden, da die Software Schwierigkeiten hat, Text von nicht-textlichem Material zu unterscheiden. In extremen Fällen möchten Sie möglicherweise ein Formular fotokopieren und einige Felder und Zeilen ausblenden, bevor Sie versuchen, den Inhalt zu scannen und zu erkennen.