Einsatz CIB Module unter Android technischer Leitfaden (DE)

3. SDK

3.4. Empfehlung zur Texterkennung

Die Ergebnisse der Texterkennung lassen sich mit geeigneter Vorverarbeitung der Bilddaten deutlich verbessern.


Aufnahme des Bildes

Das Dokument möglichst eben aufgenommen sein. Unebenheiten des Dokuments erschweren die Erkennung.


Reinigen des Bildes

Entweder mit einem Schwarz-Weiß-Filter wie:

CibIpl.localOtsuBinarizer(Bitmap src, float threshold)

oder mit dem folgenden Filter, der auch für Farbdokumente geeignet ist:

CibIpl.whiteboard(Bitmap src, boolean reflectionMode)


Ausrichten des Bildes

Die Ausrichtung des Dokuments und des darin enthaltenen Textes ist wichtig. Der Text sollte möglichst waagerecht ausgerichtet sein. Die Ausrichtung wird gleichzeitig mit dem Zuschnitt durch folgende Funktion angepasst:

CibIpl.warpCrop(Bitmap src, int x0, int y0, int x1, int y1, int x2, int y2, int x3, int y3, boolean resize)

Zusätzlich kann eine automatische Ausrichtung mit:

CibIpl.deskew(Bitmap src)

noch Verbesserungen in der Texterkennung bringen.