CIB DeepER API Dokumentation (DE)

API-Beschreibung

Ausgabe als Flieẞtext

Alternativ kann das OCR-Ergebnis auch als Fließtext zurückgegeben werden. Dazu muss zusätzlich zum Bild auch ein JSON-File mit dem Key-Value-Paar {'output_format': 'plain_text'} im POST-Request mitgesendet werden. . Der content-type muss 'application/json' lauten. Die Benennung des Feldes muss 'json' lauten.

In Python sieht eine Client-Implementierung wie folgt aus:

import requests
import json

files = {
    'file': ('image.png', open(r'\path\to\image.png', 'rb'), 
    	      'application/octet-stream'),
    'json': (None, json.dumps({'output_format': 'plain_text'}),
             'application/json')
}
response = requests.post('http://backend-ocr.cib.de/ocr/v4', files=files, auth=('<>', '<>'))
json_response = response.json()

 

In diesem Fall besteht die Rückgabe aus einem JSON-Objekt mit drei Keys:

  • 'image': Dokumentname des Originalbildes
  • 'text': Enhält den erkannten Text als String. Zeilenumbrüche sind als ‘\n’ codiert. Backslashes im Originaltext werden durch einen zweiten Backslash escaped.
  • 'versions': Informationen über die verwendete OCR-Engine.

 

Ein Beispielergebnis mit Fließtextoutput sieht folgendermaßen aus:

{
  "image": "schaefer.png",
  "text": "Software Entwicklung\nMünchen",
  "versions": [
    [
      "CIB deepER",
      "2.9.0"
    ]
  ]
}