OsterProjekt 2022 - Tesseract OCR

vorhergehende Artikel in: Java Python
13.04.2022

Nachdem ich schon eine ganze Weile auf dieser Idee saß, habe ich mich entschlossen, sie als Projekt in meiner Woche Osterurlaub in Angriff zu nehmen - als Ausgleich zwischen den diversen Arbeiten zur Inbetriebnahme meiner neuen Küche...

Ich habe mir diverse Fragen gestellt, die ich im Rahmen des Projektes für mich beantworten wollte:

  • Funktionieren UZN-Dateien wirklich mit Tesseract?
  • Funktionieren die Python-Beispiele zum Finden von Text in Bilder wirklich? (siehe Links unten)
  • Sind die Tesseract-Box-Koordinaten, die die Python-Skripte herausfinden direkt in UZN-Dateien nutzbar?
  • Funktioniert das mit mehreren verschiedenen Auflösungen der Scans und/oder Bilder?
  • Sind die Koordinaten, die die Python-Skripte liefern, nachträglich über eine GUI-Anwendung manipulierbar?
    • Wie ist das Mapping zwischen Bild-Koordinaten und Tesseract-Box-Koordinaten
  • Existieren entsprechende Java-Language Bindings für Tesseract?
  • Funktioniert das alles auch sprachspezifisch (deutsche Umlaute!?)?

Artikel, die hierher verlinken

OsterProjekt 2022 - Tesseract OCR: Ergebnisse

19.04.2022

Der Osterurlaub 2022 ist um - Zeit, die Ergebnisse meines Projektes für diese Zeit vorzustellen:

Alle Artikel rss Wochenübersicht Monatsübersicht Github Repositories Gitlab Repositories Mastodon Über mich home xmpp


Vor 5 Jahren hier im Blog

  • Alte Rechner zukunftsfähig (?)

    01.05.2019

    Ich mache immer wieder gerne Experimente mit Terminalsessions - meistens wegen der zentral möglichen Administration. Nunhabe ich das Thema von neuem angepackt: wegen einem alten(sehr alten) Laptop, der bei mir schon so lange im Schrank lag, dass sogar die BIOS-Batterie inzwischen leer war...

    Weiterlesen...

Neueste Artikel

  • Graphics2D Implementierung für Java mit verlegtem Koordinatenursprung

    Es gibt seit vielen Jahren immer mal wieder Leute, die im Internet fragen, ob man in Javas diversen Methoden zum Zeichnen von Graphiken das Koordinatensystem so ändern könnte, dass sich der Koordinatenursprung links unten befindet und die positive y-Achse nach oben weist. Meist sind die Antworten dann, dass eine Affine Transformation eingeschaltet werden solle, die das Bild spiegelt.

    Weiterlesen...
  • Unerwartete Probleme bei der Software Raid5 Erweiterung

    Ich bin an die Grenzen meiner Storagelösung gestoßen - es musste mehr Platz her...

    Weiterlesen...
  • Die sQLshell ist nun cloudnative!

    Die sQLshell hat eine weitere Integration erfahren - obwohl ich eigentlich selber nicht viel dazu tun musste: Es existiert ein Projekt/Produkt namens steampipe, dessen Slogan ist select * from cloud; - Im Prinzip eine Wrapperschicht um diverse (laut Eigenwerbung mehr als 140) (cloud) data sources.

    Weiterlesen...

Manche nennen es Blog, manche Web-Seite - ich schreibe hier hin und wieder über meine Erlebnisse, Rückschläge und Erleuchtungen bei meinen Hobbies.

Wer daran teilhaben und eventuell sogar davon profitieren möchte, muß damit leben, daß ich hin und wieder kleine Ausflüge in Bereiche mache, die nichts mit IT, Administration oder Softwareentwicklung zu tun haben.

Ich wünsche allen Lesern viel Spaß und hin und wieder einen kleinen AHA!-Effekt...

PS: Meine öffentlichen GitHub-Repositories findet man hier - meine öffentlichen GitLab-Repositories finden sich dagegen hier.