ubuntuusers.de

cuneiform-qt

Dieser Artikel wurde für die folgenden Ubuntu-Versionen getestet:


Du möchtest den Artikel für eine weitere Ubuntu-Version testen? Mitarbeit im Wiki ist immer willkommen! Dazu sind die Hinweise zum Testen von Artikeln zu beachten.

Zum Verständnis dieses Artikels sind folgende Seiten hilfreich:

./cuneiform-qt-logo.png cuneiform-qt 🇬🇧 ist ein in Qt programmiertes Frontend für Cuneiform-Linux, das eine einfache Benutzeroberfläche zur Texterkennung liefert. Unterstützt werden die Eingabe-Dateiformate PNG, JPG, BMP und TIF, als Ausgabeformate können einfacher Text, Nur-Text mit TeX-Absätzen, RTF, HTML und hOCR gewählt werden.

Installation

Unter 18.04

Voraussetzung für die Verwendung ist eine Qt-Installation in Version 4.3 oder höher, sowie Cuneiform-Linux.

cuneiform-qt selbst liegt nicht in den Paket-Quellen vor, der Quellcode kann über die Projektseite ⮷ heruntergeladen werden.

Unter 20.04

Unter 20.04 kann die Version 0.1.4 verwendet werden, die mit QT5 erstellt wird. Dazu die aktuelle Version des Sourcecodes von altinux.org ⮷ herunterladen.

Hinweis!

Fremdsoftware kann das System gefährden.

Das Archiv entpacken[1] und kompilieren. Dazu muss zunächst im Terminal[2] im erstellten Verzeichnis cuneiform-qt-0.1.x des entpackten Archivs mit den Befehlen

qmake-qt4 cuneiform-qt.pro # für QT4
qmake-qt4   

bzw.

qmake cuneiform-qt.pro # für QT5
qmake 

ein Makefile erstellt werden, die weitere Kompilierung[3] (make etc.) erfolgt dann wie gewohnt.

Nach erfolgreicher Installation befindet sich unter GNOME ein Start-Eintrag in

  • "Anwendungen → Büro → Cuneiform-Qt"[4]

Außerdem wird unter GNOME/Nautilus auch ein Eintrag im Kontextmenü ("rechte Maustaste → Öffnen mit → Cuneiform-Qt") angelegt.

Voraussetzung zur Nutzung des Programms ist natürlich eine funktionsfähige Cuneiform-Linux-Installation.

Konfiguration

./cuneiform-qt.png Im Reiter "Settings → Configure" werden die Vorauswahl für die gewünschte Sprache (nutzbar sind alle in Cuneiform-Linux unterstützten Sprachen), sowie das Ausgabe-Format (ebenfalls die verwendbaren Formate) gemacht. Außerdem muss dort ggf. das Verzeichnis für die Cuneiform-Linux-Installation angegeben werden (liegt im Normalfall in /usr/bin/cuneiform, svn-Version in /usr/local/bin/cuneiform).

Benutzung

Über "File → Open Image" oder die entsprechende Schaltfläche kann eine Datei im unterstützten Format geladen werden; sie erscheint im linken Teil des Programmfensters (mit einer entsprechenden Cuneiform-Version können alle gängigen Bildformate verarbeitet werden). Eine Skalierung ist nicht möglich. Mit "File → Recognize text" (oder der Schaltfläche) wird die Erkennung gestartet, das Ergebnis wird rechts angezeigt. Mit "Save Result" wird das Ergebnis gespeichert. Ein Anhängen an bestehende Dateien ist dabei leider nicht möglich, die Ergebnisse müssen also in einzelnen Dateien gespeichert werden. Die Fenster zum Anzeigen der geladenen Bild-Datei ("Source Image") sowie des Resultates ("Recognized text") lassen sich auch schließen, allerdings nicht wieder öffnen, dazu muss das Programm neu gestartet werden, es funktioniert allerdings auch ohne "Anzeige". Beim Schließen des Programms erfolgt auch keine Warnung, wenn das Ergebnis noch nicht abgespeichert sein sollte.

Cuneiform-qt eignet sich für einfache Texterkennungs-Aufgaben; die Qualität der Erkennung ist aufgrund des verwendeten Cuneiform-Engines sehr gut. Die Weiterentwicklung des Programms stagniert, die Implementierung etlicher weiterer Features wurde nie umgesetzt (z.B. Batch-Modus, Bearbeitung der Vorlagen, Scanner-Integration, siehe TODO-Liste 🇬🇧 auf der Projektseite).

Diese Revision wurde am 14. Januar 2022 14:20 von noisefloor erstellt.
Die folgenden Schlagworte wurden dem Artikel zugewiesen: OCR, Kommunikation, Grafik, Texterkennung, Büro