[[Vorlage(Getestet, bionic)]] {{{#!vorlage Wissen [:Pakete installieren: Installation von Programmen] [:Packprogramme: Archive entpacken] [:Terminal: Ein Terminal öffnen] [:Programme kompilieren: Pakete aus dem Quellcode erstellen] [:Paketinstallation_DEB: Ein einzelnes Paket installieren] [:Programme starten: Ein Programm starten] [:Menüeditor: Programme zum Menü hinzufügen] }}} [[Inhaltsverzeichnis()]] [[Bild(./scantailor-logo.png, 80, left)]] [http://scantailor.org Scan Tailor] {en} ([github:scantailor/scantailor:Github]) ist ein in Russland entwickeltes Programm, mit dem Scans bearbeitet werden können, um z.B. bessere Ergebnisse bei einer anschließende Texterkennung zu erzielen oder sie für die Archivierung zu optimieren. So können u.a. Seiten aufgeteilt, gerade gezogen und unerwünschte Ränder entfernt werden. Die Bearbeitung kann automatisiert erfolgen. Es lassen sich aber auch umfangreiche manuelle Einstellungen für verschiedene Aufgaben vornehmen. Die bearbeiteten Vorlagen werden dann im [wikipedia:Tagged_Image_File_Format:tif]-Format abgelegt. Das Scannen, eine Texterkennung, oder das Überführen der einzelnen Ergebnis-Bilder in mehrseitige Dateien muss allerdings mit anderen Programmen erfolgen. Zur Erstellung von E-Books eignet sich z.B. [:djvubind:]. Die Entwicklung des Programm stagniert z.Z. (letzte Änderungen im September 2016), es ist zwar eine Version 1.0 in Planung, die aber auch eher auf Eis zu liegen scheint. Es gibt eine Software namens "ScanTailor Advanced", die zwei Programmvarianten "ScanTailor Featured" und "ScanTailor Enhanced" in eine Software zusammengefasst hat. = Installation = Scan Tailor ist für [:18.04:] in den Ubuntu-Paketquellen vorhanden. Installiert[1] werden muss das Paket: {{{#!vorlage Paketinstallation scantailor, universe }}} == Aus einem PPA == [[Vorlage(PPA, alex-p/scantailor)]] Daraus können folgendes Paket installiert werden: {{{#!vorlage Paketinstallation scantailor-advanced, ppa scantailor-universal, ppa }}} == Manuelle Installation == Alternativ kann der aktuelle Quelltext der Entwicklungs-Version über [:Git:] aus dem [github:scantailor/scantailor:Github-Repository] mit folgendem Befehl heruntergeladen werden: {{{#!vorlage Befehl git clone https://github.com/scantailor/scantailor.git }}} Zum Kompilieren müssen folgende Pakete installiert sein: {{{#!vorlage Paketinstallation cdbs debhelper cmake libqt4-dev libjpeg-dev libpng12-dev libtiff4-dev libxrender-dev libboost-test1.65-dev libqt4-opengl-dev }}} Der Quellcode der aktuellen stabilen Version kann von der [github:scantailor/scantailor/releases:Releases-Seite] {dl} bezogen werden, in [:18.04:Ubuntu 18.04] ist der aktuelle Code bereits in den Quellen enthalten. Das Paket wird mittels [:Programme_kompilieren/Alternativen#CMake:cmake] (dabei darauf achten, dass das Verzeichnis, in dem die Dateien gespeichert werden, nicht nur einfach `scantailor` heißt, da sonst das Programm nicht erstellt werden kann!) und anschließender Kompilierung[4] erstellt und installiert[5]. Das Programm wird im Terminal gestartet[6]. Komfortabler ist es, sich einen Starter z.B. im Hauptmenü anzulegen[7]. == ScanTailorAdvanced - Installation über snap == Die Installation über [:snap:] ist unkompliziert möglich. Eine Programmbeschreibung mit Installationshinweis ist auf der Internetseite [https://snapcraft.io/scantailor-advanced snapcraft.io] {en} zu finden (siehe [:Scan_Tailor#Links:]. {{{#!vorlage Befehl sudo snap install scantailor-advanced }}} Je nach Ablageort der zu bearbeitenden Bilddateien im Dateisystem muss dem Programm noch der Zugriff ermöglicht werden. Mit folgendem Befehl wird dies im Snap-System eingerichtet: {{{#!vorlage Befehl sudo snap connect scantailor-advanced:removable-media }}} [[Bild(ST-Auswahl.png, 250, right)]] = Bedienung = Scan Tailor ist für die Stapelverarbeitung gedacht, daher lassen sich auch nur ganze Ordner mit Bild-Dateien öffnen (''"Datei -> Neues Projekt..."''). Die Dateien werden im Import-Dialog angezeigt, alle Dateien in verarbeitbaren Formaten ('''.tif/tiff''', '''.jpg/jpeg''', '''.png''') werden zunächst aufgenommen; es lassen sich dann aber einzelne Daten an oder abwählen. Die Auswahl kann für mehrere Ordner wiederholt werden, die jeweils gewählten Dateien bleiben im Projekt. Nicht unterstützte Datei-Formate werden grau angezeigt. Auch der Ausgabe-Ordner kann ausgewählt werden, Standard ist, einen '''/out'''-Ordner im zuletzt gewählten Eingabe-Ordner zu erstellen, und die Resultate dort abzulegen. Empfohlen wird, keine Scharz-Weiß/Strichzeichnungen als Vorlagen einzusetzen, sondern Bildmaterial in Graustufen oder Farbe zu verwenden. Die Benutzung von '''.jpg'''-Daten ist zwar möglich, wird aber aufgrund der auftretenden Qualitätseinbußen dieses nicht-verlustfreien Formats nicht empfohlen. Falls Bilddateien mit offensichtlich inkorrekten dpi-Angaben importiert werden sollten, gibt Scan Tailor eine Warnmeldung aus, und bietet die Möglichkeit, diese Werte zu korrigieren. Die Bearbeitung selbst wird in sechs aufeinander aufbauenden Schritten vorgenommen (die z.T. nur bei Bedarf vorgenommen werden müssen). Die Schritte finden sich im linken Sidebar des Hauptfensters; durch Anklicken des Pfeils in den einzelnen Zeilen wird jeweils die Stapelverarbeitung für alle bisher vorgenommenen Schritte durchgeführt. Die Bearbeitung kann mit Drücken der großen Stop-Taste, die im mittleren Bereich während längerer Bearbeitungsphasen erscheint, abgebrochen werden. Die vorgenommenen Änderungen werden erst mit Abschluss des Projektes (''"Ausgabe"'') auf der Festplatte gespeichert. Die gewählten Bilder werden rechts im Hauptfenster angezeigt. Eine späteres Hinzufügen (''"Davor Einfugen .../Danach einfügen..."'') und Entfernen von Bilddateien (und so indirekt auch eine Neusortierung) ist in den ersten beiden Bearbeitungsschritten mit Öffnen des Kontextmenüs über [[Vorlage(Tasten, rmt)]] möglich. Alternativ können die ausgegebenen '''.tiff'''-Dateien vor der Weiterverarbeitung sortiert werden. Die Bilddarstellung im mittleren Bereich lässt sich per Mausrad [[Vorlage(Tasten, mmt)]] zoomen und mit gedrückter [[Vorlage(Tasten, lmt)]] verschieben, um Details besser erkennen zu können. [[Bild(ST-gui.png, 350, right)]] == Bearbeitungsschritte == Die Bilder können bei Bedarf gedreht (''"1: Seite drehen"'') werden; über ''"Geltungsbereich -> Anwenden auf..."'' lässt sich festlegen, für welche Seiten die Drehung angewendet werden soll. Mit ''"2: Seiten aufteilen"'' könne die Vorlagen nach verschiedenen Mustern aufgeteilt werden (z.B. zwei Buchseiten auf einem Scan; die mittlerer Linie lässt sich dabei mit der blauen Linie manuell in die richtige Position bringen). ''"3: Ausrichten"'' sorgt für eine gerade Ausrichtung der Scans, manuell kann die Ausrichtung neben der Angabe des Winkels bequemer mit der Maus über die blauen Knöpfe im Hauptfenster erfolgen. Mit ''"4: Inhalt auswählen"'' wird der zu verwendende Ausschnitt festgelegt. Die automatische Auswahl ist bei kleinen Bildelementen am Rande nicht immer zuverlässig, so werden z.B. Seitenzahlen leicht "übersehen". Ein falsch gewählter Ausschnitt lässt sich verschieben, oder über [[Vorlage(Tasten, rmt)]] im Hauptfenster wieder löschen, und dann neu erstellen. ''"5: Stege (Ränder)"'' wird verwendet, um für die auszugebenden Dateien neue Seitenränder (''"Stege (Ränder)"'') festzulegen, die entweder für recht/links und oben/unten gleich gewählt, aber auch frei festgelegt werden können. Über die Schaltfläche ''"Anwenden auf..."'' kann ausgewählt werden, welche Seiten so bearbeitet werden sollen. Außerdem lässt sich die ''"Ausrichtung"'' innerhalb des gewählten Rahmens festlegen. Möglich ist eine einheitliche Ausrichtung für alle Seiten des Projektes, diese Orientierung kann an den anderen Seiten des Projektes erfolgen. Eine Anpassung kann durch Ziehen der lilafarbenen Markierungen mit der [[Vorlage(Tasten, lmt)]] erfolgen, die Veränderungen erfolgen im Verhältnis zu den Seitenrändern. Ggf. sichtbare gestrichelte Linien zeigen den Bezug zur jeweils höchsten/breitesten Seite im Projekt. Das Ergebnis wird dann über ''"6: Ausgabe"'' gespeichert. Hier lässt sich zunächst die Auflösung anpassen (''"Auflösung der Ausgabedatei (dpi)"'' in DPI = "dots per inch"). Standard sind 600 dpi, wer allerdings z.B. eine Texterkennung mit anschließen möchte, sollte hier 300 dpi wählen. Über ''"Methode"'' wird festgelegt, wie die Ergebnisse ausgegeben werden sollen, dabei sind jeweils unterschiedliche weitere Einstellungen möglich. Bei Schwarz-Weiß und im "Gemischt"-Modus lässt sich ''"Dewarping"'' (ggf. entstehende Wölbung beim Scannen von Buchseiten entfernen) und ''"Despeckle"'' (Entflecken) aktivieren, Vorsicht ist allerdings geboten, damit nicht ggf. wichtige Bildelemente (i-Punkte, Kommata etc.) entfernt werden. Die Stärke der Fleckenentfernung lässt sich in vier Abstufungen einstellen, das Ergebnis wird im Mittelfenster als eigener Reiter angezeigt, die entfernten Elemente werden rot dargestellt. Außerdem lässt sich mit dem Schieberegler die Linienstärke der Buchstaben festlegen - dabei müssen ggf. je nach Auflösung unterschiedliche Werte verwendet werden, um ein befriedigendes Ergebnis zu erzielen. Ist Farbe/Graustufen (''"Farbe/Graustufen"'') ausgewählt, können die bei der Einrichtung festgelegten Ränder weiß ausgegeben werden ("Weiße Stege (Ränder)"). Wenn das der Fall ist, kann außerdem über ''"Helligkeit angleichen"'' der Hintergrund des eigentlichen Bildes ebenfalls weiß ausgegeben werden (sinnvoll z.B. bei vergilbten Vorlagen). [[Anker(Mixed)]] Der ''"Gemischt"''-Modus führt dazu, dass Bilder anders als Textpassagen bearbeitet werden; das ist besonders für Vorlagen mit integrierten (Farb-)Fotos sinnvoll. Der Text wird Schwarz-Weiß ausgegeben, die Bilder in Farbe/Graustufen. Die automatische Erkennung ist relativ gut. Bei "schwierigen" Vorlagen können die Bilder auch manuell per Maus ausgewählt werden. Um Bilder individuell festzulegen, muss in die Ansicht über den Seitenreiter ''"Bildbereiche"'' gewechselt werden. Unter dem Mauszeiger erscheint ein roter Punkt, durch [[Vorlage(Tasten, lmt)]]-Klick wird der erste Fixpunkt festgelegt, der Umriss kann dann mit beliebig vielen weitere Punkten ([[Vorlage(Tasten, rmt)]]-Klick) erzeugt werden, die Bereichswahl wird mit nochmaliger Anwahl des ersten Punktes abgeschlossen. So sind sehr genaue Eingrenzungen der Bilder möglich. Mit [[Vorlage(Tasten, rmt)]]-Klick in den Umriss erscheinen im Kontextmenü weiter Optionen , z.B. auch den Bereich wieder zu entfernen. Es kann bei Bedarf zu allen Schritten der Bearbeitung nochmals zurückgegangen werden, um Korrekturen zu erstellen; die Veränderungen werden dann mit erneutem Aufruf der Stapelverarbeitung am Ende gespeichert. Sinnvollerweise werden dabei nur die tatsächlich veränderten Seiten neu berechnet und ausgegeben. Die Ergebnisse werden erstellt (das kann je nach Größe des Projektes und Kapazität des Rechners auch etwas länger dauern, es lässt sich angeben, dass bei Abschluss der Verarbeitung ein Tonsignal ausgegeben wird), im ausgewählten oder dem erstellten '''out'''-Ordner durchnummeriert als '''.tiff'''-Dateien abgelegt und können dann weiterverarbeitet werden. Da die ausgegebenen '''.tiff'''-Dateien trotz verwendeten Kompressions-Algorithmen (G4Fax, oder [wikipedia:Lempel-Ziv-Welch-Algorithmus:LZW]) je nach Modus sehr groß ausfallen könnten (A4 in 300 dpi von 1 MB bis zu ~ 15 MB!), ist für die Speicherung und Weiterverarbeitung eine Konvertierung mit z.B. mit `convert` (siehe [:ImageMagick:]) beispielsweise ins ebenfalls verlustfreie '''.png'''-Format sinnvoll. == Debugging Modus == Wenn in den Einstellungen ''"Werkzeuge -> Debug Mode"'' aktiviert wird, erscheinen im mittleren Fenster beim Modus ''"Gemischt"'' und ''"Schwarzweiß"'' eine Vielzahl von Reitern, in denen verschiedene Zwischenschritte und Effekte für die Ausgabe ausgegeben werden. Besonders hervorzuheben ist ''"big_component_unified"'' oder gleich ''"voronoi"'', das interessante Farben in langweilige Texte bringt; sinnvoll wäre z.B. für sehr schwache Vorlagen die Einstellung ''"dilated"''. {{{#!vorlage Tabelle <:>[[Bild(./ST-main.png, x300)]] <:>[[Bild(./ST-bcu.png, x300)]] <:>[[Bild(./ST-voronoi.png, x300)]] <:>[[Bild(./ST-dilated.png, x300)]] +++ <:>Main (Normalausgabe) <:>big_component_unified <:>voronoi <:>dilated }}} Diese Einstellungen lassen sich allerdings leider nicht für den Export nutzen... = Tastenkürzel = ||<-2 tableclass="zebra_start3" rowclass="titel"> Scan Tailor || || Tasten || Funktion || ||[[Vorlage(Tasten, strg + N)]] || Neues Projekt erstellen|| ||[[Vorlage(Tasten, strg + o )]]|| bestehendes Projekt öffnen|| ||[[Vorlage(Tasten, strg + S)]] || Projekt speichern|| ||[[Vorlage(Tasten, strg + W )]]|| Projekt schließen|| ||[[Vorlage(Tasten, strg + Q)]] || Beenden|| = Alternativen = [https://www.flameeyes.com/projects/unpaper unpaper] {en} als reines Kommandozeilen-Werkzeug liefert noch wesentlich differenziertere Bearbeitungsmöglichkeiten. Das Programm ist allerdings eher für vollautomatisierte Stapel-Verarbeitung geeignet, Näheres unter [:unpaper:]. = Links = * [github:scantailor/scantailor: ScanTailor Projektseite] {en} * [github:scantailor/scantailor/wiki: ScanTailor Dokumentation] {en} * [github:4lex4/scantailor-advanced: ScanTailor Advanced Projektseite] {en} * [https://snapcraft.io/scantailor-advanced ScanTailor Advanced im snap Store] {en} * [http://heise.de/-1787142 Scan Tailor bringt Dokumente in Form] {de} - heise Open Source, 01/2013 * [:Texterkennung:] {Übersicht} Übersichtsartikel #tag: Grafik, Bildung, Büro, Kommunikation, OCR, Texterkennung, Archivierung