[[Vorlage(Archiviert)]] {{{#!vorlage Wissen [:Paketquellen freischalten: Bearbeiten von Paketquellen] [:Pakete installieren: Installation von Programmen] [:Paketinstallation_DEB: Ein einzelnes Paket installieren] [:Terminal: Ein Terminal öffnen] [:Packprogramme: Archive entpacken] [:Programme kompilieren: Pakete aus dem Quellcode erstellen] [:Editor:Einen Editor öffnen] }}} [[Inhaltsverzeichnis()]] Wer [:gscan2pdf:] auch mit den OCR-Programmen [googlecode:ocropus:OCRopus] {en} und [:Cuneiform-Linux:] verwenden möchte, was erst ab Version 0.9.31 möglich ist, muss derzeit unter Ubuntu vor [:Oneiric: 11.10 Oneiric Ocelot] das Programm aus anderen Quellen beziehen oder den Quellcode selbst kompilieren, sinnvollerweise gleich aus der git-Quelle. = Installation = == Aus einem PPA == [[Vorlage(PPA, jeffreyratcliffe/ppa, key 5BC3E400, lucid )]] Installiert[2] werden muss das Paket {{{#!vorlage Paketinstallation gscan2pdf, ppa }}} == Fertiges Paket von sourceforge.net == Alternativ kann nach Installation der gewünschten optionalen Pakete (siehe [#Sinnvolle-Zusaetze Sinnvolle Zusätze]) ein fertiges '''.deb'''-Paket von [sourceforge:gscan2pdf:sourceforge.net] {dl} heruntergeladen werden, welches auch für Ubuntu geeignet ist. Dieses lässt sich dann von Hand installieren[3]. [[Vorlage(Fremd,Paket)]] == Aus dem Quellcode == === build-Abhängigkeiten === Benötigt werden die build-Abhängigkeiten für gcsan2pdf, die z.B. im Terminal[4] installiert werden können: {{{#!vorlage Builddeps gscan2pdf }}} === Programmabhängigkeiten === gscan2pdf benötigt folgende Pakete: {{{#!vorlage Paketinstallation libgtk2-imageview-perl libgtk2-ex-simple-list-perl libsane-perl liblocale-gettext-perl, >= 1.05 sane-utils, >= 1.0.17 libtiff-tools libpdf-api2-perl libconfig-general-perl, >= 2.40 perlmagick imagemagick librsvg2-common libset-intspan-perl, >= 1.10 libhtml-parser-perl libgoo-canvas-perl libproc-processtable-perl libreadonly-perl liblog-log4perl-perl libforks-perl }}} === Sinnvolle Zusätze === Um den vollen Funktionsumfang nutzen zu können, sind außerdem folgende Pakete nötig {{{#!vorlage Paketinstallation libgtk2-ex-podviewer-perl, um die Hilfe anzeigen zu können sane, um verschiedene Frontends verwenden zu können, siehe [:SANE:] xdg-utils, um PDFs direkt als E-Mails verschicken zu können djvulibre-bin, um [:DjVu:]-Dateien erstellen zu können unpaper, um die Scans vorzubereiten, siehe [:unpaper:] gocr, OCR-Programm tesseract-ocr, OCR-Programm, dazu entsprechende Sprachdateien, siehe [:tesseract-ocr:] cuneiform, OCR-Programm, siehe [:Cuneiform-Linux:] ocropus, OCR-Programm }}} [:Cuneiform-Linux:] funktioniert allerdings nur in einer mit [:Cuneiform-Linux#Manuelle-Installation: libmagick++-Support] erstellten Version ab 0.8.0 (erst ab [:Oneiric:] in den Paketquellen vorhanden!). == Quellcode beziehen == Der Quellcode kann auf der [sourceforge:gscan2pdf/files/gscan2pdf:Downloadseite] {dl} bezogen werden, das '''.tar-gz'''-Archiv entpacken[5] und kompilieren[6]. Allerdings hat diese Version noch einen Fehler, der die Benutzung von unterschiedlich großen Seiten für die Texterkennung einschränkt. Diese Fehler ist aber in der [:Git:]-Version bereits behoben. Diese kann man mit dem Befehl {{{#!vorlage Befehl git clone git://gscan2pdf.git.sourceforge.net/gitroot/gscan2pdf/gscan2pdf gsan2pdf-x.x.x }}} heruntergeladen werden. Zunächst wird für beide Fälle mit {{{#!vorlage Befehl perl Makefile.PL make }}} ein '''makefile''' erstellt und das Programm übersetzt. Leider funktioniert die vorgesehene Erstellroutine, die im Downloadverzeichnis für beide Versionen über den Befehl {{{#!vorlage Befehl make debdist }}} aufgerufen werden soll, momentan nicht, da am Ende der private Schlüssel des Entwicklers verlangt wird, den man natürlich nicht vorhalten kann... Dieses Fehler ist bereits gemeldet, und soll nach Auskunft von Jeffrey Ratcliffe demnächst behoben werden. Ggf. schlägt die Erzeugung eines einfachen Pakets via [:Programme_kompilieren#Installieren#:checkinstall] fehl, wenn in den verwendeten Angaben zu den Abhängigkeiten fehlerhafte bzw. für checkinstall nicht verarbeitbare Einträge benutzt werden. Um dennoch ein Paket erstellen zu können, müssen in den Angaben bei der checkinstall-Installierung zu Punkt 10 die dort aufgeführten Abhängigkeiten {{{ 10 - Requires: [ perl( ImageMagick-perl, ImageMagick, djvulibre, sane-backends >= 1.0.17 sane-frontends, xdg-utils, unpaper, gocr, perl(Gtk2 perl(Gtk2 ] }}} schlicht gelöscht werden (wenn die oben aufgeführten Pakete installiert sind, ansonsten können sie durch die oben angegebene Liste ersetzt werden), danach wird auch ein Paket erstellt und installiert. == tesslanguage-Variable exportieren == Um OCRopus ohne den beschriebenen [:gscan2pdf#Texterkennung-mit-OCRopus-liefert-schlechte-Ergebnisse:Export] der `tesslanguage`-Variable verwenden zu können, muss in der Datei '''gscan2pdf''' (das geht auch nach Installation mit einem Editor mit Root-Rechten[7] in '''/usr/bin/gscan2pdf''') die Zeile {{{ "$pre ocroscript $SETTING{ocroscript} --tesslanguage=$SETTING{'ocr language'} $png > $txt.txt$post"; }}} durch {{{ "$pre tesslanguage=$SETTING{'ocr language'} ocroscript $SETTING{ocroscript} $png > $txt.txt$post"; }}} ersetzt werden, dann funktioniert auch für OCRopus die Spracheinstellung wie gewünscht. Diese Änderung ist in die GIT-Version vom [http://gscan2pdf.git.sourceforge.net/git/gitweb.cgi?p=gscan2pdf/gscan2pdf;a=commit;h=105a7973ec4d84b5511cba0796eabfcafeed32d6 21.09. 2010] {en} bereits eingeflossen. Allerdings funktioniert dies für Version 1.0.x nicht mehr! = Links = * [http://gscan2pdf.sourceforge.net/ gscan2pdf-Projektseite] {en} * [http://gscan2pdf.git.sourceforge.net/git/gitweb.cgi?p=gscan2pdf/gscan2pdf;a=summary Aktueller git-Stand] {en} # tag: Grafik, Büro, Scanner, OCR, Texterkennung, djvu, PDF