[[Vorlage(Getestet, bionic, focal)]] {{{#!vorlage Wissen [:Pakete installieren: Installation von Programmen] [:Paketinstallation_DEB: Ein einzelnes Paket installieren] [:Menüeditor: Programme zum Menü hinzufügen] [:Terminal:Ein Terminal verwenden] [:Editor:Einen Editor verwenden] [:mit Root-Rechten arbeiten:] }}} [[Inhaltsverzeichnis()]] [[Bild(./gespeaker-logo.png, 80, left)]] [https://www.muflone.com/gespeaker/english/ Gespeaker] {en} ist ein [:GUI-Toolkits#GTK:GTK+]-Frontend für das Sprachprogramm [:eSpeak:]. Es kann verwendet werden, um eingegebenen Text direkt als Sprache auszugeben, oder vorhandene Texte ('''*.txt''') vorlesen zu lassen. Dabei können auch gleich Aufnahmen im '''.wav'''-Format erstellt werden. Neben den in eSpeak vorhandenen Stimmen lassen sich auch die "schöneren", natürlicher klingenden Stimmen des [github:numediart/MBROLA:MBROLA-Projektes] {en} nutzen. Gespeaker benötigt eine Python-2.7-Installation. {{{#!vorlage Hinweis Gespeaker funktioniert - zumindest unter 20.04 - __nicht__ mit [:eSpeak NG:]; bei Installation von '''espeak-ng-espeak''' (was eigentlich einen vollwertigen Ersatz für eSpeak liefern soll) startet das Programm nicht; Gespeaker findet dann die eSpeak-Stimmen nicht. }}} = Installation = Gespeaker ist bis 18.04 in den Paketquellen vorhanden, es müssen die Pakete {{{#!vorlage Paketinstallation gespeaker, universe python-dbus mbrola, multiverse, optional }}} sowie die gewünschten '''mbrola'''-Sprachpakete installiert[1] werden (als Pakete liegen die deutschen Stimmen '''-de2, -de4''' und '''-de6''', männlich, sowie '''-de3, -de5''' und '''-de7''', weiblich, vor). == Manuelle Installation == Für 20.04 ist Gespeaker nicht mehr in den Quellen vorhanden. Die aktuellste Version liegt auf [https://www.muflone.com/gespeaker/english/download.html#tabs|Tabs_Group_name:Tab_v086: Downloadseite] {dl} als '''.deb'''-Paket[2] vor. Es benötigt allerdings das Paket [packages:python-glade2:], das ebenfalls nicht mehr in den Quellen vorhanden ist. Man kann sich mit dem 18.04-Paket behelfen, das sich unter 20.04 problemlos installieren lässt. [[Vorlage(Fremd, Paket, "")]] == Weitere MBROLA-Stimmen == Weitere Stimmen für MBROLA lassen aus den Quellen installieren. Allerdings bietet eSpeak keine Unterstützung für die MBROLA-Stimmen '''de1''' und '''de8''', insofern sind sie auch nicht in Gespeaker nutzbar. Nach erfolgreicher Installation findet man das Programm z.B. in [:GNOME:] unter ''"Anwendungen -> Multimedia -> Gespeaker"''. Sinnvoller wäre ggf. ein Eintrag in ''"Barrierefreiheit"'', der müsste selbst erstellt werden [3]. [[Bild(./gespeaker-pref.png, 200, right)]] = Konfiguration = Über den Reiter ''"Bearbeiten -> Einstellungen"'' (oder [[Vorlage(Tasten, strg+p)]]) erreicht man das ''"Einstellungen"''-Fenster. Dort lassen sich unter ''"Allgemein"'' Einstellungen zur Soundausgabe (''"Audiospieler"'') machen (dabei geht es eher um das verwendete [:Soundsystem:]). Es lässt sich die Willkommens-Nachricht konfigurieren, auf Wunsch auch eine eigene Nachricht festlegen. Außerdem können Einstellungen zu den zu speichernden Fenster-Einstellungen gemacht werden. Für die Aufnahme kann ''"Mono-Aufnahme"'' eingestellt werden. Mit ''"Text Wrapping aktivieren"'' wird erreicht, dass eingefügte lange Textzeilen visuell umgebrochen werden, ''"Stimmvarianten laden"'' ermöglicht die Verwendung von unterschiedlichen Varianten zu den einzelnen Stimmen (nicht für MBROLA-Stimmen möglich). Unter ''"Mbrola-Stimmen"'' findet man Informationen zu den verwendbaren Stimmen, es lässt sich auch ein angepasster Ort für die installierten Mbrola-Stimmen einstellen (''"Pfad zu Mbrola-Stimmen"''). Unter ''"Plugins"'' werden die installierten Erweiterungen aufgeführt, sie lassen sich dort (de-)aktivieren. = Bedienung = [[Bild(./gespeaker-main.png, 250, right)]] Im Hauptprogramm wird im Eingabefenster der auszugebende Text geschrieben (''"Text zur Wiedergabe eingeben"''), und dann mit der ''"Wiedergabe"''-Schaltfläche (oder [[Vorlage(Tasten, f5)]]) "vorgelesen". Die ''"Neu"''-Schaltfläche entfernt den Text, ''"Öffnen"'' ermöglicht es, abgespeicherte Text-Dateien (allerdings nur im '''.txt'''-Format!) einzufügen und vorlesen zu lassen. Mit ''"Speichern"'' lässt sich der Text sichern. ''"Aufnahme"'' startet eine Aufnahme im '''.wav'''-Format; zunächst muss der Speicherort für die Aufnahme festgelegt werden. Mit ''"Zurücksetzen"'' werden die Ausgangseinstellungen für das Programm wieder hergestellt. In den ''"Grundeinstellungen"'' unter dem Eingabefenster lassen sich die zu verwendende Sprache/Stimme festlegen; ggf. auch weitere Einstellungen (''"Männlich, Weiblich, Variante"''), falls für die Stimme vorhanden, und die Option in den ''"Einstellungen"'' aktiviert ist. Unter ''"Erweiterte Einstellungen"'' (über den Pfeil links davon auch zu verbergen) können die ''"Tonhöhe"'', ''"Lautstärke"'', ''"Geschwindigkeit"'' sowie die Pausenlänge zwischen den einzelnen Wörtern (''"Verzögerung"'') den eigenen Wünschen entsprechend angepasst werden. Diese Funktionen lassen sich allerdings nicht bei laufender Wiedergabe verändern. == Steuerung über das Terminal == Gespeaker lässt sich mit allen Einstellungen auch über das Terminal[4] steuern; Einzelheiten dazu in der [:man:Manpage] des Programms. = Probleme = Bei der Wiedergabe von Texten mit MBROLA-Stimmen friert die Oberfläche ggf. ein und reagiert nicht auf Eingaben (''"Pause"'', ''"Anhalten"''), siehe auch [googlecode:gespeaker/issues/detail?id=27: Bugreport] {en}. Erst nach Beenden der Ausgabe ist das Fenster wieder erreichbar. Auch bei einem externen Abbruch von Gespeaker läuft die Sprachausgabe weiter, in so einem Falle muss noch der Prozess `espeak` beendet werden, oder abgewartet werden, bis das Ende der Textausgabe erreicht ist. Abhilfe schafft es, in der Datei '''/usr/share/gespeaker/src/Settings.py''' in einem Editor[5] mit Root-Rechten[6] die Zeile {{{ argsEspeak = '-a %v -p %p -s %s -g %d -v %l -f %f' }}} in {{{ argsEspeak = '-a %v -p %p -s %s -g %d -v %l -f %f --pho' }}} umzuändern. Das Problem tritt in Version 0.8.6 von der Projektseite nicht auf.. == MBROLA-Stimmen einbinden == Bei der Installation der MBROLA-Stimmen aus den Paketquellen werden diese in einzelne Unterordner, z.B. '''/usr/share/mbrola/de4/de4''' installiert. Um auf die Stimmen zugreifen zu können, muss in ''"Bearbeiten -> Einstellungen -> Mbrola-Stimmen"'' ggf. der Pfad richtig angegeben werden (Dropdown-Menü aufrufen, dort ''"Andere..."'' auswählen und zu '''/usr/share/mbrola''' navigieren und dann ''"Aktualisieren"''), falls keine Stimmen angezeigt werden. = Tastenkürzel = ||<-2 tableclass="zebra_start3" rowclass="titel"> Gespeaker|| || Tasten||Funktion|| ||[[Vorlage(Tasten, strg+n)]]||''"File -> Neu"''|| ||[[Vorlage(Tasten, strg+o)]]||''"File -> Öffnen"''|| ||[[Vorlage(Tasten, strg+s)]]||''"File -> Speichern unter"''|| ||[[Vorlage(Tasten, strg+q)]]||''"File -> Beenden"''|| ||[[Vorlage(Tasten, strg+x)]]||''"Edit -> Ausschneiden"''|| ||[[Vorlage(Tasten, strg+c)]]||''"Edit -> Kopieren"''|| ||[[Vorlage(Tasten, strg+v)]]||''"Edit -> Einfügen"''|| ||[[Vorlage(Tasten, f5)]]||''"Edit -> Wiedergabe"''|| ||[[Vorlage(Tasten, f6)]]||''"Edit -> Pause"''|| ||[[Vorlage(Tasten, f7)]]||''"Edit -> Stopp"''|| ||[[Vorlage(Tasten, strg+p)]]||''"Edit -> Einstellungen"''|| = Alternativen = * [:Sprachausgabe:] {Übersicht} - Übersichtsseite ## * [:Archiv/KMouth:] - KDE-Programm zur Sprachausgabe * [:Omilo:] - ähnliches Programm, das [:Festival:]/[:Flite:] und [:Sprachausgabe#Mary:Mary]-Stimmen verwenden kann * [:Skripte/Book-To-MP3:]- damit lassen sich neben '''.txt''' eine Vielzahl von Formaten ausgeben * [:Skripte/pdf2mp3:] - ähnliches [:Python:]-Skript, das '''pdf'''- und ascii-Dateien umwandeln in '''mp3'''-Dateien umwandeln kann * [:eSpeak:]/[:eSpeak_NG:] - Grundlage für Gespeaker * [:Barrierefreiheit#Screenreader:Screenreader] - Programme, um Webseiten vorlesen zu lassen * [:PlayItSlowly:] - kann erstellte '''.wav'''-Dateien wiedergeben, wobei während der Wiedergabe Tonhöhe, Geschwindigkeit etc. verändert werden kann = Links = * [https://www.muflone.com/gespeaker/ Projektseite] {en}/{it} * [github:muflone/gespeaker:GitHub-Seite] {en} * [github:numediart/MBROLA:MBROLA] {en} #tag: Multimedia, Bildung, Barrierefreiheit, Büro, Kommunikation, Sprachausgabe, TTS