Gespeaker

Gespeaker 🇬🇧 ist ein GTK+-Frontend für das Sprachprogramm eSpeak. Es kann verwendet werden, um eingegebenen Text direkt als Sprache auszugeben, oder vorhandene Texte (*.txt) vorlesen zu lassen. Dabei können auch gleich Aufnahmen im .wav-Format erstellt werden. Neben den in eSpeak vorhandenen Stimmen lassen sich auch die "schöneren", natürlicher klingenden Stimmen des MBROLA-Projektes 🇬🇧 nutzen. Gespeaker benötigt eine Python-2.7-Installation.

Installation¶

Gespeaker ist bis 18.04 in den Paketquellen vorhanden, es müssen die Pakete

gespeaker (universe)
python-dbus
mbrola (multiverse, optional)

Befehl zum Installieren der Pakete:

sudo apt-get install gespeaker python-dbus mbrola

Oder mit apturl installieren, Link: apt://gespeaker,python-dbus,mbrola

sowie die gewünschten mbrola-Sprachpakete installiert^[1] werden (als Pakete liegen die deutschen Stimmen -de2, -de4 und -de6, männlich, sowie -de3, -de5 und -de7, weiblich, vor).

Manuelle Installation¶

Für 20.04 ist Gespeaker nicht mehr in den Quellen vorhanden. Die aktuellste Version liegt auf Downloadseite ⮷ als .deb-Paket^[2] vor. Es benötigt allerdings das Paket python-glade2, das ebenfalls nicht mehr in den Quellen vorhanden ist. Man kann sich mit dem 18.04-Paket behelfen, das sich unter 20.04 problemlos installieren lässt.

Hinweis!

Fremdpakete können das System gefährden.

Weitere MBROLA-Stimmen¶

Weitere Stimmen für MBROLA lassen aus den Quellen installieren. Allerdings bietet eSpeak keine Unterstützung für die MBROLA-Stimmen de1 und de8, insofern sind sie auch nicht in Gespeaker nutzbar.

Nach erfolgreicher Installation findet man das Programm z.B. in GNOME unter "Anwendungen → Multimedia → Gespeaker". Sinnvoller wäre ggf. ein Eintrag in "Barrierefreiheit", der müsste selbst erstellt werden ^[3].

Konfiguration¶

Über den Reiter "Bearbeiten → Einstellungen" (oder Strg + P ) erreicht man das "Einstellungen"-Fenster. Dort lassen sich unter "Allgemein" Einstellungen zur Soundausgabe ("Audiospieler") machen (dabei geht es eher um das verwendete Soundsystem). Es lässt sich die Willkommens-Nachricht konfigurieren, auf Wunsch auch eine eigene Nachricht festlegen. Außerdem können Einstellungen zu den zu speichernden Fenster-Einstellungen gemacht werden. Für die Aufnahme kann "Mono-Aufnahme" eingestellt werden. Mit "Text Wrapping aktivieren" wird erreicht, dass eingefügte lange Textzeilen visuell umgebrochen werden, "Stimmvarianten laden" ermöglicht die Verwendung von unterschiedlichen Varianten zu den einzelnen Stimmen (nicht für MBROLA-Stimmen möglich). Unter "Mbrola-Stimmen" findet man Informationen zu den verwendbaren Stimmen, es lässt sich auch ein angepasster Ort für die installierten Mbrola-Stimmen einstellen ("Pfad zu Mbrola-Stimmen"). Unter "Plugins" werden die installierten Erweiterungen aufgeführt, sie lassen sich dort (de-)aktivieren.

Bedienung¶

Im Hauptprogramm wird im Eingabefenster der auszugebende Text geschrieben ("Text zur Wiedergabe eingeben"), und dann mit der "Wiedergabe"-Schaltfläche (oder F5 ) "vorgelesen". Die "Neu"-Schaltfläche entfernt den Text, "Öffnen" ermöglicht es, abgespeicherte Text-Dateien (allerdings nur im .txt-Format!) einzufügen und vorlesen zu lassen. Mit "Speichern" lässt sich der Text sichern. "Aufnahme" startet eine Aufnahme im .wav-Format; zunächst muss der Speicherort für die Aufnahme festgelegt werden. Mit "Zurücksetzen" werden die Ausgangseinstellungen für das Programm wieder hergestellt.

In den "Grundeinstellungen" unter dem Eingabefenster lassen sich die zu verwendende Sprache/Stimme festlegen; ggf. auch weitere Einstellungen ("Männlich, Weiblich, Variante"), falls für die Stimme vorhanden, und die Option in den "Einstellungen" aktiviert ist. Unter "Erweiterte Einstellungen" (über den Pfeil links davon auch zu verbergen) können die "Tonhöhe", "Lautstärke", "Geschwindigkeit" sowie die Pausenlänge zwischen den einzelnen Wörtern ("Verzögerung") den eigenen Wünschen entsprechend angepasst werden. Diese Funktionen lassen sich allerdings nicht bei laufender Wiedergabe verändern.

Steuerung über das Terminal¶

Gespeaker lässt sich mit allen Einstellungen auch über das Terminal^[4] steuern; Einzelheiten dazu in der Manpage des Programms.

Probleme¶

Bei der Wiedergabe von Texten mit MBROLA-Stimmen friert die Oberfläche ggf. ein und reagiert nicht auf Eingaben ("Pause", "Anhalten"), siehe auch Bugreport 🇬🇧. Erst nach Beenden der Ausgabe ist das Fenster wieder erreichbar. Auch bei einem externen Abbruch von Gespeaker läuft die Sprachausgabe weiter, in so einem Falle muss noch der Prozess espeak beendet werden, oder abgewartet werden, bis das Ende der Textausgabe erreicht ist. Abhilfe schafft es, in der Datei /usr/share/gespeaker/src/Settings.py in einem Editor^[5] mit Root-Rechten^[6] die Zeile

argsEspeak = '-a %v -p %p -s %s -g %d -v %l -f %f'

argsEspeak = '-a %v -p %p -s %s -g %d -v %l -f %f --pho'

umzuändern.

Das Problem tritt in Version 0.8.6 von der Projektseite nicht auf..

MBROLA-Stimmen einbinden¶

Bei der Installation der MBROLA-Stimmen aus den Paketquellen werden diese in einzelne Unterordner, z.B. /usr/share/mbrola/de4/de4 installiert. Um auf die Stimmen zugreifen zu können, muss in "Bearbeiten → Einstellungen → Mbrola-Stimmen" ggf. der Pfad richtig angegeben werden (Dropdown-Menü aufrufen, dort "Andere..." auswählen und zu /usr/share/mbrola navigieren und dann "Aktualisieren"), falls keine Stimmen angezeigt werden.

Tastenkürzel¶

Gespeaker
Tasten	Funktion
Strg + N	"File → Neu"
Strg + O	"File → Öffnen"
Strg + S	"File → Speichern unter"
Strg + Q	"File → Beenden"
Strg + X	"Edit → Ausschneiden"
Strg + C	"Edit → Kopieren"
Strg + V	"Edit → Einfügen"
F5	"Edit → Wiedergabe"
F6	"Edit → Pause"
F7	"Edit → Stopp"
Strg + P	"Edit → Einstellungen"

Alternativen¶

Sprachausgabe - Übersichtsseite
Omilo - ähnliches Programm, das Festival/Flite und Mary-Stimmen verwenden kann
Skripte/Book-To-MP3- damit lassen sich neben .txt eine Vielzahl von Formaten ausgeben
Skripte/pdf2mp3 - ähnliches Python-Skript, das pdf- und ascii-Dateien umwandeln in mp3-Dateien umwandeln kann
eSpeak/eSpeak NG - Grundlage für Gespeaker
Screenreader - Programme, um Webseiten vorlesen zu lassen
PlayItSlowly - kann erstellte .wav-Dateien wiedergeben, wobei während der Wiedergabe Tonhöhe, Geschwindigkeit etc. verändert werden kann