[[Vorlage(Getestet, focal, bionic)]] {{{#!vorlage Wissen [:Pakete installieren: Installation von Programmen] [:Terminal: Ein Terminal öffnen] [:Python:] }}} [[Inhaltsverzeichnis(3)]] [[Bild(Logo_Thorsten-Voice.jpg, 200, align=left, alt="Logo des Thorsten-Voice Projektes", title="Logo des Thorsten-Voice Projektes")]] [https://www.Thorsten-Voice.de Thorsten-Voice] {de} {en} ist ein 2019 gegründetes Projekt mit dem Ziel eine freie, qualitativ wertige, deutsche künstliche Stimme bereitzustellen, die einen natürlichen Sprachfluss bietet und offline (''ohne Cloud'') erzeugt werden kann. Die TTS Modelle wurden mittels Machine Learning auf Basis von tausenden Aufnahmen eines einzelnen männlichen Sprechers erstellt. Die zugrundeliegenden Audioaufnahmen stellt das Projekt ebenfalls unter einer offenen Lizenz zur Verfügung. Die künstliche Stimme kann per Weboberfläche oder per Kommandozeile erzeugt und als .wav Datei bereitgestellt werden. > [https://www.thorsten-voice.de/einfach-loslegen/ Audiobeispiele aller verfügbaren "Thorsten" TTS-Stimmen.] {de} = Thorsten TTS (Mozilla/Coqui) = Auf Basis von Mozilla / Coqui TTS wurden zwei TTS Varianten erzeugt. * Thorsten-DDC * Thorsten-VITS Beide Varianten bieten eine gute Qualität und einen recht natürlichen Sprachfluss. Thorsten-'''DDC''' wurde mit „[:eSpeak_NG:]“ als Phonemizer trainiert, während Thorsten-'''VITS''' [https://github.com/rhasspy/gruut Gruut] {en} verwendet. Welche Aussprachevariante besser gefällt ist eine persönliche Geschmacksfrage. === Installation === Als Voraussetzung müssen [:eSpeak_NG:] und [:Python:] in der Mindestversion 3.7 installiert sein. Die TTS-Installation wird per Python Paketmanager [:pip:] durchgeführt. [[Vorlage(Fremd, Software, "Python-Pakete über den den Paketmanager '''pip''' zu installieren, birgt Sicherheitsrisiken und kann zu Problemen mit anderen Python-Skripten führen. Näheres hierzu findet sich im Artikel [:pip:].")]] Installation des TTS Python Paketes: {{{#!vorlage Befehl pip install TTS==0.8.0 }}} Nach der Installation des Python TTS Paketes kann die Stimmerzeugung entweder per Kommandozeilenaufruf oder per lokaler Webanwendung durchgeführt werden. === Stimmerzeugung (Kommandozeile) === Thorsten-'''DDC''': {{{#!vorlage Befehl tts --model_name tts_models/de/thorsten/tacotron2-DDC --out_path output.wav --text "Hier bitte den zu sprechenden Text einfügen." }}} oder Thorsten-'''VITS''': {{{#!vorlage Befehl tts --model_name tts_models/de/thorsten/vits --out_path output.wav --text "Hier bitte den zu sprechenden Text einfügen." }}} {{{#!vorlage Tabelle <-2 tablestyle="width: 97%;" rowclass="titel"> Kommandozeilenparameter +++ Verfügbare Optionen Bedeutung +++ `model_name` tts_models/de/thorsten/tacotron2-'''DDC''' oder tts_models/de/thorsten/'''vits''' +++ `out_path` Verzeichnis und Dateiname der Audio (''WAV'') Ausgabedatei +++ `text` Zu sprechender Text +++ `use_cuda` "true" falls NVIDIA CUDA verfügbar ist (''bessere Performance'') }}} === Stimmerzeugung (Browser) === Der lokal lauffähige TTS-Webserver bietet die folgenden Möglichkeiten: * Stimmerzeugung per Webfrontend * Stimmerzeugung per API-Aufruf (cURL oder Python Modul) Start des TTS-Serverprozesses: {{{#!vorlage Befehl tts-server --model_name tts_models/de/thorsten/tacotron2-DDC }}} Anschließend kann die Webanwendung unter http://localhost:5002 aufgerufen werden. [[Bild(TTS-Server_Thorsten-Voice.png, 400, align=center, alt="Coqui TTS Server mit Thorsten-Voice TTS Modell", title="Coqui TTS Server mit Thorsten-Voice TTS Modell")]] Auf Basis des Server Prozesses kann auch ein [:cURL:] Aufruf verwendet werden: {{{#!vorlage Befehl curl -o ausgabe.wav http://localhost:5002/api/tts?text=Hallo. }}} === Stimmerzeugung (Python Anwendung) === Innerhalb einer Python Anwendung kann die Thorsten Stimme per [https://pypi.org/project/cTTS/ cTTS] {en} Modul erzeugt werden. Zuerst muss das Modul per pip Kommando installiert werden. {{{#!vorlage Befehl pip install ctts }}} {{{#!code python from ctts import cTTS cTTS.synthesizeToFile("output.wav", "Das ist ein Test.") }}} == Thorsten TTS (Mimic3) == [https://mycroft.ai/mimic-3/ Mimic3] ist die lokal lauffähige TTS Lösung von Mycroft AI die darauf ausgelegt ist, performante Ausgaben zu erzeugen – auch auf Geräten mit begrenzter Rechenkapazität wie einem Raspberry Pi. Allerdings geht die schnelle Erzeugung etwas auf Kosten der Qualität, so dass die Qualität etwas schlechter ist als bei den beiden oben genannten Modellen. Als Deutsche Stimme ist Thorsten-Voice ebenfalls verfügbar. === Installation === Es stehen verschiedene Methoden bereit Mimic3 zu installieren. Detaillierte Infos können der [https://mycroft-ai.gitbook.io/docs/mycroft-technologies/mimic-tts/mimic-3 Mimic3] {en} Dokumentation entnommen werden. Die folgenden Schritte zeigen die Installation über den Python Paketmanager (''pip''). {{{#!vorlage Befehl pip install --upgrade pip pip install mycroft-mimic3-tts[de] }}} === Stimmerzeugung === {{{#!vorlage Befehl mimic3 --voice de_DE/thorsten_low "Hallo Ubuntu Gemeinschaft." > output.wav }}} === Emotionale Aussprache === Im Rahmen von Mimic3 sind auch emotionale Ausprägungen von Thorsten-Voice verfügbar. Um ein emotionales Sprachergebnis zu bekommen muss folgender Aufruf verwendet werden. {{{#!vorlage Befehl mimic3 --voice de_DE/thorsten-emotion_low "Hallo flüsternde Ubuntu Gemeinschaft." --speaker 7 > output.wav }}} Folgende Tabelle zeigt die unterstützen Emotionen und den zugehörigen, im Befehl zu verwendenden, Wert. {{{#!vorlage Tabelle <-2 tablestyle="width: 97%;" rowclass="titel"> Emotionales Thorsten TTS +++ speaker Emotion +++ 0 Glücklich +++ 1 Wütend +++ 2 Angeekelt +++ 3 Betrunken +++ 4 Neutral +++ 5 Schläfrig +++ 6 Überrascht +++ 7 Flüsternd }}} = Links = * [https://www.Thorsten-Voice.de Webseite Thorsten-Voice] {de} {en} * [github:thorstenMueller/Thorsten-Voice:Github-Seite des Projektes] {en} * [https://www.youtube.com/channel/UCjqqTVVBTsxpm0iOhQ1fp9g Youtube Kanal des Projektes] {en} * [twitter:ThorstenVoice:Twitter Account] ##tag: Netzwerk, Ubuntu, System, Shell, Server, Multimedia, Kommunikation, Barrierefreiheit