Purple DS Text To Speech

Geändert am Thu, 30 Jul 2020 um 02:39 PM

Allgemeine Informationen

Wenn eine PDF Ausgabe mit Hilfe des XML Workflows für einen Readmode verarbeitet worden ist, haben Sie zusätzlich die Möglichkeit einen Vorlesemodus dazuzuschalten. So können sich die Leser die komplette Ausgabe oder einzelne Artikel auf Wunsch vorlesen lassen. 


Purple DS nutzt hier die aktuellsten Sprachalgorithmen von Amazon Polly





Voraussetzungen


Hauptvoraussetzung ist, dass für Ihre Publikation ein XML basierter Lesemodus eingerichtet ist. 

Sollten Sie Purple DS TTS (Text To Speech) nutzen wollen, ist außerdem zu klären, ob eine Verarbeitung über den AWS Account von Sprylab oder Ihren eigenen AWS Account erfolgen soll.


Verarbeitung durch Sprlyab

Neben den einmaligen Einrichtungsgebühren und den Umwandlungskosten auf Amazons Seite fällt bei einer Verarbeitung durch Sprylab eine Servicepauschale an


Eigene Verarbeitung

Sollten Sie einen eigenen AWS (Amazon Web Service) Account besitzen fallen neben den einmaligen Einrichtungsgebühren und den Umwandlungskosten auf Amazons Seite keine weiteren Kosten an.


Um die fehlerfreie Funktion zu testen benötigen wir in diesem Fall noch folgende Informationen: 


  • Access Key und Secret Key eines API-Nutzers, der sowohl die Rechte hat, Polly zu nutzen als auch auf S3 die nötigen Operationen durchführen kann, zum Beispiel AmazonPollyFullAccess 
  • Bucket Name, Bucket Region und den Prefix (Pfad im Bucket) unter dem die Files abgelegt werden sollen und der Public Access erlaubt.

Anleitung


Der Vorlesemodus wird automatisiert auf Basis der XML-Daten des Lesemodus erstellt. Für die Einrichtung werden daher nur wenige zusätzliche Informationen benötigt. 


Auswahl der Stimmen

Je nach Sprache hat man als Kunde die Möglichkeit aus mehreren Sprachen auszuwählen. Vor einer Verarbeitung muss von Ihnen festgelegt werden, welche Stimme genutzt werden soll. 


Eine Übersicht der verfügbaren Stimme pro Sprache finden Sie hier.


Anpassung des Aussehens

Neben den Farbeinstellung, die optimalerweise aus dem Styling des Readmodes übernommen werden sollte, gibt es die Möglichkeit die im TTS verwenden Icons anzupassen.


Diese sind


  • TTS Symbol: Standard Kopfhörer
  • Sprecherauswahl: Standard Avatar Frau/Mann
  • Vorlesegeschwindigkeit: Standard Tachometer



Optimierung des Vorlesemodus


Der Vorlesemodus liefert eine sehr gute Qualität mit korrekter Aussprache der meisten Begriffe. 

Falls Sie trotzdem bei bestimmten Worten wie z.B. Eigennamen eine andere Aussprache wünschen, kann auch diese berücksichtigt werden. 


Bitte informieren Sie uns, wenn Sie solche Verbesserungen wünschen, damit wir die Umsetzung koordinieren können.


Zur Umsetzung benötigen wir die betroffenen Begriffe oder Namen zusammen mit der phonetischen Lautschrift der gewünschten Aussprache. Verwendet wird hierbei das Internationale phonetische Alphabet (IPA).


Damit wir die Optimierungen verarbeiten können, benötigen wir diese in Form einer Textdatei die sie mit einem Editor wie Brackets oder Phase5 erstellen können. Pro Zeile kann einem einzelnen Begriff die passende Lautschrift zugewiesen werden. Dh. Vor- und Nachnamen sind getrennt anzugeben. 

Zusätzlich sollte auch darauf geachtet werden, dass auch die häufigsten Schreibweisen und Deklinationen in der Datei aufgeführt werden. 


Der Aufbau einer Zeile ist wie folgt: <Begriff>=<Lautschrift> 


Ein Beispiel: Hier soll die Aussprache des Namens Peter Müller verbessert werden. In der Textdatei finden sich also folgende Einträge: 


Peter=ˈpeːtɐ

PETER=ˈpeːtɐ

Peters=ˈpeːtɐs

PETERS=ˈpeːtɐs

Müller=ˈmʏlɐ

MÜLLER=ˈmʏlɐ

Müllers='mʏlɐs

MÜLLERS='mʏlɐs



War dieser Artikel hilfreich?

Das ist großartig!

Vielen Dank für das Feedback

Leider konnten wir nicht helfen

Vielen Dank für das Feedback

Wie können wir diesen Artikel verbessern?

Wählen Sie wenigstens einen der Gründe aus
CAPTCHA-Verifikation ist erforderlich.

Feedback gesendet

Wir wissen Ihre Bemühungen zu schätzen und werden versuchen, den Artikel zu korrigieren