NEWS
Sayit und AWS Neural Voice und SSML
-
Hallo,
weiß zufällig jemand, ob es möglich ist mit sayit die AWS Neural Voice und SSML zu nutzen?
Ich habe es bisher nicht geschafft....
-
@david-g du kannst das verwenden, was in der Instanz zur Verfügung steht
-
Das SSML habe ich ans laufen bekommen.
Bezüglich der Neural Voice werde ich mal ein Feature request auf machen.Scheinbar muss dort Amazon vom Adapter "nur" ein andere engine vorgegeben werden bei der Anfrage bei AWS.
Choosing the Voice Engine (CLI) To choose a voice engine (CLI) The engine parameter is optional, with two possible values: standard or Neural. Use this property when creating a SynthesisSynthesisTask operation. For example, you can use the following code to run the start-speech-synthesis-task AWS CLI command in the US West-2 (Oregon) region The following AWS CLI example is formatted for Unix, Linux, and macOS. For Windows, replace the backslash (\) Unix continuation character at the end of each line with a caret (^) and use full quotation marks (") around the input text with single quotes (') for interior tags. aws polly start-speech-synthesis-task \ --engine neural --region us-west-2 \ --endpoint-url "https://polly.us-west-1.amazonaws.com/" \ --output-format mp3 \ --output-s3-bucket-name your-bucket-name \ --output-s3-key-prefix optional/prefix/path/file \ --voice-id Joanna \ --text file://text_file.txt
-
Hab vor kurzem auch auf AWS Polly gewechselt und frage mich wie ich die Sprachgeschwindigkeit beeinflussen kann.
Hat jemand ein Tip für mich, bzw wo finde ich diese aufgeführte config?
-
Hier stehen denke die meisten Befehle.
https://docs.aws.amazon.com/de_de/polly/latest/dg/supportedtags.html
Die Geschwindigkeit habe ich noch nicht getestet.Bisher arbeite ich nur mit Pausen.
zB<speak><break time="1s"/>Der Trockner ist fertig. </speak>
EDIT:
In der Polly Hilfe steht folgendes Beispiel:<speak> In some cases, it might help your audience to <prosody rate="85%">slow the speaking rate slightly to aid in comprehension.</prosody> <speak
EDIT 2:
Das klappt bei mir. Habe immer eine Pause am Anfang, da die Bosebox den Ton einblendet.
<speak><break time="1s"/>Hier spreche ich normal.<prosody rate="50%">Jetzt rede ich langsamer.</prosody></speak>