NEWS
Rhasspy Offline Sprachsteuerung
-
Wie bereits angekündigt stelle ich nun mal meine Lösung vor und habe noch ein Paar Fragen wie Ihr gewisse Dinge gelöst habt.
Die Übergabe der JSON an ioBroker erfolgt nun doch wieder über MQTT.
(Nachdem ich meinen ioBroker komplett neu installiert habe gab es keinen Fehler mehr )Das Skript kann aktuell die folgenden Aufgaben übernehmen
- Objekt in einem bestimmten Raum schalten
- Objekt ohne den Raum schalten.
In diesem Fall wird zuerst im Raum in dem der rhasspy steht nach dem Objekt gesucht
Falls im Raum kein Objekt mit diesem Namen gefunden wurde wird global danach gesucht
Wenn es global nur ein Objekt gibt wird dieses geschalten.
sentences.ini
[changeLightRoom] ([schalte] | [mach]) ([das] | [die]) ($objects){objectName} [im] ($rooms){room} ($states){state} [changeState] ([schalte] | [mach]) ([das] | [die] | [den]) ($objects){objectName} ($states){state}
sentences.ini
[changeLightRoom] ([schalte] | [mach]) ([das] | [die]) ($objects){objectName} [im] ($rooms){room} ($states){state} [changeState] ([schalte] | [mach]) ([das] | [die] | [den]) ($objects){objectName} ($states){state}
slot - objects
Highboard Stehlampe Bett Herd Licht Spiegel Wohnwand Indirekte Licht Spüle Schrank blablabla
slot - rooms
Schlafzimmer Küche Klo Büro Esszimmer Bad Wohnzimmer
slot - states
ein an aus
Durch diese Definition sind alle Daten die später vom Skript verarbeitet werden in Slots.
Das Herzstück des ganzen ist das Javascript.
Der Code ist kommentiert, hoffe meine Kommentare sind nicht zu verwirrend.//########################################################################## // Rhasspy-intents via MQTT empfangen und entspr.Datenpunkte setzen/schalten //########################################################################## let http = require('http'); /* Definition meiner Räume und der jeweiligen Objekte darin Die Struktur sieht dabei wie folgt aus. Im Intent der übermittelt wird sind sowohl der Raum Name als auch der Objektname als Slot enthalten. Beide werden dann vom Skript verwendet um den korrekten Datenpunkt herauszufinden. */ const rooms = { "Büro": { "Licht": "sonoff.0.ShellyV1_13.POWER", }, "Wohnzimmer": { "Licht": "sonoff.0.ShellyV1_06.POWER", "Stehlampe": "OwnDevices.0.433mhzPlugs.10011.PlugC", "Wohnwand": "OwnDevices.0.433mhzPlugs.10011.PlugB", "Rollo": "" }, "Bad": { "Licht": "sonoff.0.ShellyV1_05.POWER", "Spiegel": "sonoff.0.ShellyV1_11.POWER", "Indirekte Licht": "sonoff.0.SonoffBasic_02.POWER" }, "Esszimmer": { "Licht": "sonoff.0.ShellyV1_03.POWER", "Highboard": "sonoff.0.SonoffS26_3.POWER" }, "Küche": { "Licht": "hm-rpc.1.000858A9960E7A.4.STATE", "Spüle": "sonoff.0.ShellyV1_02.POWER", "Herd": "sonoff.0.ShellyV1_01.POWER" }, "Schlafzimmer": { "Licht": "sonoff.0.ShellyV1_09.POWER", "Schrank": "sonoff.0.ShellyV1_10.POWER", "Bett": "sonoff.0.SonoffBasic_01.POWER", "Rollo": "" }, "Klo": { "Licht": "sonoff.0.ShellyV1_04.POWER" } } //In diesem json werden nötige Informationen zu allen rhasspys abgelget. const rhasspySites = { "testpi": { room: "Büro", host: "testpi.angl.loc", httpPort: "12101" } } //************************ Functions ********************* //Mit dieser Funktion werden Strings in einen Boolschen Wert umgewandelt //Wenn der Wert in 'trueValues' enthalten ist wird 'true' zurückgegeben. //Wenn nicht, wird 'false' zurückgegeben function convertStateToBool(state) { const trueValues = ['ein', 'an']; return trueValues.includes(state); } //Reukursives durchsuchen eines JSON Objektes //© https://gist.github.com/shakhal/3cf5402fc61484d58c8d function findValues(obj, key) { return findValuesHelper(obj, key, []); } //Reukursives durchsuchen eines JSON Objektes //© https://gist.github.com/shakhal/3cf5402fc61484d58c8d function findValuesHelper(obj, key, list) { if (!obj) return list; if (obj instanceof Array) { for (var i in obj) { list = list.concat(findValuesHelper(obj[i], key, [])); } return list; } if (obj[key]) list.push(obj[key]); if ((typeof obj == "object") && (obj !== null)) { var children = Object.keys(obj); if (children.length > 0) { for (i = 0; i < children.length; i++) { list = list.concat(findValuesHelper(obj[children[i]], key, [])); } } } return list; } //Generiert ein JSON-Objekt mit allen wichtigen Informationen für die Funktionen im Skript. //Dies dient vor allem dazu den späteren Code lesbarer zu machen. //Beisipel Ergebnis /* { "slots":{ "objectName":"Stehlampe", "state":"aus" }, "intentName":"changeState", "siteId":"testpi" } */ function extractIntentData(message) { const parsedMessage = JSON.parse(message); let extractedJSON = {}; extractedJSON.slots = {}; extractedJSON.intentName = parsedMessage.intent.intentName; extractedJSON.siteId = parsedMessage.siteId; parsedMessage.slots.forEach(slot => { extractedJSON.slots[slot.slotName] = slot.value.value; }); return extractedJSON; } //Damit kann jeder Rhasspy sprechen function speakRhasspy(text, rhasspySiteId) { console.log(rhasspySiteId); const rhasspy = rhasspySites[rhasspySiteId]; const options = { host: rhasspy.host, port: rhasspy.httpPort, path: "/api/text-to-speech", method: 'POST', headers: { 'User-Agent': 'ioBroker', 'Content-Type': 'text/plain', } } let req = http.request(options); req.on('error', function (e) { console.error('ERROR: ' + e.message, "warn"); }); req.write(text); req.end(); } //In dieser Variablen werden alle Funktionen gepsiechert die später aufgerufen werden. //Dies dient dazu den anfallenden Code zu minimieren. //Die Funktionen haben immer den selben Namen wie die Intents in rhasspy und werden auch darauf basierend aufgerufen. const callFunctions = { //Ändert den Wert eines ioBroker Datenpunktes in einem bestimmten Raum. changeLightRoom: function (json) { const objectName = json.slots.objectName; const roomName = json.slots.room; const state = convertStateToBool(json.slots.state); //Nur wenn alle 3 Werte vorhanden sind wird der Zustand geändert if (typeof roomName != 'undefined' && typeof state != 'undefined' && typeof objectName != 'undefined') { const room = rooms[roomName]; if (typeof room != 'undefined') { const lightId = room[objectName]; if (typeof lightId != 'undefined') { setState(lightId, state); } else { speakRhasspy(`Ich konnte ${objectName} nicht finden`, json.siteId); console.warn(`can not find object '${objectName}' in room '${roomName}'`); } } else { speakRhasspy(`Ich konnte den Raum ${roomName} nicht finden`, json.siteId); console.warn(`can not find room '${roomName}' in list of rooms`); } } else { speakRhasspy(`Etwas ist schief gelaufen`, json.siteId); console.warn(`rhasspy intent '${json.intentName}' from '${json.siteId}' slots not complete | room = '${roomName}' | state = '${state}' | objectName = '${objectName}'`); } }, //Ändert des Wert eines ioBroker Datenpunktes auf Basis des Raumes in welchem der Rhasspy sich befindet. //Wenn in diesem Raum kein objekt mit diesem Name ist wird rekursiv in allen Räumen danach geuscht. //Wenn dann nur ein Objekt mit diesem Namen gefunden wird, wird dieses geschalten. changeState: function (json) { const objectName = json.slots.objectName; const state = convertStateToBool(json.slots.state); const site = rhasspySites[json.siteId]; const room = rooms[site.room]; let lightId = room[objectName]; if (typeof lightId === 'undefined') { //Prüfen ob es mehr als ein Objekt mit diesem Namen gibt const objects = findValues(rooms, objectName); if (objects.length === 1) { lightId = objects[0]; } else if (objects.length > 1) { speakRhasspy(`Es gibt mehrere Objekte mit dem Namen ${objectName}`, json.siteId); console.warn(`rhasspy intent '${json.intentName}' from '${json.siteId}' - more than one object found with name '${objectName}'`); } else { speakRhasspy(`Ich konnte ${objectName} nicht finden`, json.siteId); console.warn(`rhasspy intent '${json.intentName}' from '${json.siteId}' - no object found with name '${objectName}'`); } } if (typeof lightId != 'undefined' && typeof state != 'undefined') { setState(lightId, state); } else { speakRhasspy(`Etwas ist schief gelaufen`, json.siteId); console.warn(`rhasspy intent '${json.intentName}' from '${json.siteId}' slots not complete | lightId = '${lightId}' | state = '${state}'`); } } } //************************ Functions ********************* //************************ Events ************************ //Wird beim auslösen jedes Intents getriggert on({ id: /mqtt\.0\.hermes\.intent\..*/, change: "any" }, function (obj) { const extractedJSON = extractIntentData(obj.state.val); const intentName = extractedJSON.intentName; const callFunction = callFunctions[intentName]; if (typeof callFunction != 'undefined') { callFunction(extractedJSON); } else { console.error(`Rhasspy: Funktion ist nicht definiert --> Fehler bei Intent ${intentName}`); } }); //************************ Events ************************
Würde mich freuen wenn Ihr mal eure Meinung dazu sagt
Außerdem habe ich noch ein paar Fragen.
- Mit welchen Wakword System arbeitet Ihr? Ich bekomme Smowboy nicht zum laufen
- Welches text-2-speach System nutzt ihr? Bei Espeak hört sich das total schlecht an und wirkt als ob es englisch ist.
- Habt Ihr Musikdienste wie Spotify und oder Radio eingebunden?
Liebe Grüße und schöne Wochenende
-
Servus, ich hab das System jetzt auch seit ein paar Wochen am laufen. Ich hab jetzt allerdings noch nicht besonders viel Erfahrung sammeln können...
-
Ich nutze das Porcupine Wakeword, Snowboy hat bei mir am Anfang funktioniert bis ich einmal das Wakeword ändern wollte, dannach kommt ein Timeout und Snowboy geht seitdem bei mir auch nicht mehr. Das ganze geht relativ gut mit Porcupine, allerdings habe ich wenn der Tv läuft, doch immer wieder, das die Steuerung anspringt und manchmal sogar was erkennt und schaltet obwohl weder Wakeword noch was enstprechendes zum ausführen gesagt wurde. Komisch ist wenn ich, die Tv Sendung zurück "spule" und die gleiche Passage neu abspiele es beim zweiten mal nicht mehr passiert... Das nervzt mich immo noch ein bisschen. Hab da schon mit der Empfindlichkeit experimentiert aber wirklich ändern tut sich da leider nichts.
-
text2speach nutze ich aktuell noch nicht da ich die Sprachsteuerung 99% als Eingabemedium nutzen möchte und nicht zugelabert werden will. Vielleicht ändert sich das aber noch
-
Ich hab immo mein Heos System eingebunden aber nur um die Lautsprecher ein und ausschalten zu können, Playlists etc. mach ich darüber (noch) nicht. Das sollte mit Spotify auch klappen, hab ich jetzt aber noch nicht getestet.
LG schönen Sonntag
-
-
-
@LichtAn
Bei mir ist es genauso.Habe einen Fehler aus GitHub aufegmacht.
https://github.com/rhasspy/rhasspy/issues/86 -
@Xsev @LichtAn
Habe den Fehler mit snowboy gefunden.
Wenn die Datei, welche in der profile.json angegeben wird nicht vorhanden ist, startet der snowboy Dienst nicht.
Dann kommt der Fehler.
Ich habe die profile.json angepasst und dort den Namen meiner Datei angegeben.
Nach einem neustart des docker containers funktionierte alles einwandfrei.profile.json
... "wake": { "snowboy": { "model": "computer.pmdl" }, "system": "snowboy" } } ...
-
@DerT Spitze!!
Das probier ich die Tage gleich mal aus. Danke für die Info!! -
Ich habe jetzt auch mal eine Computer.umdl unter /home/pi/.config/rhasspy/profiles/de/snowboy angelegt und dann den Part in der profile.json auf dein Bsp. mit computer angepasst.
Docker neu gestartet und siehe da es geht. Er rennt nicht mehr in einen Timeout. Ich kann jetzt auf Refresh klicken und er zeigt mir auch die Liste mit Wakewords.
ABER keines der Wakewords funktioniert. Sobald ich z.B. auf snowboy zurück schalte und ein Wort aus der Liste auswähle passiert nix mehr. Schalte ich auf porcupine zurück dann geht die Spracherkennung sofort wieder.
Beim mitlerweile bei der Version 2.5.5 von Rhasspy.
-
@LichtAn
Bei mir war das Timeout Problem nach dem Update auf 2.5.5 verschwunden, allerdings geht bei mir auch kein anderes Wakeword außer Snowboy selbst. -
Ja komisch aber das ganze ist schon noch ein rechtes gebastel.
Aber es scheinen sich ja auch leider kaum Leute für eine Cloudfreie Sprachsteuerung zu interessieren. -
@LichtAn Ich bastel auch immer noch. Habe soweit alles theoretisch und praktisch am laufen, auch mit Blockly und der SprachAUSgabe.
Was mich stört sind immer so Kleinigkeiten, wie z.B. die nicht anpassbare Lautstärke der Bestätigungstöne.
Einfach anpassen und austauschen in einem Dockercontainer ist ja schon fast ein Kunstgriff und habe ich verworfen.
Ich habe dann Rhasspy direkt sprich ohne Docker installiert, nun habe ich eine Handvoll anderer Probleme.
Leider ist Snips offensichtlich immer noch (für mich) ohne Alternative... Bin schon fast soweit mit einen Echo zu kaufen.VG
LeifUpdate:
An einer Lautstärkeanpassung des "Beep" wird gearbeitet. -
ein Amazon oder Google Teil kommen mir nicht ins Haus. Lieber stampfe ich das Sprachsteuerungsprojekt ein. Auch wenn mir bewusst ist das die Bastelei dann deutlich weniger wäre. Ich bleibe Cloudfrei.
Hab jetzt eine neues Probem. Bis jetzt hat sich meine Frau geweiget das Teil zu benutzen. Am WE hat wollte sie es ausprobieren und dann sind wir draufgekommen das der SNOWBOY sie nicht versteht Er regiert gar nicht erst.
So muss ich mich jetzt wenigstens mal wieder mit den Wakewords beschäftigen. Da mir Snowboy im Wohnzimmer auch zu oft falsch erkennt.
@capitaenz @Xsev Was verwendet ihr den aktuell für Wakewords ?
BTW seit gestern gibts anscheinend Rhasspy 2.5.6 zum download.
-
@LichtAn Ich hab Porcupine und grad mit Fraule getestet (wenn auch widerwillig, also das Fraule nicht die Sprachsteuerung...) geht das bei uns beiden.
Falsch erkannte Wakewords hab ich leider auch immer noch, mittlerweile seltener aber immer noch zu viel für meinen Geschmack...
2.5.6 hab ich noch nicht getestet, evtl. die Tage. -
@LichtAn said in Rhasspy Offline Sprachsteuerung:
@capitaenz @Xsev Was verwendet ihr den aktuell für Wakewords ?
Verwende Snowboy, bin über die Testphase nicht hinaus.
Auf meine Frau reagiert es auch nicht. -
Mein größtes Problem ist ebenfalls die korrekte Wakeword-Erkennung.
Ich habe so ziemlich alles durch:
Anderes Micro probiert,
Snowboy mit den verschiedensten Wakewords und Sensitivities ( auch selbst erstellte ).
Letzendlich bin ich jetzt bei Porcupine mit Wakeword "blueberry" gelandet.Aber das Gelbe vom Ei ist das auch noch nicht.
Es passieren - zwar recht selten - immer noch false-Erkennungen und bei meiner Frau reagiert es machmal auch nicht.
Ich habe bzgl. Rhasspy jetzt schon eine Weile nichts mehr gemacht, bin auch noch bei Rhaspy V 2.5.0 -
@LichtAn
danke für die Anleitung. Hier noch mal mein Problem: Ich bekomme den Respeaker nicht wirklich ans Laufen.
Ich habe einen Raspberry Pi 4 mit dem Respeaker 4 Seeed. Das System ist fast frisch, fast nichts installiert. Ich bin nach deiner Anleitung vorgegangen, außer, dass ich die Version 2.5.6 gleich installiert habe. Das problem scheint, dass Raspberry den Respeaker nicht wirklich erkennt. Klicke ich mit der rechten Maustaste oben auf das Audiosymbol, wird mir kein Input angezeigt, für den Output wird der Respeaker angezeigt, aber es steht dann "no volume control..."
Noch eine Frage zur Anleitung (export PATH="/home/pi/.local/bin:$PATH" )
Muss ich hier etwas ändern, also einen Pfad angeben und wie würde dies z.B. aussehen? Vielen Dank für eure Hilfe!!! -
@jwerlsdf sagte in Rhasspy Offline Sprachsteuerung:
Hast du den Pixel_Ring Treiber ohne Fehlermeldung im Log installieren können ?
Kam bei der hlc Treiber installation irgendwelche Fehler ?
Und hast du in der Config den SLI aktiviert ?
Unter welchem Benutzer hast du installiert ? Ich habe normal immer meinen eigenen Benutzer angelegt. Aber ich habe es selbst nur unter dem Standard User Pi zum laufen bekommen. Is bestimmt irgend eine Rechte Sache.
Für den User Pi ist der Pfad so richtig. Du machst diese Eintrag damit Programme ausgeführt werden dürfen, hier der pixel_ring, nur durch Aufruf des Datei Names sonst musst du immer den kompletten Pfad mit Programmnamen eintippen.
BTW was meinst du denn mit Audio Symbol ?
-
@LichtAn
ich muss noch dazu sagen, dass ich die Desktop Version habe. Dort gibt es, wie bei Windows ein Audio-Symbol.
Standardnutzer ist Pi. Habe ich auch so gelassen.
SLI ist unter sudo raspi-config aktiviert.
Ich bin nun jetzt so weit, dass wohl der Respeaker funktioniert. Ich darf wohl nicht in den Audioeinstellungen nicht auf den Respeaker klicken, sondern muss es auf Analog lassen.
Das Wakeword habe ich auf Porcupine geändert. Damit geht es nun halbwegs.
Nun noch folgende Frage:
Wie bekomme ich nun z.B. das Licht ausgeschaltet. Ich habe das mit dem Rollladen probiert, aber ich bekomme einen Fehler im iobroker:{"siteId": "default", "sessionId": "default-porcupine-7ad89984-1b95-4409-b9e7-4e88e64b49e8", "lang": null, "stopOnSilence": true, "sendAudioCaptured": true, "wakewordId": "porcupine", "intentFilter": null}
Woran könnte das liegen?
Weiterhin geht das Wakeword nicht und manchmal geht es:{"siteId": "default", "sessionId": "ce0f80d9-b586-4526-a073-12d5a197b67e", "lang": null, "stopOnSilence": true, "sendAudioCaptured": true, "wakewordId": null, "intentFilter": null}
Weiterhin habe ich im iobroker bei Objekte keinen "intent" Ordner.
-
@jwerlsdf sagte in Rhasspy Offline Sprachsteuerung:
8e64b49e8", "lang": null, "stopOnS
wie schaut denn deine sentences.ini im Rhasspy aus ?
Und welche Ordner hast du im iobroker unter mqtt.0.hermes stehen ?
-
@LichtAn said in Rhasspy Offline Sprachsteuerung:
folgende Ordner habe ich:
asr
nlu
infoso sieht die Datei aus:
-
Was steht den unter
mqtt.0.hermes.nlu.intentNotRecognizedwenn du z.B. sagst "schalte rolladen aus"
Das sollte dann ca. so aussehen.
{"input": "schalte rolladen aus", "siteId": "default", "id": null, "customData": null, "sessionId": "default-snowboy-764567-1063-4e56-9999-16774ab26140"}
Da stehen die Befehle drin die nicht zugeordnet werden können. Wenn der wert aktualisiert wird geht auf jeden Fall deine Verbindung vom iobroker zum MQTT auf dem Rhasspy.
Ach ja wenn er sonwboy nicht erkennt schalte mal auf Porcupine um.