NEWS
[Geloest]Slave regelmäßig nicht erreichbar
-
Hallo, ich betreibe iobroker auf einem Master mit 2 Slaves (alles Raspberry 3+). Alle Raspis sind per LAN angebunden. Ein Slave ist morgens grundsätzlich nicht erreichbar (steht im Master auf "offline"), manchmal reicht es wenn ich an dem Slave das LAN Kabel abziehe und neu verbinde, manchmal muss ich ihn hart neu starten (remote erreichbar ist er nicht).
Master: node.js 8.11.4 und npm 6.5.0
Beide Slaves haben node.js 8.11.1 und npm 6.5.0.Das Logfile vom Slave:
host.stromzaehler 2020-01-14 05:17:21.443 info instance system.adapter.modbus.0 started with pid 655 host.stromzaehler 2020-01-14 05:17:17.476 info instance system.adapter.tankerkoenig.0 started with pid 645 host.stromzaehler 2020-01-14 05:17:17.393 info starting 2 instances host.stromzaehler 2020-01-14 05:17:17.335 info 41 instances found host.stromzaehler 2020-01-14 05:17:16.757 info connected to Objects and States host.stromzaehler 2020-01-14 05:17:16.417 info ip addresses: 192.168.2.16 fd00::8dcb:f26d:4c6a:d91d fe80::ed27:71e8:b6cf:f50b host.stromzaehler 2020-01-14 05:17:16.408 info hostname: stromzaehler, node: v8.11.1 host.stromzaehler 2020-01-14 05:17:16.405 info Copyright (c) 2014-2019 bluefox, 2014 hobbyquaker host.stromzaehler 2020-01-14 05:17:16.377 info iobroker.js-controller version 2.1.1 js-controller starting
Danach hatte ich das LAN Kabel neu gesteckt und es lief auch wieder.
Was ich nicht verstehe ist, warum um 5:17 Uhr der js-controller und andere neu gestartet werden, die sollten doch eigentlich durchlaufen (?)
Hat hier jemand eine Idee woran das liegen könnte bzw ob das den Fehler erklärt ?
VG
Andreas -
@amg_666 das sieht nach Sicherung aus .. hast du den Backupit Adapter im einsatz der um diese Zeit läuft ?
-
@arteck Den Backitup hatte ich auch in Verdacht und daher zurzeit deaktiviert, das hat aber nichts gebracht.
-
@amg_666 hast du das komplette LOG
-
@arteck Ich hatte gestern abend backitup wieder aktiviert. Heue Nachmittag ist der Slave wieder weg gewesen, LAN Kabel raus-/reingesteckt, dann liefs wieder (das war um 18:36)
Log vom Slavesmartmeter.0 2020-01-15 18:42:51.512 info (718) Received 10 values, 3 updated tankerkoenig.0 2020-01-15 18:41:53.857 info (708) Reading data from tankerkoenig ... smartmeter.0 2020-01-15 18:41:50.718 info (718) Received 10 values, 3 updated smartmeter.0 2020-01-15 18:40:50.134 info (718) Received 10 values, 3 updated smartmeter.0 2020-01-15 18:39:48.922 info (718) Received 10 values, 3 updated smartmeter.0 2020-01-15 18:38:47.025 info (718) Received 10 values, 3 updated smartmeter.0 2020-01-15 18:37:45.922 info (718) Received 10 values, 3 updated backitup.2 2020-01-15 18:36:55.916 info (753) [iobroker] backup was activated at 02:31 every 1 day(s) backitup.2 2020-01-15 18:36:55.771 info (753) starting. Version 1.3.6 in /opt/iobroker/node_modules/iobroker.backitup, node: v8.11.1 tankerkoenig.0 2020-01-15 18:36:53.750 info (708) Reading data from tankerkoenig ... tankerkoenig.0 2020-01-15 18:36:53.677 info (708) Sync time set to 5 minutes or 300000 ms tankerkoenig.0 2020-01-15 18:36:53.632 info (708) starting. Version 2.0.6 in /opt/iobroker/node_modules/iobroker.tankerkoenig, node: v8.11.1 modbus.0 2020-01-15 14:50:28.263 info (735) Connected to slave 192.168.2.153 host.stromzaehler 2020-01-15 14:50:27.502 info instance system.adapter.backitup.2 started with pid 753 modbus.0 2020-01-15 14:50:26.363 info (735) starting. Version 3.0.0 in /opt/iobroker/node_modules/iobroker.modbus, node: v8.11.1 smartmeter.0 2020-01-15 14:50:25.825 info (718) Received 10 values, 10 updated smartmeter.0 2020-01-15 14:50:24.099 info (718) starting. Version 3.0.8 in /opt/iobroker/node_modules/iobroker.smartmeter, node: v8.11.1 host.stromzaehler 2020-01-15 14:50:23.634 info instance system.adapter.modbus.0 started with pid 735 host.stromzaehler 2020-01-15 14:50:19.492 info instance system.adapter.smartmeter.0 started with pid 718 host.stromzaehler 2020-01-15 14:50:15.491 info instance system.adapter.tankerkoenig.0 started with pid 708 host.stromzaehler 2020-01-15 14:50:15.448 info starting 4 instances host.stromzaehler 2020-01-15 14:50:15.417 info 41 instances found host.stromzaehler 2020-01-15 14:50:14.984 info connected to Objects and States host.stromzaehler 2020-01-15 14:50:14.774 info ip addresses: 192.168.2.16 fd00::8dcb:f26d:4c6a:d91d fe80::ed27:71e8:b6cf:f50b host.stromzaehler 2020-01-15 14:50:14.769 info hostname: stromzaehler, node: v8.11.1 host.stromzaehler 2020-01-15 14:50:14.767 info Copyright (c) 2014-2019 bluefox, 2014 hobbyquaker host.stromzaehler 2020-01-15 14:50:14.752 info iobroker.js-controller version 2.1.1 js-controller starting smartmeter.0 2020-01-15 14:56:16.153 info (1000) Received 10 values, 3 updated smartmeter.0 2020-01-15 14:55:13.796 info (1000) Received 10 values, 1 updated tankerkoenig.0 2020-01-15 14:54:15.843 info (644) Reading data from tankerkoenig ... smartmeter.0 2020-01-15 14:54:11.470 info (1000) Received 10 values, 3 updated smartmeter.0 2020-01-15 14:53:10.149 info (1000) Received 10 values, 3 updated smartmeter.0 2020-01-15 14:52:09.512 info (1000) Received 10 values, 1 updated smartmeter.0 2020-01-15 14:51:07.199 info (1000) Received 10 values, 5 updated smartmeter.0 2020-01-15 14:50:02.415 info (1000) Received 10 values, 1 updated
-
@amg_666 sagte in Slave regelmäßig nicht erreichbar:
LAN Kabel raus-/reingesteckt, dann liefs wieder
kann es sein, dass der mount (wenn das Backup aufs NAS geht) noch hing und durch die Zwangstrennung beendet wurde?
-
@Homoran Woran kann ich das sehen? Der hat sich heute nachmittag mal wieder abgemeldet und backitup steht auf 2:30 Uhr nachts. Ich hatte ja bacjkitup auch schonmal deaktiviert, das hat nix gebracht. Das Backup soll auf ein NAS gespeichert werden, das läuft über FTP.
-
@amg_666 sagte in Slave regelmäßig nicht erreichbar:
Ein Slave ist morgens grundsätzlich nicht erreichbar (steht im Master auf "offline")
Dann fangen wir mal neu an.
Was hat dieser Slave, das der andere nicht hat?Welche Adapter laufen da?
-
@Homoran Meine raspberrys stehen in meinem Arbeitszimmer (Host und Slave1). Slave2 der regelmäßig offline geht steht im Hausanschlussraum (wegen optischem Leser für den Stromzähler). Alle Raspis sind über einen Switch mit dem Router verbunden.
Auf dem Slave mit dem Problem laufen
backitup 1.3.6
modbus 3.0.0
smartmeter 3.0.8
tankerkoenig 2.0.6Auf dem anderen, der stabil läuft habe ich hauptsächlich Visualisierung drauf:
backitup 1.3.6
alexa2 2.6.4
cloud 2.8.0
daswetter 2.8.1
ical (4 Instanzen) 1.7.0
milight 0.3.6
vis 1.2.3 (plus diverse Bibliotheken) -
@amg_666 sagte in Slave regelmäßig nicht erreichbar:
backitup 1.3.6
Warum läuft backitup auf dem slave?
Sämtliche Informationen für eine Instanz, die auf dem Slave läuft, liegen auf dem Master (states, objects).
Ein Backup des Masters enthält auch alle Kofigurationen der Slave-Instanzen.Vom slave aus, muss backitup sich alle Informationen vom Master holen.
Ich kann mir vorstellen, dass er sich dabei verschlucken könnte. -
@Homoran Ich habe backitup auf dem Master installiert, aber auf jedem Raspi eine Instanz installiert. Das ist falsch und das "Master Backup" beinhaltet alle Slaves? War mir nicht bewusst, ich würde dann mal die Instanzen auf den Slaves löschen und schaun was dann passiert, richtig?
-
@amg_666 sagte in Slave regelmäßig nicht erreichbar:
Das ist falsch und das "Master Backup" beinhaltet alle Slaves?
So habe ich das verstanden - vielleicht erhellt @simatec uns da mal.
-
@Homoran
Mein Wissenstand ist auch so, dass der Master den Slave mit sichert.
Da der Backup Prozess ein Teil vom js-controller ist, wäre es Interessant, was @apollon77 und/oder @Bluefox dazu sagen können. -
Also Objects und States und Files sollte passen weil die einfach aus der DB gelesen werden vom Master und damit sollte das egal sein wo es ausgeführt wird. Alles was natürlich ggf noch aus anderen "lokalen Verzeichnissen" mit gesichert wird ist natürlich ggf anders.
Ansonsten: testet es doch mal. Führt iobroker backup auf maste rund slave aus und vergleicht das erstellte tar.gz vom Inhalt und den Dateigrössen her
-
@apollon77 Hallo, ich hab jetzt mal stichprobenartig in die Backups vom Master und vom Slave reingeschaut. Auf dem Slave läuft Smartmeter und ich habe in den Sicherungen nach den Einstellungen (Baudrate etc) gesucht und die ist in beiden Sicherungen abgelegt. Von daher würde ich auch annehmen, dass das so passt und das ich nur eine backitup Instanz auf dem Master brauche ("lokale" Dateien/Verzeichnisse habe ich nicht).
@Homoran Leider ist das Grundproblem weiter vorhanden. Ich werde mal in einer Mußestunde den Slave komplett neu und sauber aufsetzen und danach nochmal Feedback geben.
-
@amg_666 sagte in Slave regelmäßig nicht erreichbar:
iter vorhanden. Ich werde mal in einer Mußestunde den Slave komplett neu und sauber aufsetzen und danach nochmal Feedback geben.
Bitte mal js-controller 2.2.7 versuchen, da sind fixes für Reconnection Themen von Adaptern/Slaves zum Master drin
-
AAAARGH . kann es sein, dass der Fehler (Verlust der Verbindung zum Slave) garnicht am Slave liegt, sondern am Master? Mir ist aufgefallen, dass die grüne LED am Master sporadisch sehr lange Zeit an ist (Zeichen für Zugriffsprobleme auf die Speicherkarte), die Karte ist aber neu. Ich habe dann nochmal alle Instanzen gecheckt: der ical Adapter läuft dort mit 4 Instanzen, die alle zur gleichen Zeit per Cron gesteuert werden. Nachdem ich das vorgestern so geändert habe, dass die 4 Instanzen "konfliktfrei" gescheduled werden, scheint alles stabil zu laufen...
-
@amg_666 also seit Controller 2.0 sollte auch so ein „zur gleichen Zeit gescheduled“ weniger problematisch sein weil die mir 4s Abstand gestartet werden. Vllt noch alter controller?
Aber ja. Sehr hohe Last auf dem Master kann ggf slaves beeinträchtigen. Hier hilft die 2.2.7 vom Controller die Probleme zu verhindern
-
@apollon77 Ich hab jetzt mal alle Systeme auf js-controller 2.2.7 upgedatet (ich hatte aber vorher aber schon eine 2er Version drauf). Das beobachte ich jetzt mal ein paar Tage und gebe dann nochmal Feedback und stelle meinen Post ggf auf gelöst. Vielen Dank für die Unterstützung!
Update: Scheint jetzt stabil zu sein, seit 3 Tagen keinerlei Aussetzer/Probleme