Navigation

    Logo
    • Register
    • Login
    • Search
    • Recent
    • Tags
    • Unread
    • Categories
    • Unreplied
    • Popular
    • GitHub
    • Docu
    • Hilfe
    1. Home
    2. Deutsch
    3. ioBroker Allgemein
    4. Ausfallsicherung

    NEWS

    • Neuer Blog: Fotos und Eindrücke aus Solingen

    • ioBroker@Smart Living Forum Solingen, 14.06. - Agenda added

    • ioBroker goes Matter ... Matter Adapter in Stable

    Ausfallsicherung

    This topic has been deleted. Only users with topic management privileges can see it.
    • S
      Smartin @Armilar last edited by

      @armilar
      Ich hatte das in 3 Jahren bisher 3x, sonst läuft meine Installation wirklich geschmeidig.
      Einmal hatte sich tatsächlich nur der admin.0 Adapter weggehängt, 2x hat es den ganzen Raspi gerissen. Keine Einträge mehr im syslog bis zum Neustart. Beide Male habe ich anhand der Logs und den Vorgängen vorher nicht herausgefunden woran es lag, habe aber auch nachdem es danach wieder rund und ausdauernd lief nicht mehr viel nachgeforscht.
      Meiner Frau den Stecker zeigen ist übrigens die schlechteste alle Möglichkeiten 😳 Wenn irgendetwas ihrer Meinung nach dann nicht funktioniert, zerrt sie schon am Stecker bzw. drückt sie schon den Schalter 😁
      Nee nee ... lieber nicht.
      Automatisiert wäre mir da wohler ...

      @emil70
      Der Pi hängt an einer schaltbaren Steckdose (Sonoff). Ich habe als "anderes System" nur den RasPi Zero der als ioBroker Slave läuft. Wie könnte ich denn da ein solches script laufen lassen?
      Mit einer 2. Instanz vom js-Adapter? Läuft das denn nicht auch über den Master, der ja dann nicht erreichbar ist?

      @Wildbill
      Das System läuft stabil, da ist nix zu fixen. Wie schon erwähnt, es soll nur eine schnelle Hilfe sein, falls doch mal was unrund läuft. Und bisher hatte ein Neustart (wenn eben auch einer der harten Sorte) ausgereicht um wieder alles am laufen zu haben.
      Wenn dadurch mein System mal komplett abkac.en sollte, die SD abraucht oder sonstwie, wird das System mit Backups eben wieder schnell neu aufgesetzt. Sicher, es soll laufen (tut es ja auch stabil), aber wenn, dann hat bei mir zumindest ein kurzer Stromreset noch nie geschadet. Sollte es mal anders kommen .... Cést la vie und schnell behoben. Trotzdem hast du natürlich völlig Recht, ich schaue mir auch jeden Ausfall genau an und sollten dort Probleme auftauchen werde ich die natürlich primär lösen.

      Armilar E 2 Replies Last reply Reply Quote 0
      • Armilar
        Armilar Most Active Forum Testing @Smartin last edited by Armilar

        @smartin
        na 3x in 3 Jahren. Ziehen wir mal den admin.0 ab.

        Dann gibt es alle 1,5 Jahre mal gemecker... Da würde ich auch nicht viel investieren

        Eine zweite JS-Instanz kann schon Sinn machen. Nutze die auch zum Testen, da beim kompilieren globaler TS-Skripte ein JS-Neustart ja vorprogrammiert ist. Auf einer weiteren Instanz läuft dann ein Watchdog.

        function createNotification(notificationText) {
            sendTo("telegram", "send", {text: notificationText});
        }
          
        on({id: /^system\.adapter\..+\.alive$/, change: 'ne', val: false}, function (dp) {
            var id = dp.id.split('.');
            id = 'system.adapter.' + id[2] + '.' + id[3];
            var instance = getObject(id);
            var ignoreList= ["dwd.0 alive", 
                             "ical.0 alive", 
                             "ical.1 alive",
                             "knmi-weather.0 alive",
                             "weatherunderground.0 alive",
                             "pegelalarm.0 alive", 
                             "openweathermap.0 alive",
                             "uv-protect.0 alive",
                             "luftdaten.0 alive",
                             "odl.0 alive",
                             "daswetter.0 alive",
                             "followthesun.0 alive",
                             "feiertage.0 alive",
                             "coronavirus-statistics.0 alive"];
        
            if (!ignoreList.includes(dp.common.name) && instance.common.enabled) {
                createNotification(dp.common.name);
                console.log(dp.common.name);
            }
        });
        

        Erzählt immer fleißig was an Instanzen Probleme hat.

        1 Reply Last reply Reply Quote 1
        • E
          emil70 @Smartin last edited by emil70

          @smartin

          Ich lass meine Sonoff mit der Software überwachen, ob sie online sind. Wenn nicht werden sie neu gestartet.


          #!/bin/bash

          check and log if a host is reachable by ping

          #CONFIGURATION

          #IP of host
          GERAET=Buerobeleuchtung
          WATCH_IP="192.168.178.40"
          #path to logfile
          LOGFILE="/var/log/Sonoff/Buerobeleuchtung.log"
          #duration between pings
          PAUSE=60
          #how many failed pings before log
          TESTS=10

          #SCRIPT

          #initialize
          MISSED=0
          #touch $LOGFILE

          #-lt = lesser than = kleiner als
          #-eq = equal = Gleichheit
          #-ne = not equal = Ungleichheit
          #-le = lesser or equal = kleiner oder gleich
          #-ge = greater or equal = größer oder gleich
          #-gt = greater than = größer als

          while true; do
          if ! ping -c 1 -w 1 $WATCH_IP > /dev/null; then echo $MISSED
          ((MISSED++))
          else
          if [ $MISSED -ge $TESTS ]; then
          echo date "-" $GERAET "ist wieder online." >> $LOGFILE;
          fi
          MISSED=0
          fi;
          if [ $MISSED -eq $TESTS ]; then
          echo date "-" $GERAET "wurde neu gestartet." >> $LOGFILE;
          echo "reboot" | socat - udp-sendto:192.168.178.40:6676
          fi
          sleep $PAUSE;
          done

          Müsste man anpassen

          Das script arbeitet als Schleife

          socat muss installiert sein

          Armilar S 2 Replies Last reply Reply Quote 1
          • Armilar
            Armilar Most Active Forum Testing @emil70 last edited by

            @emil70

            Auch interessant. Ein Watchdog für Tasmotas außerhalb ioBroker.

            1 Reply Last reply Reply Quote 0
            • S
              Smartin @emil70 last edited by

              @emil70

              Das ist klasse!
              Genauso wie übrigens das Überwachungs-Script von @armilar 👍

              Ich bin allerdings wie gesagt nicht so wirklich ein Linux/Script-Held ...
              Ich vermute in dieser Zeile würde ich den Aus/An Befehl unterbringen müssen

              echo "reboot" | socat - udp-sendto:192.168.178.40:6676
              

              Richtig?
              Wie müsste das aussehen, wenn der Befehl

              http://192.168.1.42/cm?cmnd=Power%20off
              

              bzw.

              http://192.168.1.42/cm?cmnd=Power%20on
              

              lautet und dazwischen noch eine Pause von 10 Sekunden eingehalten werden soll?

              E Armilar 4 Replies Last reply Reply Quote 0
              • E
                emil70 @Smartin last edited by emil70

                @smartin

                ja das ist der Part

                Du nutzt Tasmota, so wie ich die Befehle sehe. Das nutze ich leider nicht und kann da nicht sagen, wie da der Befehl über Konsole lautet. http geht so auf jeden Fall nicht

                Vielleicht geht bei Tasmota ssh

                ssh IP vom Sonoff -p 22 -l "reboot"
                
                Armilar 1 Reply Last reply Reply Quote 0
                • Armilar
                  Armilar Most Active Forum Testing @Smartin last edited by

                  @smartin

                  https://tasmota.github.io/docs/Commands/#with-web-requests

                  Ist schon korrekt so

                  1 Reply Last reply Reply Quote 0
                  • Homoran
                    Homoran Global Moderator Administrators @emil70 last edited by Homoran

                    @emil70 sagte in Ausfallsicherung:

                    Pack den Pi doch an eine Schaltbare Steckdose und nutzt ein script auf einem anderen System,was den Pi anpingt. Ist dieser nicht erreichbar wird die Steckdoese aus und nach ein paar Sekunden wieder eingeschlaltet.

                    Das wären dann ja doch wieder zwei Geräte.

                    Außerdem müsste man jetzt genau wissen was unter Ausfall zu verstehen ist.
                    Auch ich

                    @armilar sagte in Ausfallsicherung:

                    dachte bei Ausfallsicherheit eigentlich an Redundanz und Hochverfügbarkeit.

                    und wenn es nur um

                    @smartin sagte in Ausfallsicherung:

                    einem Neustart

                    geht wäre

                    @emil70 sagte in Ausfallsicherung:

                    eine Schaltbare Steckdose

                    so ziemlich das Teil was man nicht als erste Wahl nehmen sollte.
                    Die Folgen von "reboot" durch Stecker raus sollten ja inzwischen hinlänglich bekannt sein.

                    EDIT:
                    Wo kommen denn jetzt auf einmal die ganzen Posts her?
                    Da war gerade nix!

                    also vergesst meinen Post, ist ja nix neues

                    1 Reply Last reply Reply Quote 0
                    • E
                      emil70 @Smartin last edited by emil70

                      @smartin

                      Teste mal

                      curl -s http://192.168.1.42/cm?cmnd=Power%20off
                      
                      curl -s http://192.168.1.42/cm?cmnd=Power%20off
                      

                      curl muss installiert sein

                      geht bei mir auf jede Fall mit der von mir verwendetet Software

                      1 Reply Last reply Reply Quote 0
                      • Armilar
                        Armilar Most Active Forum Testing @Smartin last edited by Armilar

                        @smartin

                        oder so

                           var ip = '55'; //letzte Zahl der IP
                           require("request")((['http://192.168.1.',('' + ip),'/cm?cmnd=cmnd=Power%20off'].join(''))).on("error", function (e) 
                        
                        1 Reply Last reply Reply Quote 0
                        • Armilar
                          Armilar Most Active Forum Testing @emil70 last edited by Armilar

                          @Smartin

                          Übrigens wenn du deinen Rechner kontrolliert rebooten lassen willst, geht das auch:

                          createState('0_userdata.0.Reboot.t2c_System.LinuxRestart_command', '');
                          on({id: '0_userdata.0.Reboot.t2c_System.LinuxRestart_command', change: 'any'}, function (obj) {
                            if (obj.newState.val === true || obj.newState.val === 'true'){
                                log('Command stop');
                                setState('0_userdata.0.Reboot.t2c_System.LinuxRestart_command', 'false');
                                exec ('sudo reboot');
                            }
                          });
                          

                          In den angelegten DP true zum Zeitpunkt deiner Wahl schreiben... und exec im JS-Adapter zulassen.

                          Dann startet dein ioBroker durch.

                          EDIT:
                          Ich denke an so etwas hat @Homoran bestimmt gedacht, als er die Steckdose als Power on/off sah 😉

                          Homoran 1 Reply Last reply Reply Quote 0
                          • Homoran
                            Homoran Global Moderator Administrators @Armilar last edited by

                            @armilar aber wenn der iob hängt, geht ja nichts mehr.

                            Armilar 1 Reply Last reply Reply Quote 0
                            • Armilar
                              Armilar Most Active Forum Testing @Homoran last edited by

                              @homoran
                              ich nehme immer an, dass mindestens ein Adapter seine Arbeit noch macht. Daher auch die JS-Instanz für PROD und eine für z.B. Wartung. Wenn der iob hängt, dann kann er höchstens versuchen sich mit VPN auf den pi zuzugreifen und ein sudo reboot aus der Console abzusetzen. Na und wenn das auch nicht mehr geht - Dann muss die Steckdose halt ran.

                              S 1 Reply Last reply Reply Quote 1
                              • S
                                Smartin @Armilar last edited by Smartin

                                Ja, wie schon gesagt, ich bin da auch nicht so zimperlich. Sollte das System tatsächlich doch Schaden nehmen, setze ich es eben neu auf, Backups habe ich ja. Und ca. alle 4 Wochen spiegele ich die SD Karte auf eine andere, sodass ich schnell wieder am Start wäre mit relativ wenig Aufwand.
                                Ich habe jetzt mal den Ansatz von @emil70 versucht mit dem Shellscript und dem curl Befehl (der auf der Konsole ohne Probleme funktioniert).
                                Allerdings komme ich da nicht recht weiter.

                                #!/bin/bash
                                #CONFIGURATION
                                #IP of host
                                GERAET=RasPi1
                                WATCH_IP="192.168.1.109"
                                #path to logfile
                                LOGFILE="/media/fritz.nas/SAMSUNG/RasPI/raspi1.log"
                                #duration between pings
                                PAUSE1=120
                                PAUSE2=10
                                #how many failed pings before log
                                TESTS=2
                                #SCRIPT
                                #initialize
                                MISSED=0
                                # touch $LOGFILE
                                #-lt = lesser than = kleiner als
                                #-eq = equal = Gleichheit
                                #-ne = not equal = Ungleichheit
                                #-le = lesser or equal = kleiner oder gleich
                                #-ge = greater or equal = größer oder gleich
                                #-gt = greater than = größer als
                                while true; do
                                if ! ping -c 1 -w 1 $WATCH_IP > /dev/null; then echo $MISSED
                                ((MISSED++))
                                else
                                if [ $MISSED -ge $TESTS ]; then
                                echo date "-" $GERAET "ist wieder online." >> $LOGFILE;
                                fi
                                MISSED=0
                                fi;
                                if [ $MISSED -eq $TESTS ]; then
                                echo date "-" $GERAET "wurde neu gestartet." >> $LOGFILE;
                                curl -s http://192.168.1.42/cm?cmnd=Power%20off
                                sleep $PAUSE2;
                                curl -s http://192.168.1.42/cm?cmnd=Power%20on
                                fi
                                sleep $PAUSE1;
                                done
                                
                                

                                Das Script bleibt aber mit der Meldung

                                ./restart_raspi1.sh: 33: ./restart_raspi1.sh: MISSED++: not found
                                

                                hängen, stört sich also an der Addition der Fehlversuche.
                                Bei shellCheck wird das Script als völlig korrekt angezeigt.
                                Was mache ich denn falsch? Oder würde das so überhaupt funktionieren?
                                Der Logfile wird erstellt, die Datei ist vorhanden (habe den touch Aufruf daher wieder auskommentiert).
                                Vielleicht könnt ihr nochmal drüber gucken ...

                                Armilar E 2 Replies Last reply Reply Quote 0
                                • Armilar
                                  Armilar Most Active Forum Testing @Smartin last edited by

                                  @smartin
                                  okay - dann bin ich raus... 😊

                                  1 Reply Last reply Reply Quote 0
                                  • mcm1957
                                    mcm1957 last edited by

                                    Da ich hier noch nichts dazu gelesen habe noch eine Info:

                                    Der Raspi4 hat wenn mein Wissensstand richtig ist einen HArdware Watchdog. Sollte sich der Pi4 aufhängen, d.h. der Watchdog nicht rechtzeitig getriggert werden, dann gibts einen HW Reset.

                                    Welche Auswirkungen das auf Linux, insbesondere auf das Filesystem hat kann ich nict sagen. Da sollte man unbedingt noch genauer nachforschen.

                                    https://www.gieseke-buch.de/raspberrypi/eingebauten-hardware-watchdog-zur-ueberwachung-nutzen#:~:text=Eine der Besonderheiten des Raspberry,Störung nicht mehr ordnungsgemäß läuft.

                                    https://www.raspberry-buy.de/Tutorial_Raspberry_Pi_Watchdog_installieren_konfigurieren_aktivieren.html

                                    Thomas Braun 1 Reply Last reply Reply Quote 1
                                    • Santos
                                      Santos last edited by

                                      Die Idee mit dem Watchdog direkt in der HW finde cool, würde auch installieren!

                                      1 Reply Last reply Reply Quote 0
                                      • Thomas Braun
                                        Thomas Braun Most Active @mcm1957 last edited by Thomas Braun

                                        @mcm57 sagte in Ausfallsicherung:

                                        Welche Auswirkungen das auf Linux, insbesondere auf das Filesystem hat kann ich nict sagen. Da sollte man unbedingt noch genauer nachforschen.

                                        Ich hab das hier laufen, allerdings triggert hier die Load 1 Min.
                                        Der Wachhund hat aber außerhalb von Tests nie angeschlagen.

                                        Die Anleitungen sind übrigens veraltet, mittlerweile ist das kein nachladbares Kernelmodul mehr sondern direkt in den Kernel gebacken worden.

                                        1 Reply Last reply Reply Quote 0
                                        • E
                                          emil70 @Smartin last edited by emil70

                                          @smartin sagte in Ausfallsicherung:

                                          Gibt mal über Konsole das ein und poste den Log. Der wird da angelegt wo das script liegt

                                          sh -x ./restart_raspi1.sh > debug.txt 2>&1
                                          

                                          Edit:

                                          Der Logfile wird erstellt, die Datei ist vorhanden (habe den touch Aufruf daher wieder auskommentiert).

                                          Dann solltest du auch

                                          #echo date "-" $GERAET "ist wieder online." >> $LOGFILE;
                                          #echo date "-" $GERAET "wurde neu gestartet." >> $LOGFILE;
                                          
                                          S 1 Reply Last reply Reply Quote 0
                                          • S
                                            Smartin @emil70 last edited by

                                            @emil70

                                            debug.txt

                                            + GERAET=RasPi1
                                            + WATCH_IP=192.168.1.109
                                            + LOGFILE=/media/fritz.nas/SAMSUNG/RasPI/raspi1.log
                                            + PAUSE1=120
                                            + PAUSE2=10
                                            + TESTS=2
                                            + MISSED=0
                                            + true
                                            + ping -c 1 -w 1 192.168.1.109
                                            + echo 0
                                            0
                                            + MISSED++
                                            ./restart_raspi1.sh: 32: ./restart_raspi1.sh: MISSED++: not found
                                            + [ 0 -eq 2 ]
                                            + true
                                            + ping -c 1 -w 1 192.168.1.109
                                            + echo 0
                                            0
                                            + MISSED++
                                            ./restart_raspi1.sh: 32: ./restart_raspi1.sh: MISSED++: not found
                                            + [ 0 -eq 2 ]
                                            + true
                                            + ping -c 1 -w 1 192.168.1.109
                                            + echo 0
                                            0
                                            

                                            Deinen 2. Absatz verstehe ich nicht so ganz. Muss der touch Aufruf immer aktiv bleiben um das Log zu schreiben? Ich dachte das Logfile wird damit nur erstellt und die Logzeilen werden dann immer dort angehängt wenn er vorhanden ist. Deswegen hatte ich den Aufruf nach dem erstellen des Logfiles deaktiviert.

                                            E F 2 Replies Last reply Reply Quote 0
                                            • First post
                                              Last post

                                            Support us

                                            ioBroker
                                            Community Adapters
                                            Donate
                                            FAQ Cloud / IOT
                                            HowTo: Node.js-Update
                                            HowTo: Backup/Restore
                                            Downloads
                                            BLOG

                                            470
                                            Online

                                            31.9k
                                            Users

                                            80.2k
                                            Topics

                                            1.3m
                                            Posts

                                            11
                                            32
                                            1766
                                            Loading More Posts
                                            • Oldest to Newest
                                            • Newest to Oldest
                                            • Most Votes
                                            Reply
                                            • Reply as topic
                                            Log in to reply
                                            Community
                                            Impressum | Datenschutz-Bestimmungen | Nutzungsbedingungen
                                            The ioBroker Community 2014-2023
                                            logo