NEWS
Bitte Hilfe - ioBroker extrem instabil (gelöst)
-
Hallo Leute,
ich hoffe auf Hilfe von euch. Erst hatte ich ioBroker auf einen RPi 3B+ am laufen, wurde aber instabil.
Daher habe ich das System auf einen NUC mit Proxmox und Debian übersiedelt.
Leider habe ich auch damit keine wirkliche Freude.
Ich habe das System nun bereits sicher 10 Mal neu aufgesetzt…
Nun gestern bis spät in die Nacht wieder alle Scripte (mehrmals neu erstellt, da diese einfach mit Crash verschwunden waren...),
ical usw. eingestellt wie es sein sollte.
Lief von ca. Mitternacht bis rund 10:00 Uhr problemlos.
Dann begann es wieder und es folgte ein Neustart nach dem anderen.
Leider kann ich mit den Log-Files nicht viel anfangen und hoffe daher nun auf Hilfe von euch.
Ich habe nun versucht den Fehlerhaften Adapter zu lokalisieren.
Folgende Adapter habe ich deaktiviert:
- ping.0 -> muss ein gröberes Problem haben, ab Log Zeile 909 -> wurde deaktiviert muss auch nicht unbedingt sein…
- ical.0 bis ical.4 -> Zeile 38 wirft eine uncaught exception….
- javascript.0 -> ich dachte hier könnte am ehesten der Fehler liegen, wenn ich es nicht sauber ausgeführt habe…
- zigbee.0 -> ich denke hier gibt es auch eine Baustelle…
- telegram.0 -> keine Ahnung was ich davon halten soll
2019-02-03 11:30:40.875 - info: host.iobroker instance system.adapter.telegram.0 started with pid 7889 2019-02-03 11:30:41.373 - error: Caught by controller[0]: Sun, 03 Feb 2019 10:30:41 GMT node-telegram-bot-api deprecated Automatic enabling of cancellation of promises is deprecated. 2019-02-03 11:30:41.373 - error: Caught by controller[0]: In the future, you will have to enable it yourself. 2019-02-03 11:30:41.373 - error: Caught by controller[0]: See https://github.com/yagop/node-telegram-bot-api/issues/319\. at module.js:653:30 2019-02-03 11:30:41.373 - warn: host.iobroker instance system.adapter.telegram.0 terminated due to SIGSEGV 2019-02-03 11:30:41.373 - error: host.iobroker instance system.adapter.telegram.0 terminated with code null () 2019-02-03 11:30:41.373 - info: host.iobroker Restart adapter system.adapter.telegram.0 because enabled
- mqtt.0 -> nun auch deaktiviert (während ich das hier schreibe)
Ich habe das Gefühl, dass meine Arbeit gestern wieder für die Katz war und sich das System wieder total zerschossen hat.
Wie erwähnt am RPi lief es für eine Zeit ganz toll, ist aber gewachsen und nun nur Probleme.
Im Anhang noch der Logbuch-Ausschnitt
-> selbst Proxmox erkennt nicht mehr, dass die VM läuft!!!
aktuelles System:
NUC (8GB) mit Proxmox 5.3-8
VM -> Debian
ioBroker nach Anleitung (http://www.iobroker.net/docu/?page_id=8323&lang=de)
alle Adapter via admin installiert
node -v --> v8.15.0 nodejs -v --> v8.15.0 npm -v --> 6.4.1 uname -a Linux iobroker 4.9.0-8-amd64 #1 SMP Debian 4.9.130-2 (2018-10-27) x86_64 GNU/Linux
Ich hoffe es kann mir hier jemand weiterhelfen, bin schon im Zweifeln, ob das System wirklich etwas für mich ist…. :?:
Bitte das oben nicht falsch verstehen, hier wurde tolle Arbeit geleistet, aber warum auch immer läuft es bei mir nicht??????
8165_iobroker.2019-02-03.log -
ist aber gewachsen `
Was läuft denn alles?
iobroker list instances
und wie wurde installiert?
Gruß
Rainer
-
Auch wenn es nicht hilft, ich kann dem Log nur Recht geben:
retuzn node.kind === 161
->Error
-
Hi, ob das eine gute Idee ware….
der Befehl ging noch durch:
psw@iobroker:~$ iobroker list instances [sudo] Passwort für psw: system.adapter.admin.0 : admin - enabled, port: 8081, bind: 0.0.0.0, run as: admin system.adapter.backitup.0 : backitup - enabled system.adapter.daswetter.0 : daswetter - enabled system.adapter.discovery.0 : discovery - enabled system.adapter.flot.0 : flot - enabled system.adapter.history.0 : history - enabled system.adapter.ical.0 : ical - disabled system.adapter.ical.1 : ical - disabled system.adapter.ical.2 : ical - disabled system.adapter.ical.3 : ical - disabled system.adapter.ical.4 : ical - disabled system.adapter.icons-fatcow-hosting.0 : icons-fatcow-hosting - enabled system.adapter.icons-icons8.0 : icons-icons8 - enabled system.adapter.icons-material-png.0 : icons-material-png - enabled system.adapter.icons-mfd-svg.0 : icons-mfd-svg - enabled system.adapter.icons-open-icon-library-png.0: icons-open-icon-library-png - enabled system.adapter.javascript.0 : javascript - disabled system.adapter.mihome.0 : mihome - enabled, port: 9898, bind: 192.168.1.8 system.adapter.mobile.0 : mobile - disabled system.adapter.mqtt.0 : mqtt - disabled, port: 1880 system.adapter.radar.0 : radar - enabled system.adapter.rickshaw.0 : rickshaw - enabled system.adapter.samsung.0 : samsung - disabled system.adapter.sayit.0 : sayit - enabled, port: 0 system.adapter.sonoff.0 : sonoff - enabled, port: 1883, bind: 0.0.0.0 system.adapter.sonos.0 : sonos - enabled system.adapter.telegram.0 : telegram - disabled, port: 8443, bind: 0.0.0.0 system.adapter.text2command.0 : text2command - enabled system.adapter.vis-bars.0 : vis-bars - enabled system.adapter.vis-hqwidgets.0 : vis-hqwidgets - enabled system.adapter.vis-jqui-mfd.0 : vis-jqui-mfd - enabled system.adapter.vis-keyboard.0 : vis-keyboard - enabled system.adapter.vis-timeandweather.0 : vis-timeandweather - enabled system.adapter.vis.0 : vis - enabled system.adapter.web.0 : web - enabled, port: 8082, bind: 0.0.0.0, run as: admin system.adapter.wifilight.0 : wifilight - enabled system.adapter.yeelight-2.0 : yeelight-2 - enabled system.adapter.zigbee.0 : zigbee - disabled, port: /dev/serial/by-id/usb-Texas_Instruments_TI_CC2531_USB_CDC___0X00124B0018ED3018-if00 psw@iobroker:~$
aber nun hat sich auch meine ssh Verbindung verabschiedet.
Ich vermute mal, dass hier kein ioBroker Problem vorliegt, sondern evtl. hat die SSD etwas, könnte dies sein?
Kann ich das Testen?
Hab gestern auch brav mit geschrieben was in welchen Adapter rein muss, d.h. eine 11. Neuinstallation auf neuer SSD???
-
Ach ja,
wie habe ich installiert:
Proxmox rauf, VM erstellt mit ISO-Image gestartet und nach Debian lt. Anleitung (http://www.iobroker.net/docu/?page_id=8323&lang=de)
-
Du hast etwa 28 Adapter laufen. Da wird der 1GB RAM eines Raspberries knapp. Auf eine VM auszuweichen ist also schon mal eine gute Idee gewesen.
-
ok - also mit der curl-Variante
Bitte die Ausgaben von:
node -v nodejs -v npm -v iobroker -v
-
Hat er oben im ersten Eintrag stehen. 8.15 und npm 6.4.1
Debian scheint ja auch stabil zu laufen, proxmox auch, von daher ssd???? Ist doch alles auf der selben ssd, oder? Oder hat’s du iobroker und das Debian auf einem separaten Laufwerk installiert?
-
Anbei die Infos, ist nun total abgestürtzt, musste sogar proxmox neu starten
root@iobroker:/opt/iobroker# node -v v8.15.0 root@iobroker:/opt/iobroker# nodejs -v v8.15.0 root@iobroker:/opt/iobroker# npm -v 6.4.1 root@iobroker:/opt/iobroker# iobroker -v 1.4.2 root@iobroker:/opt/iobroker#
-
Hat er oben im ersten Eintrag stehen. 8.15 und npm 6.4.1
Debian scheint ja auch stabil zu laufen, proxmox auch, von daher ssd???? Ist doch alles auf der selben ssd, oder? Oder hat’s du iobroker und das Debian auf einem separaten Laufwerk installiert? `
Da steht aber auch, dass ich auf NUC übersiedelt bin…
(sorry, aber meine Nerven sind schon ziemlich am ende....)
-
Ok, doch ssd? Welche hast du denn verbaut? Welches NUC-Modell, welcher Speicher-Riegel?
-
gute Frage, habe ich gebraucht so gekauft…
Aber daher bereits meine Vermutung, dass ioBroker nichts dafür kann, sondern das Problem evtl. wo anders liegt.
Kann man eine SSD evtl. prüfen???
-
Da fällt mir z.B. das folgende dazu ein: Burn-in Test aller Rechner-Komponenten.
-
Festplatte dürfte nicht so berühmt sein (ich kenne den Hersteller jedenfalls nicht):
root@iobroker:/opt/iobroker# smartctl -i /dev/sda smartctl 6.6 2016-05-31 r4324 [x86_64-linux-4.9.0-8-amd64] (local build) Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org === START OF INFORMATION SECTION === Vendor: QEMU Product: QEMU HARDDISK Revision: 2.5+ User Capacity: 25.769.803.776 bytes [25,7 GB] Logical block size: 512 bytes LU is thin provisioned, LBPRZ=0 Device type: disk Local Time is: Sun Feb 3 12:31:33 2019 CET SMART support is: Unavailable - device lacks SMART capability. root@iobroker:/opt/iobroker#
-
Oder versuche es damit:
https://www.passmark.com/support/bitlin … d_slax.htm
Da bekommst Du heraus, ob Deine Hardware überhaupt fehlerfrei arbeitet. Die Basis muss stimmen, bevor Du Vermutungen anstellst.
-
werde mich bemühen, leider alles nicht so einfach, ist ein headless system…
SSD Info habe ich, nur leider sagt mir das nicht wirklich etwas
root@pve:~# smartctl -a /dev/sda smartctl 6.6 2016-05-31 r4324 [x86_64-linux-4.15.18-9-pve] (local build) Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org === START OF INFORMATION SECTION === Model Family: SandForce Driven SSDs Device Model: KINGSTON SMS200S3120G Serial Number: 50026B7243007DD7 LU WWN Device Id: 5 0026b7 243007dd7 Firmware Version: 524ABBF0 User Capacity: 120,034,123,776 bytes [120 GB] Sector Size: 512 bytes logical/physical Rotation Rate: Solid State Device Device is: In smartctl database [for details use: -P show] ATA Version is: ATA8-ACS, ACS-2 T13/2015-D revision 3 SATA Version is: SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s) Local Time is: Sun Feb 3 12:38:18 2019 CET SMART support is: Available - device has SMART capability. SMART support is: Enabled === START OF READ SMART DATA SECTION === SMART overall-health self-assessment test result: PASSED General SMART Values: Offline data collection status: (0x02) Offline data collection activity was completed without error. Auto Offline Data Collection: Disabled. Self-test execution status: ( 0) The previous self-test routine completed without error or no self-test has ever been run. Total time to complete Offline data collection: ( 0) seconds. Offline data collection capabilities: (0x79) SMART execute Offline immediate. No Auto Offline data collection support. Suspend Offline collection upon new command. Offline surface scan supported. Self-test supported. Conveyance Self-test supported. Selective Self-test supported. SMART capabilities: (0x0003) Saves SMART data before entering power-saving mode. Supports SMART auto save timer. Error logging capability: (0x01) Error logging supported. General Purpose Logging supported. Short self-test routine recommended polling time: ( 1) minutes. Extended self-test routine recommended polling time: ( 36) minutes. Conveyance self-test routine recommended polling time: ( 2) minutes. SCT capabilities: (0x0025) SCT Status supported. SCT Data Table supported. SMART Attributes Data Structure revision number: 10 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x0033 095 095 050 Pre-fail Always - 0/8330866 5 Retired_Block_Count 0x0033 100 100 003 Pre-fail Always - 0 9 Power_On_Hours_and_Msec 0x0032 094 094 000 Old_age Always - 5813h+21m+08.360s 12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 118 171 Program_Fail_Count 0x000a 000 000 000 Old_age Always - 0 172 Erase_Fail_Count 0x0032 000 000 000 Old_age Always - 0 174 Unexpect_Power_Loss_Ct 0x0030 000 000 000 Old_age Offline - 56 177 Wear_Range_Delta 0x0000 000 000 000 Old_age Offline - 0 181 Program_Fail_Count 0x000a 000 000 000 Old_age Always - 0 182 Erase_Fail_Count 0x0032 000 000 000 Old_age Always - 0 187 Reported_Uncorrect 0x0012 100 100 000 Old_age Always - 0 194 Temperature_Celsius 0x0022 037 056 000 Old_age Always - 37 (Min/Max 20/56) 195 ECC_Uncorr_Error_Count 0x001c 120 120 000 Old_age Offline - 0/8330866 196 Reallocated_Event_Count 0x0033 100 100 003 Pre-fail Always - 0 201 Unc_Soft_Read_Err_Rate 0x001c 120 120 000 Old_age Offline - 0/8330866 204 Soft_ECC_Correct_Rate 0x001c 120 120 000 Old_age Offline - 0/8330866 230 Life_Curve_Status 0x0013 100 100 000 Pre-fail Always - 100 231 SSD_Life_Left 0x0013 100 100 010 Pre-fail Always - 0 233 SandForce_Internal 0x0032 000 000 000 Old_age Always - 1020 234 SandForce_Internal 0x0032 000 000 000 Old_age Always - 473 241 Lifetime_Writes_GiB 0x0032 000 000 000 Old_age Always - 473 242 Lifetime_Reads_GiB 0x0032 000 000 000 Old_age Always - 512 SMART Error Log not supported SMART Self-test Log not supported SMART Selective self-test log data structure revision number 1 SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS 1 0 0 Not_testing 2 0 0 Not_testing 3 0 0 Not_testing 4 0 0 Not_testing 5 0 0 Not_testing Selective self-test flags (0x0): After scanning selected spans, do NOT read-scan remainder of disk. If Selective self-test is pending on power-up, resume after 0 minute delay. root@pve:~#
-
Alt ist die SSD nicht. 242 Tage bislang gelaufen. 0 Errors. Sieht doch erst mal gut aus?
-
> Device Model: KINGSTON SMS200S3120G
Ich glaube die habe ich auch irgendwo verbaut. In meinen ioBroker-Installationen finde ich sie jetzt nicht. Kann sein, dass sie in einem Netbook ist.Habe damit jedenfalls bisher keine Probleme gehabt.
Allerdings schon mit einem NUC - da war das Anschlusskabel zur SSD defekt.
Gruß
Rainer
-
OK, dann wird es vermutlich die SSD nicht sein.
SSD Kabel: sporadische Probleme durch evtl. Wärmeentwicklung wären ja möglich
aber nach dem Neustart von eben, und den deaktivierten Adaptern läuft er wieder
ich werde zum Schwammerl, wo soll ich mit was anfangen?
Wie kann ich den Fehler eingrenzen?
-
Wie kann ich den Fehler eingrenzen? `
Normalerweise würde ich jetzt empfehlen Hardwaredaten zu loggen, was in einer VM nicht geht, da diese keine eigentliche Hardware hat.Da das Problem aber auch vorher beim RasPi auftrat denke ich, dass es woanders dran liegt.
Da hilft es dann nur in diversen logs (iobroker/System) zu forschen, ob da etwas steht.
Gruß
Rainer