NEWS
[gelöst]Proxmox crashed
-
ach ja, warum ich das proxmox-iso ungern installieren würde:
der beelink war durch die hardware nicht fähig, grup richtig zu installieren. die hardware war zu neu für debian. dadurch mußte ich den "refind boot manager" installieren. dieser ist auch noch auf dem nuc aktiv und hat den vorteil, dass ich ein mult-boot system habe, auf dem ein punkt zum booten clonezilla (ohne usb-stick) ist. dadurch kann ich schnell ein backup von der proxmox partition machen und auf eine usb-harddisk speichern. der restore wäre dann über einen usb-stick möglich. dachte - das ist eine gute diesaster-recovery-startegy
-
@Chaot da ich ein alugehäuse - ohne lüfter - habe, gib es da keinen staub mehr. habe aber trotzdem mal geöffnet, um nach den kabeln zu sehen. das alugehäuse bringt die temp gut nach unten. was mir aber aufgefallen ist: die m2 ssd , die drin steckt, ist halt ungekühlt
die temp - weiter oben - von @crunchip erwähnt ist aber die externe platte (sdb) - die ssd ist sda.
-
temp ssd:
hddtemp /dev/sda /dev/sda: TS240GMTS420S: 48°C
-
die temp der externen platte kann mit hdtemp nicht gelesen werden - vielleicht kommt daher ein falscher wert
4TB HD
hddtemp /dev/sdb /dev/sdb: WD Elements 25A3: S.M.A.R.T. nicht verfügbar
2TB HD
hddtemp /dev/sdc /dev/sdc: ASMT 2105: Laufwerk unterstützt, aber es hat keinen Temperatur-Sensor.
-
habe mir zur sicherheit mal die ssd temp als datenpunkt zum kontrolllieren eingerichtet - 48°C sollte ok sein
-
@liv-in-sky sagte in Proxmox crashed:
dass ich ein mult-boot system habe
daher kommt wahrscheinlich auch die Meldung aus deinem log, was google ausspuckt,
Received SIGRTMIN+20 from PID 265 (plymouthd).
@liv-in-sky sagte in Proxmox crashed:
die temp der externen platte kann mit hdtemp nicht gelesen werden
ich weiss/wusste doch gar nicht, ob du ne externe Platte dran hängen hast bin nur nach deinem log gegangen
Dec 26 00:17:33 beelink smartd[724]: Device: /dev/sdb [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 117 to 116 Dec 26 00:17:34 beelink smartd[724]: Device: /dev/sdc [SAT], SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 66 to 63 Dec 26 00:17:34 beelink smartd[724]: Device: /dev/sdc [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 34 to 37
-
@liv-in-sky Ja, mein Gedanke war eigentlich eher die Temperatur die du nicht auslesen kannst. Also die Spannungsregler auf dem Board usw.
Wenn die zugestaubt sind dann geht deren Temperatur auch nach oben bis sie einknicken.
Was auch gerne vergessen wird ist, dass Wärmeleitpaste altert. Ist das Chassis alt genug gibt es oft Probleme mit der Wärmeableitung. -
@liv-in-sky Warum läuft da überhaupt plymouthd? Entbehrlicher Blingbling-Kram.
-
@Thomas-Braun bin gerade dabei herauszufinden, was das ist - kann ich das abschalten ?
-
@liv-in-sky Das ist ein bootsplash. Der überdeckt die Meldungen beim booten mit einer hübschen Grafik.
-
Läuft evt. conbee-Stick mit deconz auf einer VM?
Bei mir hat sich zwar nur die iob-vm verabschiedet und nicht proxmox komplett. Conbee + deconz auf ne extra vm und dann war Ruhe.
Vielleicht hilft das... -
der plymouth ist jetzt disabled - hatte wieder crash
-
@liv-in-sky Das dürfte auch nicht die Ursache gewesen sein. Trotzdem braucht der plymouthd ja nicht laufen, auf einem Serversystem.
-
@ppaul - nein - habe ein cc2532 - der ist aber nicht angesteckt und der adapter ist aus - war nur zum testen - ist bei mir nicht aktiv
es sind 2 festplatten
eine usv über usb
eine ssd m2
tastatur und monitormeine sensoren sind meist tasmota und mihome (xiaomi)
thats all
@Thomas-Braun - war klar - wollte nur darauf hinweisen, dass die tipps auch angewendet werden
-
das letzte was ich geändert hatte:
- netzteil
- habe durch zufall entdeckt, dass wenn ich eine der beiden externen usb platten vor dem booten abstecke, 2 container nicht laufen. also container auf die ssd verschoben. die hdd ist eigentlich als backup für das proxmox-system und die container gedacht. die platte ist schön älter und irgendwie habe ich der nie richtig vertraut.
aber ich klopf mal auf holz- erst wenn es einen tag durchläuft, werde ich etwas aufatmen. usv wieder dran und alle instanzen wieder eingeschaltet
-
@liv-in-sky und der pow?
ist der schon wieder dran? -
@liv-in-sky Sag mal. Loggst du eigentlich die Daten vom Sonoff POW? In welchem Takt?
Vielleicht kann man da mal erkennen ob das Netzteil mal kurz wegknickt?
Oder ein selbsthaltendes Relais sekundär dazwischenschalten das beim Ausfall aus bleibt.
Dann kannst du zumindest einen Externen Einfluss sicher ausschließen. -
-
@Chaot sagte in Proxmox crashed:
@liv-in-sky Sag mal. Loggst du eigentlich die Daten vom Sonoff POW? In welchem Takt?
Vielleicht kann man da mal erkennen ob das Netzteil mal kurz wegknickt?
Oder ein selbsthaltendes Relais sekundär dazwischenschalten das beim Ausfall aus bleibt.
Dann kannst du zumindest einen Externen Einfluss sicher ausschließen.na ja - mit loggen ist nicht viel, wenn der server einfach ausgeht - aber das mit dem relais wäre wohl eine idee, wenn ich sowas finde oder irgendwas anderes, was bei einem powerloss sofort reagiert
-
Naja... ist zwar schon einige Jahre her. Ich hatte mal einen Rechner mit ähnlichem Phänomen. Damals hat ein Bios-Update geholfen. Vielleicht hier auch eine Option...