NEWS
an alle Proxmox Nutzer
-
nein 0% in proxmox ist neu.. im Adapter währe die verschlissen bei 0% da ist 100% neu
eben umgekehrt, die api liefert das so.. -
Kommt so aus den SMART Werten

Percent_lifetime_remain über 100% sind schon sehr merkwürdig, und erklären die negativen Werte, die die Proxmox-Umrechnung ergibt....
Vielleicht hat die SSD ja Katzen-Gene
Katzen haben ja bekanntlich sieben Leben.Bei einer neugeborenen Katze würde also bei Percent Lifetime Remain 700 gemeldet.....
-
Ich muss ehrlicherweise sagen, dass ich da nie darauf geachtet habe. Aber die ganze Anzeige ist irgendwie Käse.
percent Lifetime 206 Schwellwert 150 hat doch beides nichts mit irgendwelchen Prozentwerten zu tun finde ich.
Ok, dauernde Backups mache ich sowieso und eine Reserveplatte (die ich eigentlich schon vor 12 Monaten einbauen wollte) liegt auch bereit. Mal im Auge behalten wo hier die Reise hingeht. -
-
Interessant finde ich die hohe Anzahl an "Unsafe Shutdowns". Muss Linux bei SSDs beim Herunterfahren besondere Prozeduren einhalten, und tut es in Deinem Fall nicht korrekt?
Interessant finde ich die hohe Anzahl an "Unsafe Shutdowns".
Mich nicht.... das System ist öfter mal "Hart" Abgeschaltet worden, weil bei mir die Server über PV laufen, es hängt zwar eine USV dazwischen aber bis alle Automationen aufeinander Abgestimmt
waren hat es sicher 20 mal "geknallt" der Rest wird von sonstigen Hart-Resets sein, aber nach 1,5 Jahren kann ich nicht alles Aufzählen, es wird sicher auch mal ein LXC mit schuld sein, vermute ich mal :-)Edit:
So sieht der zweite Server aus, da wird die SSD bald ausfallen, die ist aber auch älter, war beim Einbau sicher schon 2-3 Jahre alt.

-
Ein sehr interessantes Thema über das ich mir nie Gedanken gemacht hatte.
Die Aktuelle Nvme ist seit November 2024 im System Verbaut, ebenso die SSD.
Und so sehen die Werte aus

Keine Ahnung warum dir beiden Platten nur zu 2% belastet sind.....
-
Ich rufe mir die Werte mit Linux Control ab.
Befehl
smartctl --scan | awk '{print $1}' | while read dev; do name=$(basename $dev); json=$(smartctl -A -j $dev); if echo "$json" | jq -e '.ata_smart_attributes' > /dev/null 2>&1; then echo "$json" | jq --arg d "$name" '{($d): (.ata_smart_attributes.table | map({(.name): (if .name == "Temperature_Celsius" then .value else .raw.value end)}) | add // {})}'; else echo "$json" | jq --arg d "$name" '{($d): (.nvme_smart_health_information_log // {} | del(.nsid, .temperature_sensors))}'; fi; done | jq -s 'add'Ergebnis
{ "sda": { "Reallocated_Sector_Ct": 0, "Power_On_Hours": 23050, "Power_Cycle_Count": 46, "Wear_Leveling_Count": 286, "Used_Rsvd_Blk_Cnt_Tot": 0, "Unused_Rsvd_Blk_Cnt_Tot": 437, "Program_Fail_Cnt_Total": 0, "Erase_Fail_Count_Total": 0, "Runtime_Bad_Block": 0, "End-to-End_Error": 0, "Uncorrectable_Error_Cnt": 0, "Airflow_Temperature_Cel": 53, "Temperature_Celsius": 47, "ECC_Error_Rate": 0, "Current_Pending_Sector": 0, "CRC_Error_Count": 0, "Exception_Mode_Status": 0, "POR_Recovery_Count": 14, "Total_LBAs_Written": 52455340537, "Total_LBAs_Read": 40595535623, "SATA_Downshift_Ct": 0, "Thermal_Throttle_St": 0, "Timed_Workld_Media_Wear": 65535, "Timed_Workld_RdWr_Ratio": 65535, "Timed_Workld_Timer": 65535, "NAND_Writes": 67942600384 }, "nvme0": { "critical_warning": 0, "temperature": 55, "available_spare": 100, "available_spare_threshold": 10, "percentage_used": 13, "data_units_read": 1622206761, "data_units_written": 295401619, "host_reads": 11974915901, "host_writes": 4429907015, "controller_busy_time": 27892, "power_cycles": 45, "power_on_hours": 3891, "unsafe_shutdowns": 11, "media_errors": 0, "num_err_log_entries": 0, "warning_temp_time": 17, "critical_comp_time": 0 } } -
Ich hatte auch mal einen Anlauf genommen, die S.M.A.R.T.-Werte unter Windows zu überwachen. Grund war das ich eine Festplatte hatte die dann schon massive Schreibfehler produziert hatte. Unter Windows produziert das einen EventLog-Eintrag mit der Ereignis-ID 7, dann ist höchster Alarm angesagt. CrystalDiskInfo hat immerhin
Vorsichtbei der Festplatte gemeldet beiC5, das war derCurrent Pending Sector Count. Aber 3 andere Festplatten die exakt den gleichen Wert bei C5 hatten (200) waren grün?!?!?
Ich habe dann geschaut was über WMI, PowerShell (nicht WMI) und den Smartmontools geht.Bei den Tools die auch für eine Hintergrundüberwachung geeignet wäre, kein einziges, der Gesamtzustand war trotzdem
Heathly(PowerShell),OK(WMI) bzw.PredictFailure = False(auch WMI) und bei den SmartmonTools kam nur die Werte raus, aber ohne Bewertung.Hier meine Forschungen von damals: https://znil.net/index.php?title=Zabbix:Template_Windows_SMART-Werte_Festplatten
Mein Fazit war, das ich nur auf das Eventlog vertraue.
Was wäre das Pendant in Linux?
-
Ich hatte auch mal einen Anlauf genommen, die S.M.A.R.T.-Werte unter Windows zu überwachen. Grund war das ich eine Festplatte hatte die dann schon massive Schreibfehler produziert hatte. Unter Windows produziert das einen EventLog-Eintrag mit der Ereignis-ID 7, dann ist höchster Alarm angesagt. CrystalDiskInfo hat immerhin
Vorsichtbei der Festplatte gemeldet beiC5, das war derCurrent Pending Sector Count. Aber 3 andere Festplatten die exakt den gleichen Wert bei C5 hatten (200) waren grün?!?!?
Ich habe dann geschaut was über WMI, PowerShell (nicht WMI) und den Smartmontools geht.Bei den Tools die auch für eine Hintergrundüberwachung geeignet wäre, kein einziges, der Gesamtzustand war trotzdem
Heathly(PowerShell),OK(WMI) bzw.PredictFailure = False(auch WMI) und bei den SmartmonTools kam nur die Werte raus, aber ohne Bewertung.Hier meine Forschungen von damals: https://znil.net/index.php?title=Zabbix:Template_Windows_SMART-Werte_Festplatten
Mein Fazit war, das ich nur auf das Eventlog vertraue.
Was wäre das Pendant in Linux?
Ich würde immer mit den smartmontools (win oder linux) die werte auslesen.
Wenn man selbst das nicht versteht oder korrekt interpretieren kann, dann am besten
die Ausgabe + exakte Modellnummer bei chatgpt oder andere KI kopieren. -
Ich lasse mir den Wearout in einen Datenpunkt schreiben und mich benachrichtigen wenn er sich ändert.
Hab das Thema gerade entdeckt.
In Proxmox sagt er 0%.
Aber im Adapter sagt er 100%.Wo holst du dir die Daten?


Hey! Du scheinst an dieser Unterhaltung interessiert zu sein, hast aber noch kein Konto.
Hast du es satt, bei jedem Besuch durch die gleichen Beiträge zu scrollen? Wenn du dich für ein Konto anmeldest, kommst du immer genau dorthin zurück, wo du zuvor warst, und kannst dich über neue Antworten benachrichtigen lassen (entweder per E-Mail oder Push-Benachrichtigung). Du kannst auch Lesezeichen speichern und Beiträge positiv bewerten, um anderen Community-Mitgliedern deine Wertschätzung zu zeigen.
Mit deinem Input könnte dieser Beitrag noch besser werden 💗
Registrieren Anmelden