NEWS
an alle Proxmox Nutzer
-
haltet eure Platten (SSD oder NVME) im Auge.. die HDD sind nicht betroffen
ich habe ein Cluster laufen und hab mich gewundert was los ist..

von einem Node war die nvme auf 82% .. (Lebenszeit noch 18%) und verursachte Ausfälle im ceph
und das jetzt wo der Speicher sooooooooooooooo günstig ist... man man man
-
Ist ja die Frage, wie lange die NVMe schon in Betrieb ist..
Hier auf meinem lahmen N3000 System: Nach ca 3 Jahren Nutzung (ca 28000 "On-Hours") keine Auffälligkeiten der SATA SSD - 11% heruntergeritten ...


wenn ich "Ave_Block_Erase_Count" richtig interpretiere, ist jeder Block der Platte im Schnitt schon 118mal gelöscht und neu verwendet worden...
-
Und was könnte hier die Ursache sein?
Das ist die Frage.
In der Regel sind das ja Prozesse, die im Betrieb viel schreibenden Platten-I/O verursachen.Bin aber nicht der Linux Crack, der weiß, ob es da Profiling-Tools gibt, um Übeltäter zu identifizieren und Strategien, um so etwas abzufangen, ohne die Resilienz gegen plötzliche Stromausfälle zu verlieren...
Wenn man einen Puffer / Cache o. Ä. einführt, um die Disk-IO-Belastung zu minimieren bezahlt man das ggfs. mit stärkeren Beschädigungen des Dateisystems im Falle eines plötzlichen Stromausfalls...
-
hatte ich vor n paar Monaten, da war die 6 monate "alte" SSD auf einmal bei 99% ... war auch nix mehr mit gut zureden :) ausgetauscht und läuft wieder.. die neue hat bis jetzt, nach ca. der gleichen Zeit, nur 24% .. und klar.. das sind Verschleissteile.. ist auch viel Kernschrott dabei.. kann man Glück haben oder auch nicht..
-
Ich habe meine in den drei nodes jetzt einen wearout von 12/13/13 %.
Alle haben gerade 5 Jahre auf dem Buckel und zeigen als Samsung SSD 970 EVO Plus ziemlich gleich dies an:SMART/Health Information (NVMe Log 0x02)
Critical Warning: 0x00
Temperature: 37 Celsius
Available Spare: 100%
Available Spare Threshold: 10%
Percentage Used: 12%
Data Units Read: 76,165,512 [38.9 TB]
Data Units Written: 355,179,743 [181 TB]
Host Read Commands: 1,232,355,432
Host Write Commands: 9,188,118,028
Controller Busy Time: 5,837
Power Cycles: 38
Power On Hours: 5,651
Unsafe Shutdowns: 11
Media and Data Integrity Errors: 0
Error Information Log Entries: 161
Warning Comp. Temperature Time: 0
Critical Comp. Temperature Time: 0
Temperature Sensor 1: 37 Celsius
Temperature Sensor 2: 34 CelsiusDie Garantie läuft bei diesen Samsung nach 5 Jahren oder 300 TB Schreiben ab.
-
Ich bin nach knapp einem Jahr bei 7% Verschleiß. Ich habe eine Samsung 990 Pro mit 1 TB. Es kommt auf den Hersteller und die angegebene TBW an. Bei meiner sind das 600 TB, also 600 Schreibzyklen. Also je nach Hersteller und Größe hält eine SSD / NVMe länger oder kürzer. Ich lasse mir den Wearout in einen Datenpunkt schreiben und mich benachrichtigen wenn er sich ändert. So kann ich das nicht aus dem Auge verlieren. Wobei so ein Speicher nach erreichen der 100% nicht unbedingt defekt sein muss. Manche halten noch deutlich länger.
-
Data Units Read: 76,165,512 [38.9 TB]
Data Units Written: 355,179,743 [181 TB]Das würde ja bedeuten, dass etwa 4/5 der Daten geschrieben, aber danach nie wieder gelesen werden?
Oder habe ich da einen Denkfehler?
-
Data Units Read: 76,165,512 [38.9 TB]
Data Units Written: 355,179,743 [181 TB]Das würde ja bedeuten, dass etwa 4/5 der Daten geschrieben, aber danach nie wieder gelesen werden?
Oder habe ich da einen Denkfehler?
-
Bei Proxmox muss man aber auch berücksichtigen:
Sudden Increases: Drastic jumps in wearout (e.g., from 0% to 98% in weeks) usually indicate excessive, often hidden, write amplification, frequently seen in virtualized environments (Proxmox/ZFS) with heavy logging or improper sync settings.
https://forum.proxmox.com/threads/nvm-ssd-extreme-high-wearout.143823/
Hey! Du scheinst an dieser Unterhaltung interessiert zu sein, hast aber noch kein Konto.
Hast du es satt, bei jedem Besuch durch die gleichen Beiträge zu scrollen? Wenn du dich für ein Konto anmeldest, kommst du immer genau dorthin zurück, wo du zuvor warst, und kannst dich über neue Antworten benachrichtigen lassen (entweder per E-Mail oder Push-Benachrichtigung). Du kannst auch Lesezeichen speichern und Beiträge positiv bewerten, um anderen Community-Mitgliedern deine Wertschätzung zu zeigen.
Mit deinem Input könnte dieser Beitrag noch besser werden 💗
Registrieren Anmelden