NEWS
Proxmox nach Update mit Fehler
-
Ich war so schlau und habe ein Update von Proxmox gemacht.
Jetzt starten zwar alle Container wieder, aber die Prozessorlast liegt bei 90% und die InfluxDb ist scheinbar nicht erreichbar.
Im Log habe ich kontinuierlich diese Fehlermeldung:Jun 02 11:39:54 pve kernel: </TASK> Jun 02 11:39:54 pve kernel: snd_soc_skl 0000:00:0e.0: Error creating sysfs entry Jun 02 11:39:54 pve kernel: snd_soc_avs 0000:00:0e.0: DSP detected with PCI class/subclass/prog-if info 0x040380 Jun 02 11:39:54 pve kernel: sof-audio-pci-intel-apl 0000:00:0e.0: DSP detected with PCI class/subclass/prog-if info 0x040380 Jun 02 11:39:54 pve kernel: sof-audio-pci-intel-apl 0000:00:0e.0: DSP detected with PCI class/subclass/prog-if 0x040380 Jun 02 11:39:54 pve kernel: snd_soc_skl 0000:00:0e.0: DSP detected with PCI class/subclass/prog-if info 0x040380 Jun 02 11:39:54 pve kernel: sysfs: cannot create duplicate filename '/devices/pci0000:00/0000:00:0e.0/platform_id' Jun 02 11:39:54 pve kernel: CPU: 2 PID: 176 Comm: kworker/u9:3 Tainted: P O 6.8.4-3-pve #1 Jun 02 11:39:54 pve kernel: Hardware name: /NUC6CAYB, BIOS AYAPLCEL.86A.0029.2016.1124.1625 11/24/2016 Jun 02 11:39:54 pve kernel: Workqueue: events_unbound deferred_probe_work_func Jun 02 11:39:54 pve kernel: Call Trace: Jun 02 11:39:54 pve kernel: <TASK> Jun 02 11:39:54 pve kernel: dump_stack_lvl+0x48/0x70 Jun 02 11:39:54 pve kernel: dump_stack+0x10/0x20 Jun 02 11:39:54 pve kernel: sysfs_warn_dup+0x8a/0xb0 Jun 02 11:39:54 pve kernel: sysfs_add_file_mode_ns+0x13c/0x150 Jun 02 11:39:54 pve kernel: sysfs_create_file_ns+0x72/0xb0 Jun 02 11:39:54 pve kernel: skl_nhlt_create_sysfs+0x29/0x60 [snd_soc_skl] Jun 02 11:39:54 pve kernel: skl_probe+0x321/0x820 [snd_soc_skl] Jun 02 11:39:54 pve kernel: ? down_write+0x12/0x80 Jun 02 11:39:54 pve kernel: ? kernfs_activate+0x90/0xc0 Jun 02 11:39:54 pve kernel: local_pci_probe+0x47/0xb0 Jun 02 11:39:54 pve kernel: pci_device_probe+0xc5/0x260 Jun 02 11:39:54 pve kernel: really_probe+0x1cc/0x430 Jun 02 11:39:54 pve kernel: __driver_probe_device+0x8c/0x190 Jun 02 11:39:54 pve kernel: driver_probe_device+0x24/0xd0 Jun 02 11:39:54 pve kernel: __device_attach_driver+0xcd/0x170 Jun 02 11:39:54 pve kernel: ? __pfx___device_attach_driver+0x10/0x10 Jun 02 11:39:54 pve kernel: bus_for_each_drv+0x97/0xf0 Jun 02 11:39:54 pve kernel: __device_attach+0xb6/0x1d0 Jun 02 11:39:54 pve kernel: device_initial_probe+0x13/0x20 Jun 02 11:39:54 pve kernel: bus_probe_device+0x9f/0xb0 Jun 02 11:39:54 pve kernel: deferred_probe_work_func+0x8e/0xf0 Jun 02 11:39:54 pve kernel: process_one_work+0x16d/0x350 Jun 02 11:39:54 pve kernel: worker_thread+0x306/0x440 Jun 02 11:39:54 pve kernel: ? __pfx_worker_thread+0x10/0x10 Jun 02 11:39:54 pve kernel: kthread+0xf2/0x120 Jun 02 11:39:54 pve kernel: ? __pfx_kthread+0x10/0x10 Jun 02 11:39:54 pve kernel: ret_from_fork+0x47/0x70 Jun 02 11:39:54 pve kernel: ? __pfx_kthread+0x10/0x10 Jun 02 11:39:54 pve kernel: ret_from_fork_asm+0x1b/0x30 Jun 02 11:39:54 pve kernel: </TASK>
Hat jemand eine Idee was da zerschossen sein könnte?
-
@chaot Was für ein Update genau?
Major Release?
-
@wendy2702 Nein.
Zwar ein Kernel Update, aber kein Major release.
Ich sehe leider als Linux Laie keinen richtigen Ansatzpunkt. Scheint irgendwas mit einem angeschlossenem Gerät zu tun zu haben, aber welches kann ich nicht zuordnen. -
@chaot sagte in Proxmox nach Update mit Fehler:
u4 pve kernel: snd_soc_skl 0000:00:0e.0: Error creating sysfs entry
Jun 02 11:39:54 pve kernel: snd_soc_avs 0000:00:0e.0: DSP detected with PCI class/subclass/prog-if info 0x040380
Jun 02 11:39:54 pve kernel: sof-audio-pci-intel-apl 0000:00:0e.0: DSP detected with PCI class/subclass/prog-if info 0x040380
Jun 02 11:39:54 pve kernel: sof-audio-pci-intel-apl 0000:00:0e.0: DSP detected with PCI class/subclass/prog-if 0x040380
Jun 02 11:39:54 pve kernel: snd_soc_skl 0000:00:0e.0: DSP detected with PCI class/subclass/prog-if info 0x040380
Jun 02 11:39:54 pve kernel: sysfs: cannot create duplicate filename '/devices/pci0000:00/0000:00:0e.0/platform_id'
Was für Devices sind denn angeschlossen?
Sieht für mich nach Problem mit einem PCI Device aus.
Ich gehe mal davon aus das du den Server schon komplett neu gestartet hast?
-
@wendy2702 Server ist neu gestartet.
Am USB Port hängen:
1 USV
1 ext HDD
1 Netzwerkkarte 2,5 Gbroot@pve:~# lspci 00:00.0 Host bridge: Intel Corporation Celeron N3350/Pentium N4200/Atom E3900 Series Host Bridge (rev 0b) 00:02.0 VGA compatible controller: Intel Corporation HD Graphics 500 (rev 0b) 00:0e.0 Audio device: Intel Corporation Celeron N3350/Pentium N4200/Atom E3900 Series Audio Cluster (rev 0b) 00:0f.0 Communication controller: Intel Corporation Celeron N3350/Pentium N4200/Atom E3900 Series Trusted Execution Engine (rev 0b) 00:12.0 SATA controller: Intel Corporation Celeron N3350/Pentium N4200/Atom E3900 Series SATA AHCI Controller (rev 0b) 00:13.0 PCI bridge: Intel Corporation Celeron N3350/Pentium N4200/Atom E3900 Series PCI Express Port A #1 (rev fb) 00:13.1 PCI bridge: Intel Corporation Celeron N3350/Pentium N4200/Atom E3900 Series PCI Express Port A #2 (rev fb) 00:13.2 PCI bridge: Intel Corporation Celeron N3350/Pentium N4200/Atom E3900 Series PCI Express Port A #3 (rev fb) 00:15.0 USB controller: Intel Corporation Celeron N3350/Pentium N4200/Atom E3900 Series USB xHCI (rev 0b) 00:16.0 Signal processing controller: Intel Corporation Celeron N3350/Pentium N4200/Atom E3900 Series I2C Controller #1 (rev 0b) 00:18.0 Signal processing controller: Intel Corporation Celeron N3350/Pentium N4200/Atom E3900 Series HSUART Controller #1 (rev 0b) 00:19.0 Signal processing controller: Intel Corporation Celeron N3350/Pentium N4200/Atom E3900 Series SPI Controller #1 (rev 0b) 00:19.1 Signal processing controller: Intel Corporation Celeron N3350/Pentium N4200/Atom E3900 Series SPI Controller #2 (rev 0b) 00:19.2 Signal processing controller: Intel Corporation Celeron N3350/Pentium N4200/Atom E3900 Series SPI Controller #3 (rev 0b) 00:1a.0 Serial bus controller: Intel Corporation Celeron N3350/Pentium N4200/Atom E3900 Series PWM Pin Controller (rev 0b) 00:1f.0 ISA bridge: Intel Corporation Celeron N3350/Pentium N4200/Atom E3900 Series Low Pin Count Interface (rev 0b) 00:1f.1 SMBus: Intel Corporation Celeron N3350/Pentium N4200/Atom E3900 Series SMBus Controller (rev 0b) 01:00.0 Unassigned class [ff00]: Realtek Semiconductor Co., Ltd. RTS5229 PCI Express Card Reader (rev 01) 02:00.0 Network controller: Intel Corporation Dual Band Wireless-AC 3168NGW [Stone Peak] (rev 10) 03:00.0 Ethernet controller: Realtek Semiconductor Co., Ltd. RTL8111/8168/8411 PCI Express Gigabit Ethernet Controller (rev 15)
-
@chaot sagte in Proxmox nach Update mit Fehler:
sysfs: cannot create duplicate filename '/devices/pci0000:00/0000:00:0e.0/platform_id'
eventuell ein bug im kernel
du könntest zurück auf den alten kernel und schauen ob der host wieder normal läuft
-
@crunchip
Da habe ich ehrlich gesagt keine Ahnung wie ich das machen könnte. -
@chaot sagte in Proxmox nach Update mit Fehler:
aber welches kann ich nicht zuordnen.
bin da zwar auch nicht firm, jedoch wäre das meine Vermutung
@chaot sagte in Proxmox nach Update mit Fehler:
Jun 02 11:39:54 pve kernel: sof-audio-pci-intel-apl 0000:00:0e.0: DSP detected with PCI class/subclass/prog-if info 0x040380 Jun 02 11:39:54 pve kernel: sof-audio-pci-intel-apl 0000:00:0e.0: DSP detected with PCI class/subclass/prog-if 0x040380 Jun 02 11:39:54 pve kernel: snd_soc_skl 0000:00:0e.0: DSP detected with PCI class/subclass/prog-if info 0x040380 Jun 02 11:39:54 pve kernel: sysfs: cannot create duplicate filename '/devices/pci0000:00/0000:00:0e.0/platform_id'
@chaot sagte in Proxmox nach Update mit Fehler:
00:0e.0 Audio device: Intel Corporation Celeron N3350/Pentium N4200/Atom E3900 Series Audio Cluster (rev 0b
-
-
@crunchip Danke für den Tip.
Bin auf den alten Kernel zurück und das Problem ist weg. -
@chaot sagte in Proxmox nach Update mit Fehler:
@crunchip Danke für den Tip.
Bin auf den alten Kernel zurück und das Problem ist weg.Jou, dann ist aber dein Problem aber noch nicht gelöst, die Entwicklung geht weiter.
Ständig müssen wir ja die Systeme aktualisieren, um mit einem aktuellen und (möglichst) sicheren System arbeiten zu können.
-
@meister-mopper Das mag stimmen, aber laut dem Link von crunchip ist in dem Kernel ein Bug der bisher nicht gefunden wurde.
Also werde ich vorerst den alten Kernel nutzen und im Auge behalten ob der Bug in Kernel 6.8 irgendwann behoben wird.
Da ich nicht der einzige Betroffene bin wird das vermutlich schon irgendwie in Arbeit sein. Leider ist mein Linuxwissen aber bei weitem nicht ausreichend genug um dem Entwickler wirklich weiterhelfen zu können.
Meine Hilfe beschränkt sich darauf, dass ich im Proxmox Suppoert Forum meine Konfiguration hinterlege und ein paar Fragen beantworte. -
@chaot Hilft zwar jetzt überhaupt nicht wirklich, aber ich habe gestern meine 3 Proxmox-Hosts auch aktualisiert, inklusive aller LXC und VM die drauf laufen und inklusive Kernel-Update und habe auf allen 3 keinerlei Problem.
Je mehr Infos Du also im Proxmox-Forum liefern kannst, desto eher wird man da rausfinden, was da bei manchen „krumm“ läuft.Gruss, Jürgen
-
ja der 6.8.2 ist buggy... ob der 6.8.3 auch so ist.. bei manchen schon bei anderen nicht
auf jeden fall scheint es probleme bei den Nuc's zu geben.. aber auch nicht bei allen..
ich bleib auch erstmal bei 6.5.13-5
scheint mir sicherer zu sein
-
Danke.
Es scheinen tatsächlich veile ältere NUCs betroffen zu sein was ich so lese.
Ich werde aber vermutlich nicht umhin kommen den Proxmox neu aufzusetzen.
Ich kann seit dem Vorfall nicht mehr mit Grafana auf die InfluxDB zugreifen. Die DB läuft und ich komme auch mit anderen Programmen drauf, nur eben nicht mit Grafana (im selben CT installiert).
Außerdem kann ich von dem Container kein "Suspend"-Backup mehr machen.
Also ist scheinbar der Container irgendwie beschädigt.Bevor das jetzt irgendwie im Hintergrund andere CTs auch vorgeschädigt hat mache ich lieber am nächsten WE die Kiste neu. Dann kann ich beruhigter sein.
-
@arteck sagte in Proxmox nach Update mit Fehler:
ja der 6.8.2 ist buggy... ob der 6.8.3 auch so ist.. bei manchen schon bei anderen nicht
??? Ich dachte, der aktuelle proxmox Kernel ist 8.2 ???
Ich hab auf meinen Intel NUCs jeweils "virtual environment 8.2.2" laufen, ohne Probleme (iobroker, redis, pihole, unifi jeweils in containern und über usb jeweils eine externe Festplatten)
-
@amg_666 sagte in Proxmox nach Update mit Fehler:
virtual environment 8.2.2
Ist nicht gleich Kernel version
-
@amg_666 VE 8.2 kommt mit Kernel Version 6.8, die Version 8.1 hatte Kernel 6.5.13
Bei mir hat das auch ne Zeitlang funktioniert bis ich die Kiste neu gestartet habe......wegen dem Kernelupdate -
@chaot dann ist bei dir was anderes im Magen..
proxmox hat nix mit den dadrunter liegenden Container zu tun.. ausser der verwaltet dessen Laufzeitumgebung
-
@arteck Das war mir schon klar. Ich denke, dass der Container schon länger beschädigt ist. Das ist eben jetzt erst aufgefallen nachdem das System neu gestartet wurde.
Aber ich bin sowieso am Überlegen, ob ich die InfluxDB überhaupt weiter benötige, bzw. ob ich Grafana brauche.