Ein fröhliches Hallo an alle Raspi-Freunde
Nachdem die (üblichen) Startschwirigkeiten überwunden waren, habe ich meine Nextcloud auf dem CM5 installiert.
Beim Kauf der Komponenten war ich mir nicht sicher, wie der SDRAM auf dem CM5 angesprochen wird (Geschwindigkeit), und habe mir zusätlich ein NVME-Modul zugelegt. Dies wollte ich dann als Ersatz für die sonst übliche SD-Ram- Karte nutzen. Das war mal
ich habe 'ROOT' und 'BOOT/FIRMWARE' auf den mmcblk, das 'HOME' ist Part 1 der NVME und das Web (ohne data) ist Partition 2 der NVME. Hinzu kommen noch 2 externe HDD zur Aufnahme der Nextcloud - DATA, sowie ein SMB-Shared fürs Heimische Netz und auf der 2. Platte läuft nachts Backup
So weit so gut.
Nach der Fertigstellung aller Einstellungen stellte sich nach 2 - 3 Tagen Laufzeit ein Fehler ein. Über nacht ist der PI ausgestiegen. Nach dem Neustart konnte ich nur noch sehen, dass Kernel-Panik ausgelöst wurde. Zu diesem Zeitpunkt hatte ich noch eine SWAP-Partition auf der NVME. Und ein fehlender SWAP löste den Fehler aus.
Nagut, kann schon mal passieren. SMART zeigte keinerlei Fehler beim Schreiben oder lesen, aber einen Verbindungsabriss. Ergo dachte ich mir, der Pi hat sich 'verschluckt'
Nach 2 Tagen wieder das gleiche Problem. Cirka 04:00 Uhr Kernel-Panik kann nicht auf SWAP zugreifen.
Also habe ich sicherheitshalber auf der ext. HDD einen SWAP eingerichtet und eingebunden. Aber das kann es ja nicht alleine gewesen sein.
Dann kam mir der RP1 in den Sinn. Wird der zu heiß, und schaltet sich ab? Also mir die Temperatur vom RP1 angeschaut. Ui, ca. 65°C. Sodann wurde ein passender Kühlkörper erworben, und seit dem lümmelt sich der RP1 bei ca. 54°C rum. (Checked)
Nun kommt der Dämpfer.
Heute ... vor ca. 1,5 Stunden ... Fehler .. zum Glück nicht Kernel-Panik
ABER
Mar 09 16:40:01 raspberrypi CRON[1236751]: pam_unix(cron:session): session opened for user www-data(uid=33) by (uid=0)
Mar 09 16:40:01 raspberrypi CRON[1236752]: (www-data) CMD (php -f /var/www/nc/cron.php)
Mar 09 16:40:01 raspberrypi CRON[1236751]: pam_unix(cron:session): session closed for user www-data
Mar 09 16:40:43 raspberrypi kernel: nvme nvme0: controller is down; will reset: CSTS=0xffffffff, PCI_STATUS=0x10
Mar 09 16:40:43 raspberrypi kernel: nvme nvme0: Does your device have a faulty power saving mode enabled?
Mar 09 16:40:43 raspberrypi kernel: nvme nvme0: Try "nvme_core.default_ps_max_latency_us=0 pcie_aspm=off pcie_port_pm=off" and report a bug
Mar 09 16:40:43 raspberrypi kernel: nvme 0000:01:00.0: enabling device (0000 -> 0002)
Mar 09 16:40:43 raspberrypi kernel: nvme nvme0: Disabling device after reset failure: -19
Mar 09 16:40:43 raspberrypi kernel: I/O error, dev nvme0n1, sector 71307376 op 0x1:(WRITE) flags 0x103000 phys_seg 1 prio class 2
Mar 09 16:40:43 raspberrypi kernel: I/O error, dev nvme0n1, sector 32462960 op 0x1:(WRITE) flags 0x0 phys_seg 1 prio class 2
Mar 09 16:40:43 raspberrypi kernel: Buffer I/O error on dev nvme0n1p1, logical block 8913166, lost async page write
Mar 09 16:40:43 raspberrypi kernel: EXT4-fs warning (device nvme0n1p1): ext4_end_bio:342: I/O error 10 writing to inode 2244469 starting block 4057870)
Mar 09 16:40:43 raspberrypi kernel: Buffer I/O error on device nvme0n1p1, logical block 4057614
Mar 09 16:40:43 raspberrypi kernel: I/O error, dev nvme0n1, sector 71374512 op 0x1:(WRITE) flags 0x103000 phys_seg 1 prio class 2
Mar 09 16:40:43 raspberrypi kernel: Buffer I/O error on dev nvme0n1p1, logical block 8921558, lost async page write
Mar 09 16:40:43 raspberrypi kernel: I/O error, dev nvme0n1, sector 71376104 op 0x1:(WRITE) flags 0x103000 phys_seg 1 prio class 2
Mar 09 16:40:43 raspberrypi kernel: Buffer I/O error on dev nvme0n1p1, logical block 8921757, lost async page write
Mar 09 16:40:43 raspberrypi kernel: JBD2: Detected IO errors while flushing file data on nvme0n1p1-8
Mar 09 16:40:43 raspberrypi kernel: I/O error, dev nvme0n1, sector 71376128 op 0x1:(WRITE) flags 0x103000 phys_seg 1 prio class 2
Mar 09 16:40:43 raspberrypi kernel: Buffer I/O error on dev nvme0n1p1, logical block 8921760, lost async page write
Mar 09 16:40:43 raspberrypi kernel: I/O error, dev nvme0n1, sector 168084032 op 0x1:(WRITE) flags 0x0 phys_seg 3 prio class 2
Mar 09 16:40:43 raspberrypi kernel: EXT4-fs warning (device nvme0n1p1): ext4_end_bio:342: I/O error 10 writing to inode 2232042 starting block 21010504)
Mar 09 16:40:43 raspberrypi kernel: Buffer I/O error on device nvme0n1p1, logical block 21010248
Mar 09 16:40:43 raspberrypi kernel: Buffer I/O error on device nvme0n1p1, logical block 21010249
Mar 09 16:40:43 raspberrypi kernel: Buffer I/O error on device nvme0n1p1, logical block 21010250
Mar 09 16:40:43 raspberrypi kernel: Buffer I/O error on device nvme0n1p1, logical block 21010251
Mar 09 16:40:43 raspberrypi kernel: Buffer I/O error on device nvme0n1p1, logical block 21010252
Mar 09 16:40:43 raspberrypi kernel: Buffer I/O error on device nvme0n1p1, logical block 21010253
Mar 09 16:40:43 raspberrypi kernel: Buffer I/O error on device nvme0n1p1, logical block 21010254
Mar 09 16:40:43 raspberrypi kernel: Buffer I/O error on device nvme0n1p1, logical block 21010255
Mar 09 16:40:43 raspberrypi kernel: Buffer I/O error on device nvme0n1p1, logical block 21010256
Mar 09 16:40:43 raspberrypi kernel: I/O error, dev nvme0n1, sector 105553096 op 0x1:(WRITE) flags 0x9800 phys_seg 9 prio class 2
Mar 09 16:40:43 raspberrypi kernel: EXT4-fs error (device nvme0n1p1): ext4_check_bdev_write_error:224: comm Cache2 I/O: Error while async write back metadata
Mar 09 16:40:43 raspberrypi kernel: Aborting journal on device nvme0n1p1-8.
Mar 09 16:40:43 raspberrypi kernel: EXT4-fs warning (device nvme0n1p1): ext4_end_bio:342: I/O error 10 writing to inode 2244470 starting block 4055579)
Mar 09 16:40:43 raspberrypi kernel: Buffer I/O error on dev nvme0n1p1, logical block 13139968, lost sync page write
Mar 09 16:40:43 raspberrypi kernel: JBD2: I/O error when updating journal superblock for nvme0n1p1-8.
Mar 09 16:40:43 raspberrypi kernel: EXT4-fs error (device nvme0n1p1) in __ext4_new_inode:1139: Journal has aborted
Mar 09 16:40:43 raspberrypi kernel: Buffer I/O error on dev nvme0n1p1, logical block 0, lost sync page write
Mar 09 16:40:43 raspberrypi kernel: EXT4-fs (nvme0n1p1): I/O error while writing superblock
Mar 09 16:40:43 raspberrypi kernel: Buffer I/O error on dev nvme0n1p1, logical block 0, lost sync page write
Mar 09 16:40:43 raspberrypi kernel: EXT4-fs (nvme0n1p1): I/O error while writing superblock
Mar 09 16:40:43 raspberrypi kernel: EXT4-fs error (device nvme0n1p1) in ext4_create:2896: Journal has aborted
Mar 09 16:40:43 raspberrypi kernel: JBD2: Detected IO errors while flushing file data on nvme0n1p1-8
Mar 09 16:40:43 raspberrypi kernel: Buffer I/O error on dev nvme0n1p1, logical block 0, lost sync page write
Mar 09 16:40:43 raspberrypi kernel: EXT4-fs (nvme0n1p1): I/O error while writing superblock
Mar 09 16:40:43 raspberrypi kernel: EXT4-fs error (device nvme0n1p1): ext4_journal_check_start:84: comm Cache2 I/O: Detected aborted journal
Mar 09 16:40:43 raspberrypi kernel: Buffer I/O error on dev nvme0n1p1, logical block 0, lost sync page write
Mar 09 16:40:43 raspberrypi kernel: EXT4-fs (nvme0n1p1): I/O error while writing superblock
Mar 09 16:40:43 raspberrypi kernel: EXT4-fs (nvme0n1p1): Remounting filesystem read-only
Mar 09 16:40:43 raspberrypi kernel: EXT4-fs (nvme0n1p2): shut down requested (2)
Mar 09 16:40:44 raspberrypi kernel: Aborting journal on device nvme0n1p2-8.
Mar 09 16:40:44 raspberrypi kernel: Buffer I/O error on dev nvme0n1p2, logical block 13139968, lost sync page write
Mar 09 16:40:44 raspberrypi kernel: JBD2: I/O error when updating journal superblock for nvme0n1p2-8.
Mar 09 16:40:49 raspberrypi kernel: EXT4-fs warning (device nvme0n1p1): dx_probe:823: inode #2228438: lblock 0: comm Cache2 I/O: error -5 reading directory block
Mar 09 16:40:49 raspberrypi kernel: EXT4-fs warning (device nvme0n1p1): dx_probe:823: inode #2228438: lblock 0: comm Cache2 I/O: error -5 reading directory block
Mar 09 16:40:49 raspberrypi kernel: EXT4-fs warning (device nvme0n1p1): dx_probe:823: inode #2228438: lblock 0: comm Cache2 I/O: error -5 reading directory block
Mar 09 16:40:50 raspberrypi kernel: EXT4-fs warning (device nvme0n1p2): htree_dirblock_to_tree:1083: inode #1322226: lblock 0: comm bash: error -5 reading directory block
Mar 09 16:40:59 raspberrypi kernel: EXT4-fs warning (device nvme0n1p1): dx_probe:823: inode #2228438: lblock 0: comm Cache2 I/O: error -5 reading directory block
Mar 09 16:40:59 raspberrypi kernel: EXT4-fs warning (device nvme0n1p1): dx_probe:823: inode #2228438: lblock 0: comm Cache2 I/O: error -5 reading directory block
Mar 09 16:40:59 raspberrypi kernel: EXT4-fs warning (device nvme0n1p1): dx_probe:823: inode #2228438: lblock 0: comm Cache2 I/O: error -5 reading directory block
Mar 09 16:41:09 raspberrypi kernel: EXT4-fs warning (device nvme0n1p1): dx_probe:823: inode #2228438: lblock 0: comm Cache2 I/O: error -5 reading directory block
Mar 09 16:41:09 raspberrypi kernel: EXT4-fs warning (device nvme0n1p1): dx_probe:823: inode #2228438: lblock 0: comm Cache2 I/O: error -5 reading directory block
Mar 09 16:41:09 raspberrypi kernel: EXT4-fs warning (device nvme0n1p1): dx_probe:823: inode #2228438: lblock 0: comm Cache2 I/O: error -5 reading directory block
Mar 09 16:41:19 raspberrypi kernel: EXT4-fs warning (device nvme0n1p1): dx_probe:823: inode #2228438: lblock 0: comm Cache2 I/O: error -5 reading directory block
Mar 09 16:41:19 raspberrypi kernel: EXT4-fs warning (device nvme0n1p1): dx_probe:823: inode #2228438: lblock 0: comm Cache2 I/O: error -5 reading directory block
Mar 09 16:41:19 raspberrypi kernel: EXT4-fs warning (device nvme0n1p1): dx_probe:823: inode #2228438: lblock 0: comm Cache2 I/O: error -5 reading directory block
Mar 09 16:41:29 raspberrypi kernel: EXT4-fs warning (device nvme0n1p1): dx_probe:823: inode #2228438: lblock 0: comm Cache2 I/O: error -5 reading directory block
Mar 09 16:41:29 raspberrypi kernel: EXT4-fs warning (device nvme0n1p1): dx_probe:823: inode #2228438: lblock 0: comm Cache2 I/O: error -5 reading directory block
Mar 09 16:41:29 raspberrypi kernel: EXT4-fs warning (device nvme0n1p1): dx_probe:823: inode #2228438: lblock 0: comm Cache2 I/O: error -5 reading directory block
Display More
das ist das Protokoll. Es beginnt mit dem letztem geglücktem Zugriff (Nextcloud Cron-Job aus /var/www/nc welches auf NVME0 gemountet ist)
Und danach kommt der Ausstieg. Was ich mich frage, was meint das LOG nun mit Controller ist down. Ist das die Schnittstelle auf dem NVME Modul, oder die Schnittstelle im RP1 ?
Gibt es eine Möglichkeit zu Testen, welches Produkt hier welchen Fehler hat? Oder ob ich ein Timing-Problem habe ?
cloud-adm@raspberrypi:~ $ lspci
0000:00:00.0 PCI bridge: Broadcom Inc. and subsidiaries BCM2712 PCIe Bridge (rev 30)
0000:01:00.0 Non-Volatile memory controller: Silicon Motion, Inc. SM2263EN/SM2263XT SSD Controller (rev 03)
0001:00:00.0 PCI bridge: Broadcom Inc. and subsidiaries BCM2712 PCIe Bridge (rev 30)
0001:01:00.0 Ethernet controller: Raspberry Pi Ltd RP1 PCIe 2.0 South Bridge
Genutzt wird ein 250 GB Intenso Modul Firmware "X0304B0"
(Infos aus /sys/class/nvme
address = 0000:01:00.0
cntlid = 1
cntrltype = reserved
dctype = none
dev = 245:0
firmware_rev = X0304B0
kato = 0
model = Intenso SSD
numa_node = -1
queue_count = 5
serial = TD24090001*** (Seriennummer)
sqsize = 255
state = dead
subsysnqn = nqn.2024-09.com.siliconmotion:nvm-subsystem-sn-TD24090001*** (siehe oben)
transport = pcie
uevent = MAJOR=245
MINOR=0
DEVNAME=nvme0
NVME_TRTYPE=pcie
Kennt oder hatte schon mal jemand diesen Fehler ?
Als Workaround wird das NVME erstmal auf eine HD ausgelagert, bis das ich weiß wie der Fehler entsteht.
[EDIT1]
Während ich diesen Beitrag verfasst habe, scheint sich das System erholt zu haben.
Ich habe folgenden Bereich aus dem LOG
Mar 09 17:02:35 raspberrypi sudo[1245242]: cloud-adm : TTY=pts/3 ; PWD=/home/cloud-adm ; USER=root ; COMMAND=/usr/bin/find / -iname ksystemlog
Mar 09 17:02:35 raspberrypi sudo[1245242]: pam_unix(sudo:session): session opened for user root(uid=0) by (uid=1000)
Mar 09 17:02:35 raspberrypi kernel: EXT4-fs warning (device nvme0n1p2): htree_dirblock_to_tree:1083: inode #2: lblock 0: comm find: error -5 reading directory block
Mar 09 17:02:38 raspberrypi kernel: EXT4-fs warning (device nvme0n1p1): htree_dirblock_to_tree:1083: inode #2: lblock 0: comm find: error -5 reading directory block
Mar 09 17:02:40 raspberrypi sudo[1245242]: pam_unix(sudo:session): session closed for user root
Mar 09 17:05:01 raspberrypi CRON[1246613]: pam_unix(cron:session): session opened for user www-data(uid=33) by (uid=0)
[/EDIT1]