Filesystem kaputt? Kein reboot mehr.

Heute ist Stammtischzeit:
Jeden Donnerstag 20:30 Uhr hier im Chat.
Wer Lust hat, kann sich gerne beteiligen. ;)
  • Hey Leute,

    ich hab seit geraumer Zeit immer mal wieder ein Problem mit meinem Pi4.

    Kurz zur Konfiguration:

    Pi4 -> SSD als Systemplatte, Externe Festplatten (WD) mit eigener Stromversorgung als Nas, NFS-Server, Samba-Server, KNX-Server, Plexmediaserver

    Nun zu meinem Problem. Ich hab im Wohnzimmer eine Vu+ Box, die per NFS auf das Pi4-Nas zugreift. Irgendwann passiert es dann, dass der NFS-Server nicht erreichbar ist.

    Ich komme dann per SSH noch auf den Pi, aber wenn ich ein

    Code
    sudo reboot
    sudo shutdown -r now

    mache, dann geht der wohl aus, startet aber nicht mehr. Früher hat es dann gereicht, dass ich die Spannungsversorgung abgezogen habe und dann wieder dran gesteckt hab. Als nächstes habe ich dann das Standard-Problem Netzteil (kein originales) gegen ein originales getauscht.

    Jetzt nach ein paar Wochen war es wieder so. Nur ging dann am Wochenende gar nix mehr.

    Die SSD habe ich dann in einem Ubuntu-Rechner mit Gparted überprüfen und reparieren lassen. Es waren ein paar Fehler drin, die dann korrigiert wurden. Ging trotzdem nicht.

    Ein zurückspielen eines Backups hat dann geholfen.

    Ich bräuchte jetzt mal ein paar Tips wie ich beim nächsten Mal dem Problem auf die Spur kommen kann bzw. woran das liegen kann.

    Ich hab schon das Trim der SSD in Verdacht und hab mal den trim.timer abgeschaltet.

    Ich tippe auf ein defektes Filesystem oder ähnliches, aber warum?!

  • Externe Festplatten (WD) mit eigener Stromversorgung

    Eigene Stromversorgung ist eine gute Sache. Ich würde dennoch einen aktiven USB3-Hub verwenden, weil HDDs trotzdem Strom aus dem USB des RPi ziehen. Das zumindest ist meine Erfahrung.

    Ein weiterer Ansatz wäre, dass die Partitionen der HDDs per /dev/sdx statt per UUID gemountet werden. Dann kann es schon mal passieren, dass sich die Reihenfolge ändert.

    Wie Du das eingerichtet hast weiß ich natürlich nicht, wollte es aber trotzdem erwähnen.

  • Ja, das passt alles mit den Festplatten. Das ist auch kein Problem.

    Das Problem ist, dass der NFS-Server auf einmal nicht mehr funktioniert und ein reboot auch nicht. Dann muss ich quasi wieder ein Backup zurückspielen.

    Irgendwie ist das System dann zerschossen. Ich weiß nur nicht warum...

    Die externe ist ne WD MyBook mit 2*3TB.

    Auf die eine liegen alle Daten und auf die andere wird nachts gespiegelt und die gelöschten Dateien liegen dann auch in einem extra Ordner. Das klappt ja auch alles.

  • Das Problem ist, dass der NFS-Server auf einmal nicht mehr funktioniert

    Gab es ein Update für NFS?

    Kann das auf die NFS-Freigabe zugreifende System das NFS des Servers richtig?

    Nicht dass sich zum Beispiel bei den Mount-Optionen etwas geändert hatte. Oder bei den Optionen, mit denen das NFS die Daten freigibt.

    Wird von dem von deinem PI verwendeten Linux noch die /etc/export unterstützt, oder läuft das jetzt anders?

    Startet der PI wirklich nicht mehr oder bleibt er wegen bestimmter Fehler beim Hochfahren stehen? Hier wäre dann ein Monitor praktisch

    Computer ..... grrrrrr

  • Reicht es da nicht den NFS-Server neu zu starten, statt das komplette System? :conf: Und dann den Stecker des RPi ziehen und damit das Dateisystem endgültig zerballern, weil nach dem vorherigen Steckerziehen das System vermutlich nicht genug Zeit hatte sich zu reparieren.

    In einer Logdatei unter /var/log ist bestimmt der Grund für dieses Verhalten zu finden. ;)

  • Der Pi läuft quasi immer im Hintergrund und ich mache sehr selten updates.

    Also es gab kein Update des NFS-Server.

    Ein Neustart des NFS-Servers hat nix gebracht. Er war einfach nicht mehr zu finden bzw. zu mounten. Das System ist dann quasi schon defekt.

    Den Pi neustarten habe ich ja versucht. Er wird auch runter gefahren, startet dann aber nicht mehr. Und ich hab den schon 30 Minuten Zeit zum starten gegeben. Manchmal startet er noch und manchmal eben nicht. Dann hilft meistens ein komplettes Stromlos machen oder eben neu flashen.

    In welcher Datei unter /var/log muss ich denn nachsehen, denn da hatte ich schonmal nachgesehen aber nicht wirklich was gefunden.

    Ich hatte das dann auf die Stromversorgung geschoben und ein original Netzteil bestellt.

    Edit: Der Pi ist per Lan angeschlossen.

  • In welcher Datei unter /var/log muss ich denn nachsehen, denn da hatte ich schonmal nachgesehen aber nicht wirklich was gefunden.

    Da Du ja auch schon mal das Netzteil in Verdacht hattest... under voltage detected z.B. findet man in der /var/log/syslog, ggf. auch in älteren syslog-Dateien, also syslog.1, syslog.2.gz, syslog.3.gz usw.

  • Hey Leute,

    ich hab seit geraumer Zeit immer mal wieder ein Problem mit meinem Pi4.

    sudo reboot ==> Neustart

    sudo shutdown -h now ==> Nieder fahren ... und das sofort (ohne nachfolgenden Neustart)

    sudo shutdown -r now ==> sofort neu starten (dieser Befehl wird manchmal nicht sauber ausgeführt, vor Allem nicht mit sudo. Wenn du ihn als root ausführst, sollte er immer funktionieren. Aber warum verwendest du nicht statt dessen einfach nur und ausschliesslich nur "sudo reboot"?

    Wenn alle Stricke reissen und du den Raspi an PoE angeschlossen hast, kannst ihm ja auch unter Umständen über den Switch die Stromversorgung nehmen?

  • Ich hab die Befehle alle als root ausgeführt und natürlich ohne sudo.

    Ich hatte das nur hier geschrieben, da sonst sofort kommt, dass ich sudo vergessen hätte.

    Egal.

    Ein einfaches reboot hatte ich auch gemacht, mit gleichem "Erfolg".

    Nein, der Raspbi ist nicht an POE angeschlossen. Ich hab ihm, nachdem ich einen der Befehle ausgeführt habe, durch trennen und wieder anstecken der Stromversorgung neu gestartet. Das hat meistens funktioniert, aber eben nicht immer. Manchmal musste ich dann sogar ein Backup flashen.

  • Wenn Du nur durch Steckerziehen den Pi booten konntest, ist es sehr wahrscheinlich, dass sich das root-Filesystem nicht mehr beim Starten reparieren konnte. Wenn Dein root Filesystem auf der SSD auf /dev/sda2 (Test mit < lsblk >) gemountet ist, kannst Du einen "dry run" des Reparaturprogrammes "e2fsck" bzw. "fsck.ext4" (das ist dasselbe) durchführen, das anzeigt, welche Zuornungen das Programm reparieren würde. Zum tatsächlichen Reparieren muss die Partition aber ungemountet werden < man e2fsck >, d.h. Du musst ein Linux von einer SD starten und die SSD danach allenfalls nochmal umounten.

    < sudo e2fsck -nfv /dev/sda2 > würde das Reparaturprogramm, ohne Änderungen tatsächlich vorzunehmen, durchlaufen lassen, wenn die SSD Rootpartition auf /dev/sda2 gemountet ist.

    Servus !

    RTFM = Read The Factory Manual, oder so

  • Das hatte ich ja versucht. Also SSD mit zu einem Ubuntu-Rechner genommen, Gparted gestarted, die beiden Partitionen in Gparted unmounted und reparieren lassen.

    Danach wieder am Raspi gehangen und nix geht.

    Also Backup geflasht und neugestartet. Danach ging es.

    Die Frage, die mich stellt, warum geht das System kaputt und das dann in der "Häufigkeit" von alle paar Wochen?

    Könnte das mit dem Trimmen zu tun haben?

    Ich hab das automatische trimmen durch abschalten des trim-timers jetzt mal abgestellt und beobachte mal wie das jetzt läuft.

  • Ja, bin ich. Das läuft, inklusive des vorherigen BananaPi, seit ca. 6 Jahren einwandfrei. Auch mit dem Raspi habe ich im Normfall keine Probleme.

    Die SSD ist ca. 6 Monate alt.

    Was ist der TBW Wert und wie kann ich den herausfinden?

    Ich betreibe den Pi ohne Desktop also nur mit Shell.

  • Die SSD ist ca. 6 Monate alt.

    Nach 6 Monaten sollte eine SSD noch keine Probleme haben und auch der TBW nicht hoch sein.

    Was ist der TBW Wert

    TerraBytesWritten - die Summe der Terrabytes die auf eine SSD geschrieben wurden. Siehe auch hier ein kleines Tool mit dem Du die auslesen kannst.

  • Ja, hatte ich auch mal gemacht. Ist aber schon ne Zeit lang her. Beim nächsten mal werde ich mir das alles näher anschauen.

    Das Problem ist wahrscheinlich auch nicht der NFS-Server. Bei dem fällt es nur als erstes auf, da die Kids die Freigabe mittags erreichen wollen und das eben nicht geht.

    Das System läuft zwar noch, zumindest teilweise, aber ein reboot funktioniert dann nicht mehr. Da wird das Filesystem schon schrott sein. Der NFS-Server/Freigabe ist nur das Symptom was ich sofort erkenne. Die Ursache wird wohl das defekte Filesystem sein.

    Bleibt nur die Frage warum?

    Wie gesagt, ich vermute den trim-Befehl. Daher habe ich den mal abgeschaltet und schau mal wie lange es jetzt läuft.

    Gruß wolder

Jetzt mitmachen!

Du hast noch kein Benutzerkonto auf unserer Seite? Registriere dich kostenlos und nimm an unserer Community teil!