Raspbian hängt sich auf

  • Hallo,

    ich hab ein eigentlich recht stabil laufenden Pi3 B+. Manchmal hängt er sich aber auf, bisher hab ich nichts gefunden was ich da mache. Da er manchmal trotz Belastung lange stabil läuft, glaub ich nicht an ein Problem mit dem Netzteil. Da verwende ich ein richtiges für den Pi empfohlenes.

    Kann man einen Log laufen lassen der auch in eine Datei schreibt um sehen zu können wann das genau passiert und was kurz vorher was? Oder läuft sowas schon?

    Richard

  • Da verwende ich ein richtiges für den Pi empfohlenes.

    Welches verwendest du?


    Kann man einen Log laufen lassen der auch in eine Datei schreibt um sehen zu können wann das genau passiert und was kurz vorher was? Oder läuft sowas schon?

    Hierbei kann dir evtl dmesg weiterhelfen.

    EDIT:

    Kann man eingrenzen wann sich der Pi aufhängt? Im Leerlauf, oder wenn er viele Daten über das Netzwerk übertragen muss, und und und...

    Schonmal mit htop die RAM Auslastung beobachtet?

  • Ich kenne die Bezeichnung nicht. Wurde mit einem Raspi-All in One-Paket von Amazon geliefert.

    Zeigt mit dmesg auch vergangene Meldungen, die ggf. schon in einer Logdatei gespeichert sind, an oder muss ich da etwas einrichten, dass ich das in einer Datei habe.

  • Ich kenne die Bezeichnung nicht. Wurde mit einem Raspi-All in One-Paket von Amazon geliefert.

    Das hat doch sicherlich ein Typenschild? Nur weil etwas bei einem Paket dabei ist, heißt es nicht das es passend ist.

    Zeigt mit dmesg auch vergangene Meldungen, die ggf. schon in einer Logdatei gespeichert sind, an oder muss ich da etwas einrichten, dass ich das in einer Datei habe.

    Da bist du dann wohl mit journalctl besser bedient

  • ... laufenden Pi3 B+. Manchmal hängt er sich aber auf, ...

    Kannst Du das etwas genauer beschreiben? Wie stellst Du fest, dass dein PI3 sich aufgehängt hat? Wie ist dein PI3 mit dem Netzwerk verbunden? Hast Du eine Tastatur und einen Monitor an deinem PI3?

    The most popular websites without IPv6 in Germany.  IPv6-Ausreden

    Meine PIs

    PI4B/8GB (border device) OpenBSD 7.4 (64bit): SSH-Server, WireGuard-Server, ircd-hybrid-Server, stunnel-Proxy, Mumble-Server

    PI3B+ FreeBSD 14.0-R-p3 (arm64): SSH-Serv., WireGuard-Serv., ircd-hybrid-Serv., stunnel-Proxy, Mumble-Serv., ddclient

    PI4B/4GB Bullseye-lite (64bit; modifiziert): SSH-Server, WireGuard-Server, ircd-hybrid-Server, stunnel-Proxy, Mumble-Server, botamusique, ample

  • Ich kann nicht mehr auf die laufenden Dienste zugreifen: webuis von nzbget, transmission, jdownloader oder per ssh.

    Interessanterweise geht ping von einem anderen Rechner noch.

  • Ich kann nicht mehr auf die laufenden Dienste zugreifen: ... oder per ssh.

    Ist das temporär? Wenn nicht, wie gehst Du dann mit deinem PI3 um, damit Du wieder per ssh auf diesen zugreifen kannst?

    The most popular websites without IPv6 in Germany.  IPv6-Ausreden

    Meine PIs

    PI4B/8GB (border device) OpenBSD 7.4 (64bit): SSH-Server, WireGuard-Server, ircd-hybrid-Server, stunnel-Proxy, Mumble-Server

    PI3B+ FreeBSD 14.0-R-p3 (arm64): SSH-Serv., WireGuard-Serv., ircd-hybrid-Serv., stunnel-Proxy, Mumble-Serv., ddclient

    PI4B/4GB Bullseye-lite (64bit; modifiziert): SSH-Server, WireGuard-Server, ircd-hybrid-Server, stunnel-Proxy, Mumble-Server, botamusique, ample

  • Nein, ist dauerhaft.

    Ausschalten, geht ja sonst nicht anders. Normal läuft er 24/7.

    Was heißt "wie gehst Du dann mit deinem PI3 um"? Aus dem Fenster werf ich den nicht.

  • Bin jetzt gerade zu Hause und hab den Pi neu gestartet und dann mal journalctl ausgeführt. Da steht was komisches. Logischerweise viele Einträge von gerade jetzt, dann aber auch viele von 15:17, da war ich aber noch nicht zu Hause. Danach kommen Einträge vom 3. November (!!!). Der erste Eintrag vom 16.10. 15:17 lautet

    Code
    Okt 16 15:17:01 raspberrypi fake-hwclock[95]: Di 16. Okt 13:17:01 UTC 2018

    Kann es sein, dass er sich mit der Systemzeit verhaspelt?

    Es steht nur ein Fehler drin:

    Code
    Nov 03 18:16:43 raspberrypi blkmapd[131]: open pipe file /run/rpc_pipefs/nfs/blocklayout failed: No such file or directory


    In der /var/log/syslog stehen interessanterweise durchgehend Einträge für Heute drin. Kann es sein, dass vielleicht gar nicht der ganze Pi sich aufgehängt hat sondern vllt. nur das Netzwerkinterface oder etwas anderes?

  • Kann es sein, dass vielleicht gar nicht der ganze Pi sich aufgehängt hat sondern vllt. nur das Netzwerkinterface oder etwas anderes?

    Ja das kann sein, denn wenn der ganze PI sich aufgehängt hat, sollte der Hardware-Watchdog aktiv werden.

    Wie ist jetzt die Ausgabe von:

    Code
    ls -ls /dev/watchdog

    Wenn vorhanden, dann starte mal (als Test) eine forkbomb auf deinem PI3 um zu sehen ob dein PI3 rebootet.

    BTW: Wie schaltest Du deinen PI3 aus, wenn dieser sich aufgehängt hat?

    EDIT:

    Lasse mal deinen PI3, periodisch per cronjob einen nicht angeforderten arp-reply senden. Wenn er sich dann aufgehängt hat, kannst Du im (W)LAN mit tcpdump den arp-reply sniffen (oder auch nicht sniffen):

    Code
    sudo apt-get install iputils-arping
    sudo nano /etc/crontab
    Code
    */3 *    * * *    root /usr/bin/arping -q -c 2 -A -I <Interface> -s <IPv4-Adresse-PI3> 255.255.255.255 > /dev/null 2>&1

    Im (W)LAN:

    Code
    sudo tcpdump -vvveni <Interface> host <IPv4-Adresse-PI3> and arp

    The most popular websites without IPv6 in Germany.  IPv6-Ausreden

    Meine PIs

    PI4B/8GB (border device) OpenBSD 7.4 (64bit): SSH-Server, WireGuard-Server, ircd-hybrid-Server, stunnel-Proxy, Mumble-Server

    PI3B+ FreeBSD 14.0-R-p3 (arm64): SSH-Serv., WireGuard-Serv., ircd-hybrid-Serv., stunnel-Proxy, Mumble-Serv., ddclient

    PI4B/4GB Bullseye-lite (64bit; modifiziert): SSH-Server, WireGuard-Server, ircd-hybrid-Server, stunnel-Proxy, Mumble-Server, botamusique, ample

    Einmal editiert, zuletzt von rpi444 (16. Oktober 2018 um 20:50)

  • Bevor ich das alles teste, vllt. hab ich was. Hab bei youtube eine Playlist erstellt, in die ich Sachen zum DL packe. Auf dem prüfe ich alle 2 Minuten ob da neue Sachen drin sind und ladt sie runter. Kann es sein, dass ich damit unbeabsichtigt etwas wie eine forkbomb gemacht hab? Vllt. startet hier alle 2min ein neuer Prozess da die meusten DL länger dauern. Uch nutze war eine Archivdatei um doppelte DL zu verhindern, wird aber erst erstellt wenn der DL fertig ist.

  • Kann es sein, dass ich damit unbeabsichtigt etwas wie eine forkbomb gemacht hab?

    Nein, denn weiter oben schreibst Du das der Ping noch geht, aber der Zugriff per ssh nicht.

    Und wenn der hardware-watchdog aktiv ist, würde dieser bei einer forkbomb deinen PI neu starten.

    EDIT:

    Wie sind auf deinem PI, die Ausgaben von:

    Code
    sysctl kernel.panic kernel.panic_on_oops kernel.panic_on_rcu_stall kernel.panic_on_warn
    ethtool -k <Interface>

    (ohne spitze Klammern und betr. Interface siehe die Ausgabe von "ip a")?

    Evtl. musst Du ethtool nich installieren:

    Code
    sudo apt-get install ethtool

    The most popular websites without IPv6 in Germany.  IPv6-Ausreden

    Meine PIs

    PI4B/8GB (border device) OpenBSD 7.4 (64bit): SSH-Server, WireGuard-Server, ircd-hybrid-Server, stunnel-Proxy, Mumble-Server

    PI3B+ FreeBSD 14.0-R-p3 (arm64): SSH-Serv., WireGuard-Serv., ircd-hybrid-Serv., stunnel-Proxy, Mumble-Serv., ddclient

    PI4B/4GB Bullseye-lite (64bit; modifiziert): SSH-Server, WireGuard-Server, ircd-hybrid-Server, stunnel-Proxy, Mumble-Server, botamusique, ample

    Einmal editiert, zuletzt von rpi444 (24. Oktober 2018 um 00:28)

  • Hab jetzt mit lockfile eine Sperre eingebaut, die eine doppelte Ausführung des Skriptes verhindert und es läuft bisher einwandfrei. Schien doch das Problem gewesen zu sein.

    Wieso der Ping klappte weiß ich nicht.

    Wenn ich zu Hause bin liefer ich die Ausgaben noch nach.

  • Zitat

    wenn der ganze PI sich aufgehängt hat, sollte der Hardware-Watchdog aktiv werden.

    Zitat

    Und wenn der hardware-watchdog aktiv ist, würde dieser bei einer forkbomb deinen PI neu starten.

    Aber nicht wenn nur das Interface nicht mehr antwortet?

    Code
    sysctl kernel.panic kernel.panic_on_oops kernel.panic_on_rcu_stall kernel.panic_on_warn
    kernel.panic = 0
    kernel.panic_on_oops = 0
    kernel.panic_on_rcu_stall = 0
    kernel.panic_on_warn = 0
  • Aber nicht wenn nur das Interface nicht mehr antwortet?

    Doch, wenn das "interne Geschehen" mit einer forkbomb gleichwertig ist, würde der watchdog den Pi rebooten.

    Versuch mal mit den Zeilen:

    Code
    kernel.panic = 30
    kernel.panic_on_oops = 1
    vm.oom_kill_allocating_task = 1
    vm.panic_on_oom = 1

    in der /etc/sysctl.conf

    Danach:

    Code
    sudo sysctl -p

    Und mit:

    Code
    /sbin/ethtool -K eth0 gro off gso off

    in der /etc/rc.local (oder gleichwertig).

    The most popular websites without IPv6 in Germany.  IPv6-Ausreden

    Meine PIs

    PI4B/8GB (border device) OpenBSD 7.4 (64bit): SSH-Server, WireGuard-Server, ircd-hybrid-Server, stunnel-Proxy, Mumble-Server

    PI3B+ FreeBSD 14.0-R-p3 (arm64): SSH-Serv., WireGuard-Serv., ircd-hybrid-Serv., stunnel-Proxy, Mumble-Serv., ddclient

    PI4B/4GB Bullseye-lite (64bit; modifiziert): SSH-Server, WireGuard-Server, ircd-hybrid-Server, stunnel-Proxy, Mumble-Server, botamusique, ample

  • Muss mal fragen: Was bewirkt das? Wie gesagt: ich hab das Problem gefunden. Seither keine Abstürze mehr.

  • Was bewirkt das? Wie gesagt: ich hab das Problem gefunden.

    Das bewirkt, dass bei bestimmten Vorkommnissen (out of memory, oops) eine Kernel-panic ausgelöst wird und dein PI nach 30 Sekunden rebootet.

    Aber wenn Du das Problem schon gefunden hast bzw. gelöst hast, dann musst Du nichts mehr unternehmen.

    The most popular websites without IPv6 in Germany.  IPv6-Ausreden

    Meine PIs

    PI4B/8GB (border device) OpenBSD 7.4 (64bit): SSH-Server, WireGuard-Server, ircd-hybrid-Server, stunnel-Proxy, Mumble-Server

    PI3B+ FreeBSD 14.0-R-p3 (arm64): SSH-Serv., WireGuard-Serv., ircd-hybrid-Serv., stunnel-Proxy, Mumble-Serv., ddclient

    PI4B/4GB Bullseye-lite (64bit; modifiziert): SSH-Server, WireGuard-Server, ircd-hybrid-Server, stunnel-Proxy, Mumble-Server, botamusique, ample

Jetzt mitmachen!

Du hast noch kein Benutzerkonto auf unserer Seite? Registriere dich kostenlos und nimm an unserer Community teil!