Kein cronjob-Eintrag. anacron habe ich nicht. Wie finde ich service-unit/timer-unit? Darf ich den Prozess abschiessen?
Beiträge von hajoko
-
-
Moin. Mein Raid5 macht mich wahnsinnig. Jetzt läuft alles wunderbar, alle 3 Platten laufen (UUU), aber... Das Ganze ist derzeit extrem langsam, da nämlich im Hintergrund ein mdadm Job läuft.
Der Übeltäter scheint hier zu sein:
Codeps -auxww|grep mdadm root 371 0.0 0.0 2680 1028 ? Ss Feb21 0:01 /sbin/mdadm --monitor --scan pi 8374 0.0 0.0 7360 484 pts/0 S+ 10:10 0:00 grep --color=auto mdadm
sudo cat /proc/mdstat zeigt:
CodePersonalities : [raid6] [raid5] [raid4] md127 : active raid5 sdd1[0] sdc1[4] sda[3] 5860245504 blocks super 1.2 level 5, 512k chunk, algorithm 2 [3/3] [UUU] [===>.................] check = 18.8% (553758752/2930122752) finish=2410.6min speed=16429K/sec bitmap: 2/22 pages [8KB], 65536KB chunk
Warum läuft plötzlich eine "check" Job? Der läuft dann wieder 2 Tage.
Kommt der immer automatisch (war früher nicht) oder habe ich aus Versehen irgendwas eingerichtet?
Wie bekomme ich das weg? Darf ich den Prozess abschiessen?
Danke für Hilfe. Schönen Sonntag noch.
-
Siehe mein Beitrag #19.
Nicht nervös werden: Diese beiden Angaben geben die Klasse / den Typ des SMART-Wert an und sind keine Bewertung das aktuellen Inhalts.
...
Du siehst also: Kein Grund nervös zu sein.
Bei der von mir gezeigten Ausgabe der SMART-Daten der NAS wird sogar auf die Anzeige der Einstufung der Werte verzichtet: Die SW der NAS bewertet selbst anhand der Historie bestimmter Werte die "Gesundheit" der Platten...Super. Endlich kapiert. Danke Zentris!
-
Die Platte ist wie neu... 108 Stunden eingeschaltet, lief kaum, ist immer wieder schlafen gegangen.
Welche Werte beunruhigen dich denn?
In diesen 108 Stunden wurde 5x ein SMART-Test (Short) gestartet... das ist recht häufig...
Danke Zentris. Die mehrfachen Tests kamen daher, dass ich mich mit Smart erstmal vertraut machen wollte. Schön, wenn die Platten kerngesund sind. Was mich beunruhigt ist immer noch pre-fail und old-age. Warum wird das angezeigt, wenn doch alles in Ordnung ist? Was mache oder interpretiere ich falsch?
-
Die von smartctl ausgedruckte Attributtabelle zeigt auch den „TYP“ des Attributs. Attribute sind einer von zwei möglichen Typen:
Vor-Ausfall (pre-fail) oder Alter (old-age).
Vor-Ausfall-Attribute sind Attribute, die, wenn sie kleiner oder gleich ihren Schwellenwerten sind, auf einen bevorstehenden Festplattenausfall hinweisen.
Alter oder Nutzungsattribute sind solche, die auf das Ende hinweisen - Produktlebensdauer ab Alter oder normaler Alterung und Abnutzung, wenn der Attributwert kleiner oder gleich dem Schwellenwert ist.
Das genau verstehe ich nicht. Sind bei mir die Grenzwerte falsch oder habe ich wirklich die 2 Probleme? Die Platte ist neu - oder nicht?
-
Nachschub:
Ich habe hier mal testweise eine WD-Platte per "billig" USB-Adapter angeschlossen.
Als "-d" Parameter hab ich -d sat,16 verwendet, nachdem andere Parameter nicht gingen (also durchprobiert...)
Ergebnis (erfolgreich, so o.ä. sollte dass dann auch bei dir aussehen...) :
Code
Alles anzeigensudo smartctl -a /dev/sdb -d sat,16 smartctl 7.2 2020-12-30 r5155 [x86_64-linux-6.5.0-17-generic] (local build) Copyright (C) 2002-20, Bruce Allen, Christian Franke, www.smartmontools.org === START OF INFORMATION SECTION === Model Family: WD Blue / Red / Green SSDs Device Model: WDC WDS500G2B0A-00SM50 Serial Number: 2122BT447110 LU WWN Device Id: 5 001b44 4a7da7ffa Firmware Version: 415020WD User Capacity: 500.107.862.016 bytes [500 GB] Sector Size: 512 bytes logical/physical Rotation Rate: Solid State Device Form Factor: 2.5 inches TRIM Command: Available, deterministic, zeroed Device is: In smartctl database [for details use: -P show] ATA Version is: ACS-4 T13/BSR INCITS 529 revision 5 SATA Version is: SATA 3.3, 6.0 Gb/s (current: 6.0 Gb/s) Local Time is: Mon Feb 26 22:17:22 2024 CET SMART support is: Available - device has SMART capability. SMART support is: Enabled === START OF READ SMART DATA SECTION === SMART overall-health self-assessment test result: PASSED General SMART Values: Offline data collection status: (0x00) Offline data collection activity was never started. Auto Offline Data Collection: Disabled. Self-test execution status: ( 0) The previous self-test routine completed without error or no self-test has ever been run. Total time to complete Offline data collection: ( 0) seconds. Offline data collection capabilities: (0x11) SMART execute Offline immediate. No Auto Offline data collection support. Suspend Offline collection upon new command. No Offline surface scan supported. Self-test supported. No Conveyance Self-test supported. No Selective Self-test supported. SMART capabilities: (0x0003) Saves SMART data before entering power-saving mode. Supports SMART auto save timer. Error logging capability: (0x01) Error logging supported. General Purpose Logging supported. Short self-test routine recommended polling time: ( 2) minutes. Extended self-test routine recommended polling time: ( 10) minutes. SMART Attributes Data Structure revision number: 4 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 5 Reallocated_Sector_Ct 0x0032 100 100 --- Old_age Always - 0 9 Power_On_Hours 0x0032 100 100 --- Old_age Always - 34 12 Power_Cycle_Count 0x0032 100 100 --- Old_age Always - 8 165 Block_Erase_Count 0x0032 100 100 --- Old_age Always - 1179659 166 Minimum_PE_Cycles_TLC 0x0032 100 100 --- Old_age Always - 0 167 Max_Bad_Blocks_per_Die 0x0032 100 100 --- Old_age Always - 257 168 Maximum_PE_Cycles_TLC 0x0032 100 100 --- Old_age Always - 1 169 Total_Bad_Blocks 0x0032 100 100 --- Old_age Always - 690 170 Grown_Bad_Blocks 0x0032 100 100 --- Old_age Always - 0 171 Program_Fail_Count 0x0032 100 100 --- Old_age Always - 0 172 Erase_Fail_Count 0x0032 100 100 --- Old_age Always - 0 173 Average_PE_Cycles_TLC 0x0032 100 100 --- Old_age Always - 0 174 Unexpected_Power_Loss 0x0032 100 100 --- Old_age Always - 1 184 End-to-End_Error 0x0032 100 100 --- Old_age Always - 0 187 Reported_Uncorrect 0x0032 100 100 --- Old_age Always - 0 188 Command_Timeout 0x0032 100 100 --- Old_age Always - 0 194 Temperature_Celsius 0x0022 077 038 --- Old_age Always - 23 (Min/Max 23/38) 199 UDMA_CRC_Error_Count 0x0032 100 100 --- Old_age Always - 0 230 Media_Wearout_Indicator 0x0032 001 001 --- Old_age Always - 0x000200000002 232 Available_Reservd_Space 0x0033 100 100 004 Pre-fail Always - 100 233 NAND_GB_Written_TLC 0x0032 100 100 --- Old_age Always - 46 234 NAND_GB_Written_SLC 0x0032 100 100 --- Old_age Always - 88 241 Host_Writes_GiB 0x0030 253 253 --- Old_age Offline - 76 242 Host_Reads_GiB 0x0030 253 253 --- Old_age Offline - 56 244 Temp_Throttle_Status 0x0032 000 100 --- Old_age Always - 0 SMART Error Log Version: 1 No Errors Logged SMART Self-test log structure revision number 1 Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error # 1 Short offline Completed without error 00% 28 - # 2 Short offline Completed without error 00% 3 - Selective Self-tests/Logging not supported
Ich hatte einige probiert, dann aber aufgegeben, Morgen gehts weiter mit Deinen Hinweisen. Danke.
-
Hast du mein Post #6 überhaupt gelesen UND verstanden UND bist dem Link gefolgt?
Wenn ich deine Folgebeiträge so lese, wohl eher nicht.
Die Ausgaben des smartmon-Tools deuten darauf hin, dass die SMART Befehle denUSB-Adapter nicht passieren. Sonst wären die Ausgaben ausführlicher
Genau dazu dienen die zusätzlichen Parameter in meinem Link. Dort muss man entweder durch probieren den richtigen USB-Adapter ermitteln oder ggf. nachsehen im Boot-Protokoll, das ist aber auf der Seite rudimentär beschrieben.Alles andere ist Zeitvergeudung: Wenn deine WD-Platte "schlägt" ist sie entweder kaputt oder der Rechner macht da irgendwas im ext4 Filesystem (Zeitstempel letzter Zugriff Datei). Das kann man im mount-Befehl abschalten.
Doch, habe ich gelesen. Geht damit aber auch nicht weiter. Danke für den Hinweis mount. Werde ich mir ansehen.
-
Hast Du mal versucht, an deinem Windowsrechner mit einem Tool die SMART Werte deiner HDDs auszulesen?
Nein, nicht. Kann Windows überhaupt etwas mit einer ext4 Platte anfangen?
-
NTFS kennt auch Links - aber mit denen kann rsync nichts anfangen. Kurzum: Wenn Du rsnapshot nutzen willst musst Du mit ext4 formatieren.
Oh danke für den Hinweis framp. Da hätte ich fast Mist gebaut.
-
Wenn Du UAS abschalten kannst -> hast Du kein Problem mehr mit Deinen Platten. Allerdings hast Du dann auch keine Platten mehr im Zugriff.
Oops, davon war in der Beschreibung keine Rede. Danke.
-
Und da wir gerade bei den Platten sind....
Die WD 16TB schlägt hör- und fühlbar alle 5 Sekunden (ext4)
Die Seagate (ext4) rappelt beim mounten wie ein ganzer Güterzug. Nach umount schlägt sie einmal ca. alle 8 Sekunden.
Aber: formatiere ich sie wieder mit exFAT (so kommt sie), bleibt sie gemounted oder unmounted total ruhig. Bei Format NFTS ebenfalls völlig ruhig. Am Win-10 PC ebenso.
Ich kann diesen Krach am Schreibtisch nicht gebrauchen, außerdem klingt es völlig krank - wie bei einem bevorstehenden Ausfall.
Ich würde gern ext4 verwenden, muss ich vermutlich auch wegen Einsatz als Backup-Platte mit rsnapshot. Da werden jede Menge Links angelegt, keine Ahnung ob NTFS das kann.
-
Nächste Seltsamkeit. Neue 16TB Seagate Extreme. Smart liefert
Code
Alles anzeigensudo smartctl -a -d scsi -T permissive /dev/sda smartctl 7.2 2020-12-30 r5155 [armv7l-linux-5.10.63-v7l+] (local build) Copyright (C) 2002-20, Bruce Allen, Christian Franke, www.smartmontools.org === START OF INFORMATION SECTION === Vendor: Seagate Product: Expansion HDD Revision: 0003 Compliance: SPC-4 User Capacity: 16.000.900.660.736 bytes [16,0 TB] Logical block size: 512 bytes Physical block size: 4096 bytes Logical Unit id: 0x5000000000000001 Serial number: 00000000NT175EWR Device type: disk Local Time is: Mon Feb 26 17:16:28 2024 CET SMART support is: Available - device has SMART capability. SMART support is: Disabled Temperature Warning: Disabled or Not Supported === START OF READ SMART DATA SECTION === SMART Health Status: OK Current Drive Temperature: 0 C Drive Trip Temperature: 0 C Error Counter logging not supported Device does not support Self Test logging
Danach mit "sudo smartctl -d scsi -s on /dev/sda" versucht, Smart einzuschalten, Ergebnis wie oben.
-
Das "Problem" ist der USB-Adapter:
Viele USB-Adapter geben die SMART-Steuerbefehle nicht oder nicht vollständig an die Platte weiter. Es gibt eine Möglichkeit, den Adapter zu steuern, jedenfalls einige Adapter.
Schau mal hier : https://www.smartmontools.org/wiki/USB
Ich hatte gelesen, dass UAS (was immer das ist) Probleme machen kann. Gemäß einer Anleitung habe ich versucht, das abzuschalten, hat leider nicht geklappt, UAS bleibt an.
-
Es gibt schon ein schärferes Tool (hdparm), das aber aus gutem Grund im Pi-OS nicht vorinstalliert ist.
Wenn es aber um die "Gesundheit" eines Filesystems geht, sind bei jedem Filesystem Diagnosetools dabei.
Welche Plattenparameter willst Du denn wissen ?
Ich möchte keinen besonderen Paramter wissen. Ich möchte nur sicher sein, dass die Platte (läuft schon länger) in Ordnung ist und ich sie guten Gewissens einsetzen kann.
-
Verwendest Du USB Adapter o. sind es externe HDD's mit USB Anschluß? Wie man die smartmontool Datenbank updated ist hier gut beschrieben:
https://www.thomas-krenn.com/de/wiki/Smartm…e_aktualisieren
Wenn deine USB Adapter SMART nicht vollständig unterstützen und ein Update der DB nicht hilft, bleibt nur andere Adapter zu verwenden, die HDD evtl. aus ihrem externen Gehäuse auszubauen und diese ggf. in einem PC zu testen.
Du kannst die HDD's auch mit dem Befehl badblocks auf defekte Sektoren testen, das wird aber einige Zeit dauern die Abfrage des HDD Controller mit SMART liefert im Normalfall viel mehr Daten, als nur defekte Sektoren.
Die Platten sind externe Festplatten mit USB-Anschluss im Gehäuse, z.B. Seagate Extreme, 4TB, 16TB. Nähere Einzelheiten zum USB-Anschluss habe ich nicht und den USB am Raspi-4 kennt ihr ja. Den Link kenne ich, habs auch so gemacht.
Eine einzige meiner Platten am selben Raspi liefert Antworten, eine 16TB WD.
Code
Alles anzeigensudo smartctl -a /dev/sda smartctl 7.2 2020-12-30 r5155 [armv7l-linux-5.10.63-v7l+] (local build) Copyright (C) 2002-20, Bruce Allen, Christian Franke, www.smartmontools.org === START OF INFORMATION SECTION === Device Model: WDC WD160EDGZ-11B2DA0 Serial Number: 4BKHA09Y LU WWN Device Id: 5 000cca 2b6f13da7 Firmware Version: 85.00A85 User Capacity: 16.000.900.661.248 bytes [16,0 TB] Sector Sizes: 512 bytes logical, 4096 bytes physical Rotation Rate: 7200 rpm Form Factor: 3.5 inches Device is: Not in smartctl database [for details use: -P showall] ATA Version is: ACS-4 published, ANSI INCITS 529-2018 SATA Version is: SATA 3.3, 6.0 Gb/s (current: 6.0 Gb/s) Local Time is: Mon Feb 26 16:35:40 2024 CET SMART support is: Available - device has SMART capability. SMART support is: Enabled === START OF READ SMART DATA SECTION === SMART overall-health self-assessment test result: PASSED General SMART Values: Offline data collection status: (0x80) Offline data collection activity was never started. Auto Offline Data Collection: Enabled. Self-test execution status: ( 0) The previous self-test routine completed without error or no self-test has ever been run. Total time to complete Offline data collection: ( 101) seconds. Offline data collection capabilities: (0x5b) SMART execute Offline immediate. Auto Offline data collection on/off support. Suspend Offline collection upon new command. Offline surface scan supported. Self-test supported. No Conveyance Self-test supported. Selective Self-test supported. SMART capabilities: (0x0003) Saves SMART data before entering power-saving mode. Supports SMART auto save timer. Error logging capability: (0x01) Error logging supported. General Purpose Logging supported. Short self-test routine recommended polling time: ( 2) minutes. Extended self-test routine recommended polling time: (1822) minutes. SCT capabilities: (0x003d) SCT Status supported. SCT Error Recovery Control supported. SCT Feature Control supported. SCT Data Table supported. SMART Attributes Data Structure revision number: 16 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x000b 100 100 001 Pre-fail Always - 0 2 Throughput_Performance 0x0004 134 134 054 Old_age Offline - 104 3 Spin_Up_Time 0x0007 083 083 001 Pre-fail Always - 344 (Average 359) 4 Start_Stop_Count 0x0012 100 100 000 Old_age Always - 24 5 Reallocated_Sector_Ct 0x0033 100 100 001 Pre-fail Always - 0 7 Seek_Error_Rate 0x000a 100 100 001 Old_age Always - 0 8 Seek_Time_Performance 0x0004 128 128 020 Old_age Offline - 18 9 Power_On_Hours 0x0012 100 100 000 Old_age Always - 108 10 Spin_Retry_Count 0x0012 100 100 001 Old_age Always - 0 12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 24 22 Unknown_Attribute 0x0023 100 100 025 Pre-fail Always - 100 192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 28 193 Load_Cycle_Count 0x0012 100 100 000 Old_age Always - 28 194 Temperature_Celsius 0x0002 056 056 000 Old_age Always - 29 (Min/Max 19/49) 196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Always - 0 197 Current_Pending_Sector 0x0022 100 100 000 Old_age Always - 0 198 Offline_Uncorrectable 0x0008 100 100 000 Old_age Offline - 0 199 UDMA_CRC_Error_Count 0x000a 100 100 000 Old_age Always - 0 SMART Error Log Version: 1 No Errors Logged SMART Self-test log structure revision number 1 Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error # 1 Short offline Completed without error 00% 98 - # 2 Short offline Completed without error 00% 42 - # 3 Short offline Completed without error 00% 42 - # 4 Short offline Completed without error 00% 42 - # 5 Short offline Completed without error 00% 41 - SMART Selective self-test log data structure revision number 1 SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS 1 0 0 Not_testing 2 0 0 Not_testing 3 0 0 Not_testing 4 0 0 Not_testing 5 0 0 Not_testing Selective self-test flags (0x0): After scanning selected spans, do NOT read-scan remainder of disk. If Selective self-test is pending on power-up, resume after 0 minute delay.
Und dazu gleich noch eine Frage. Die Platte ist nagelneu. Bei "TYPE" kommen Ausgaben wie "Pre-fail" und "Old_age". Bedeutet das, dass die Platte bald ausfallen wird? Bedeuted das, dass es eine alte Platte ist? Oder sehe ich da etwas ganz falsch?
-
Hatte ich auch gedacht. Die Platten hängen über USB am Raspi. Die Datenbank habe ich nach diversen Anleitungen aktualisiert. Und die Vorgehensweise ist hier im Forum ja ausreichend beschrieben worden. Ratlos... Zu den Eingaben melde ich mich nochmal - meine Frau ruft
-
Moin.
Ich habe im Forum und mit Google gesucht, aber nichts brauchbares gefunden. Einzig S.M.A.R.T. ist zu finden, das aber läuft auf den wenigsten Platten. Ich habe mit allen möglichen Parametern versucht, immer kommt "not supported". Ich habe auch den Forumsartikel zur "Festplattenanalyse" gefunden, hilft auch nicht.
Smart geht nur soweit, dass ich den Plattentyp erfahre, mehr nicht. Danach habe ich 2 Seagate- und 2 Intenso-Platten, je 4TB. Ich habe auch versucht, nach dieser Anleitung https://blog.karssen.org/2022/05/19/get…#comment-254658 die Seagate zu überreden, war auch nichts.
Ich habe bei den o.g. Platten eine, der ich nicht traue und würde gern testen, ob ich sie aus dem Verkehr ziehe, oder ob sie doch völlig in Ordnung ist. Kennt jemand ein Tool, mit dem ich das machen könnte?
-
Danke erstmal. Die defekte Platte ist sda1. Um 1000%ig sicher zu gehen habe ich jetzt eine 4. Platte drangehängt und ins Raid aufgenommen (die defekte ist eh schon raus). Die UUID habe ich mit
Coderoot@raspi1:~# gdisk -l /dev/sda Partition table scan: MBR: protective BSD: not present APM: not present GPT: damaged Disk identifier (GUID): 74BAE2D3-C2CC-4EF7-9B51-193EE6B62F18
gefunden. Ich warte jetzt mal ab, der rebuild wird voraussichtlich wieder 2 Tage und Nächte dauern. Danach werde ich die kaputte Platte abziehen (natürlich wenn alles runtergefahren und aus ist), in der Hoffnung, dass ich dann die richtige (kaputte) erwischt habe.
Code
Alles anzeigenmdadm --detail /dev/md127 Number Major Minor RaidDevice State 0 8 49 0 active sync /dev/sdd1 4 8 33 1 active sync /dev/sdc1 3 8 0 2 spare rebuilding /dev/sda cat /proc/mdstat Personalities : [raid6] [raid5] [raid4] md127 : active raid5 sdd1[0] sdc1[4] sda[3] 5860245504 blocks super 1.2 level 5, 512k chunk, algorithm 2 [3/2] [UU_] [>....................] recovery = 1.1% (32896504/2930122752) finish=2892.3min speed=16694K/sec bitmap: 22/22 pages [88KB], 65536KB chunk 2892 Sek -> 48 Std -> 2 Tage :-(
Danke für die Tips!
Ich tendiere im Augenblick dahin, dass ich das RAID-5 mit 3*3TB Platten (nutzbar 5.5TB) durch ein RAID-1 mit 2*8TB ersetze. Erscheint mir sicherer und besser zugreifbar, da die Files direkt zugreifbar sind und nicht wie bei RAID-5 verteilt sind und eine einzelne Platte nicht normal (d.h. in der normalen Verzeichnisstruktur) zu gebrauchen ist.
-
Die Identifizierung der Platte mittels Seriennummern, wie teilweise beschrieben, funktioniert nicht, da auf den Platten (Intenso) keine angegeben ist und smartctl die Platten nicht kennt und daher nichts auflistet.
-
Moin.
Es geht schon wieder los! Es sieht so aus als wäre wieder eine Platte ausgefallen. Das kommt davon, wenn ich jetzt kontrolliere...
Auf jeden Fall liefert sudo mdadm -D /dev/md127
Code
Alles anzeigen/dev/md127: Version : 1.2 Creation Time : Thu Oct 8 10:43:39 2020 Raid Level : raid5 Array Size : 5860245504 (5588.77 GiB 6000.89 GB) Used Dev Size : 2930122752 (2794.38 GiB 3000.45 GB) Raid Devices : 3 Total Devices : 2 Persistence : Superblock is persistent Intent Bitmap : Internal Update Time : Wed Feb 21 09:07:49 2024 State : clean, degraded Active Devices : 2 Working Devices : 2 Failed Devices : 0 Spare Devices : 0 Layout : left-symmetric Chunk Size : 512K Consistency Policy : bitmap Name : raspberrypi:vol1 UUID : 1be7c389:9f3c06bf:ea59f8e8:c6cec7c8 Events : 1793361 Number Major Minor RaidDevice State 0 8 33 0 active sync /dev/sdc1 4 8 17 1 active sync /dev/sdb1 - 0 0 2 removed
Daraus schließe ich, dass das System derzeit nur mit 2 Platten läuft (was ein RAID5 bei Ausfall einer Platte ja auch automatisch tun sollte).
State : clean, degraded
Active Devices : 2
Working Devices : 2Am Ende der Liste stehen "active" sdb1 und sdc1. Das dritte Device "sda1" fehlt, ist "removed" (sdd1 ist die Backup-Platte).
Oder sehe ich hier irgendetwas falsch?