ECS: xDoctor RAP162: Verbleibende Lebensdauer der SSD-Systemfestplatte oder SSDr-Festplatte mit niedrigem Wert
Zusammenfassung: Eine geringe verbleibende Systemfestplattenlebensdauer kann ein Problem darstellen, wenn die SSD- oder SSDr-Nodes eine Lebensdauer von weniger als 5 % der verbleibenden Lebensdauer aufweisen. ...
Symptome
xDoctor berichtet RAP162:
------------------------------------------
ERROR - System disk has low remaining life
------------------------------------------
Node = Nodes
Extra = {"Nodes": {"169.254.1.13": {"BTWM5AM000UB": {"used_life": "255"}}, "169.254.1.14": {"BTWM59N0079B": {"used_life": "255"}}, "169.254.1.15": {"BTWM59N002PB": {"used_life": "255"}}, "169.254.1.16": {"BTWM59N0025B": {"used_life": "255"}}}}
RAP = RAP162
Solution = KB 215459
Timestamp = 2023-06-30_132850
PSNT = Rome @ 4.8-92.0
----------------------------------------
ERROR - SSDR disk has low remaining life
----------------------------------------
Node = Nodes
Extra = {"Nodes": {"169.254.1.13": {"BTWM5AM000UA": {"used_life": "255"}}, "169.254.1.14": {"BTWM59N0077B": {"used_life": "255"}}, "169.254.1.15": {"BTWM59N002AB": {"used_life": "255"}}, "169.254.1.16": {"BTWM59N0025C": {"used_life": "255"}}}}
RAP = RAP162
Solution = KB 215459
Timestamp = 2023-06-30_132850
PSNT = Rome @ 4.8-92.0 Es wurde eine hohe Festplattenauslastung auf dem System erkannt, indem die SAR-Daten überprüft wurden, die alle 10 Minuten Informationen sammeln, um festzustellen, ob das System ein Festplattenleistungsproblem mit hoher Wartezeit in den SAR-Statistiken aufweist.
Eine weitere Prüfung kann die SAR-Daten für die Leistung der SATA-SSD- und/oder SATA-SSDr-Lesecachefestplatte des Betriebssystems validieren:
Befehl: (Betriebssystem, SATA, SSD, einzelner Node)
# ssd=$(cs_hal list --all disks | grep 'intl/sys'|awk '{print $2}'|sed 's/.*[/:]//');sar -d -p --dev=$ssdBefehl: (Betriebssystem SATA SSD Cluster)
# svc_exec "ssd=\$(cs_hal list --all disks | grep 'intl/sys'|awk '{print \$2}'|sed 's/.*[/:]//');sar -d -p --dev=\$ssd"SSDr-Lesecachefestplatte:
Befehl: (SATA, SSDr, Lesecache, Festplatte, einzelner Node)
# ssdr=$(sudo -i fcli agent disk.disks --pretty-print | grep "READ_CACHE" | awk '{print $2}');sar -d -p --dev=$ssdrBefehl: (SATA-SSDr-Lesecache-Festplattencluster)
# svc_exec "ssdr=\$(sudo -i fcli agent disk.disks --pretty-print | grep "READ_CACHE" | awk '{print \$2}');sar -d -p --dev=\$ssdr"Beispiel: (Vergewissern Sie sich, dass die Wartezeiten für die letzten drei SAR-Prüfungen über 100 liegen.)
[...Output Truncated...]
DEV tps rkB/s wkB/s areq-sz aqu-sz await svctm %util
12:10:01 sdad 3.23 69.58 130.87 62.14 29.78 9503.41 224.33 72.36
12:10:01 DEV tps rkB/s wkB/s areq-sz aqu-sz await svctm %util
12:20:01 sdad 2.24 35.28 18.28 23.95 67.97 29994.40 371.69 83.11
12:30:01 sdad 2.72 76.23 91.17 61.48 17.16 6813.32 102.38 27.88
[...Output Truncated...]Ursache
SSD und SSDr haben eine nutzbare Lebensdauer, d. h., wie lange die Festplatte funktionieren kann, bis sie ausfällt. Diese Schlüsselprüfungen müssen durchgeführt werden, um festzustellen, ob ein Fehler besorgniserregend ist und ein Austausch gerechtfertigt ist.
- Wenn die Lebensdauer der SATA-SSD- und/oder SATA-SSDr-Lesecachefestplatte des Betriebssystems 85 % oder 15 % verbleibende Kapazität erreicht, wird ein proaktiver Austausch empfohlen.
- Wenn die Lebensdauer des Betriebssystems SATA SSD und/oder SATA SSDr, Read Cache Disk 95 % belegt oder 5 % Restlaufzeit erreicht ist, wird ein reaktiver Austausch empfohlen
Betriebssystem SATA SSD:
- Überprüfen Sie SSD-Festplattenausfälle mithilfe der folgenden Anleitung, die alle Systemfestplatten auf VDC prüft und einzeln überprüft werden kann. Unterschiedliche SSD-Modelle erzeugen unterschiedliche Ausgaben.
# svc_exec "ssd=\$(cs_hal list --all disks | grep 'intl/sys' |awk '{print \$2}');sudo /usr/sbin/smartctl -l devstat \$ssd | grep Endurance;sudo /usr/sbin/smartctl -a \$ssd | grep -w 245"Beispiel 1: (Indikator für den Prozentsatz der genutzten Lebensdauer und die prozentuale verbleibende Lebensdauer)
admin@node1:~> svc_exec "ssd=\$(cs_hal list --all disks | grep 'intl/sys' |awk '{print \$2}');sudo /usr/sbin/smartctl -l devstat \$ssd | grep Endurance;sudo /usr/sbin/smartctl -a \$ssd | grep -w 245"
svc_exec v1.0.6 (svc_tools v2.12.2) Started 2023-06-30 13:47:17
Output from node: r1n1 retval: 0
0x07 0x008 1 90 --- Percentage Used Endurance Indicator
245 Percent_Life_Remaining 0x0032 064 064 000 Old_age Always - 10 <-- % Remaining.
...[Output Truncated]...
admin@node1:~> svc_exec "ssd=\$(cs_hal list --all disks | grep 'intl/sys' |awk '{print \$2}');sudo /usr/sbin/smartctl -l devstat \$ssd | grep Endurance;sudo /usr/sbin/smartctl -a \$ssd | grep -w 245"
svc_exec v1.0.6 (svc_tools v2.12.2) Started 2023-06-30 13:47:17
Output from node: r1n1 retval: 0
0x07 0x008 1 85 --- Percentage Used Endurance Indicator
245 Unknown_Attribute 0x0032 064 064 000 Old_age Always - 15 <-- % Remaining is reported as Unknown_Attribute.
...[Output Truncated]...
Beispiel 3: (Verbleibende Lebensdauer in Prozent)
admin@node1:~> svc_exec "ssd=\$(cs_hal list --all disks | grep 'intl/sys' |awk '{print \$2}');sudo /usr/sbin/smartctl -l devstat \$ssd | grep Endurance;sudo /usr/sbin/smartctl -a \$ssd | grep -w 245"
svc_exec v1.0.6 (svc_tools v2.12.1) Started 2023-06-30 13:53:41
Output from node: r1n1 retval: 0
245 Percent_Life_Remaining 0x0032 082 082 000 Old_age Always - 5 <-- % Remaining.
...[Output Truncated]...
Beispiel 4: (Anzeige für den Prozentsatz der genutzten Lebensdauer)
admin@node1:~> svc_exec "ssd=\$(cs_hal list --all disks | grep 'intl/sys' |awk '{print \$2}');sudo /usr/sbin/smartctl -l devstat \$ssd | grep Endurance;sudo /usr/sbin/smartctl -a \$ssd | grep -w 245"
svc_exec v1.0.6 (svc_tools v2.12.2) Started 2023-06-30 14:02:03
Output from node: r1n1 retval: 1
0x07 0x008 1 95 N-- Percentage Used Endurance Indicator <-- % Used subtract from 100 for % Remaining.
...[Output Truncated]...
Beispiel 5: (Unknown_Attribute)
admin@node1:~> svc_exec "ssd=\$(cs_hal list --all disks | grep 'intl/sys' |awk '{print \$2}');sudo /usr/sbin/smartctl -l devstat \$ssd | grep Endurance;sudo /usr/sbin/smartctl -a \$ssd | grep -w 245"
svc_exec v1.0.6 (svc_tools v2.12.1) Started 2023-06-30 13:53:41
Output from node: r1n1 retval: 0
245 Unknown_Attribute 0x0032 082 082 000 Old_age Always - 10 <-- % Remaining is reported as Unknown_Attribute
...[Output Truncated]...
- Prüfung einzelner Nodes zur Untersuchung von Festplatten auf Node-Basis
Befehl:
# ssd=$(cs_hal list --all disks | grep 'intl/sys' |awk '{print $2}');sudo /usr/sbin/smartctl -l devstat $ssd | grep Endurance;sudo /usr/sbin/smartctl -a $ssd | grep -e 245
Beispiel: Beziehen Sie sich auf die fünf Beispiele in Schritt, um den richtigen Prozentsatz für die Lebensdauer auf dem Node zu erhalten.
SATA-SSDr-Lesecachefestplatte:
- Um auf SSDr-Lesecachefestplattenfehler zu prüfen, werden im Folgenden alle Systemfestplatten auf VDC überprüft. Diese können einzeln geprüft werden. Verschiedene SSDr-Modelle erzeugen unterschiedliche Ausgaben.
# svc_exec "ssdr=\$(sudo -i fcli agent disk.disks --pretty-print | grep "READ_CACHE" | awk '{print \$2}');sudo /usr/sbin/smartctl -l devstat \$ssdr | grep Endurance;sudo /usr/sbin/smartctl -a \$ssdr | grep -w 245"Beispiel 1: (Indikator für den Prozentsatz der genutzten Lebensdauer und die prozentuale verbleibende Lebensdauer)
admin@node1:~> svc_exec "ssdr=\$(sudo -i fcli agent disk.disks --pretty-print | grep "READ_CACHE" | awk '{print \$2}');sudo /usr/sbin/smartctl -l devstat \$ssdr | grep Endurance;sudo /usr/sbin/smartctl -a \$ssdr | grep -w 245"
svc_exec v1.0.6 (svc_tools v2.12.2) Started 2023-06-30 13:47:17
Output from node: r1n1 retval: 0
0x07 0x008 1 95 --- Percentage Used Endurance Indicator
245 Percent_Life_Remaining 0x0032 064 064 000 Old_age Always - 5 <-- % Remaining.
...[Output Truncated]...
admin@node1:~> svc_exec "ssdr=\$(sudo -i fcli agent disk.disks --pretty-print | grep "READ_CACHE" | awk '{print \$2}');sudo /usr/sbin/smartctl -l devstat \$ssdr | grep Endurance;sudo /usr/sbin/smartctl -a \$ssdr | grep -w 245"
svc_exec v1.0.6 (svc_tools v2.12.2) Started 2023-06-30 13:47:17
Output from node: r1n1 retval: 0
0x07 0x008 1 94 --- Percentage Used Endurance Indicator
245 Unknown_Attribute 0x0032 064 064 000 Old_age Always - 6 <-- % Remaining is reported as Unknown_Attribute.
...[Output Truncated]...
Beispiel 3: (Verbleibende Lebensdauer in Prozent)
admin@node1:~> svc_exec "ssdr=\$(sudo -i fcli agent disk.disks --pretty-print | grep "READ_CACHE" | awk '{print \$2}');sudo /usr/sbin/smartctl -l devstat \$ssdr | grep Endurance;sudo /usr/sbin/smartctl -a \$ssdr | grep -w 245"
svc_exec v1.0.6 (svc_tools v2.12.1) Started 2023-06-30 13:53:41
Output from node: r1n1 retval: 0
245 Percent_Life_Remaining 0x0032 082 082 000 Old_age Always - 15 <-- % Remaining.
...[Output Truncated]...
Beispiel 4: (Anzeige für den Prozentsatz der genutzten Lebensdauer)
admin@node1:~> svc_exec "ssdr=\$(sudo -i fcli agent disk.disks --pretty-print | grep "READ_CACHE" | awk '{print \$2}');sudo /usr/sbin/smartctl -l devstat \$ssdr | grep Endurance;sudo /usr/sbin/smartctl -a \$ssdr | grep -w 245"
svc_exec v1.0.6 (svc_tools v2.12.2) Started 2023-06-30 14:02:03
Output from node: r1n1 retval: 1
0x07 0x008 1 80 N-- Percentage Used Endurance Indicator <-- % Used subtract from 100 for % Remaining.
...[Output Truncated]...
Beispiel 5: (Unknown_Attribute)
admin@node1:~> svc_exec "ssdr=\$(sudo -i fcli agent disk.disks --pretty-print | grep "READ_CACHE" | awk '{print \$2}');sudo /usr/sbin/smartctl -l devstat \$ssdr | grep Endurance;sudo /usr/sbin/smartctl -a \$ssdr | grep -w 245"
svc_exec v1.0.6 (svc_tools v2.12.1) Started 2023-06-30 13:53:41
Output from node: r1n1 retval: 0
245 Unknown_Attribute 0x0032 082 082 000 Old_age Always - 10 <-- % Remaining is reported as Unknown_Attribute
...[Output Truncated]...
- Prüfung einzelner Nodes, um Festplatten auf Node-Basis zu untersuchen.
Befehl:
# ssdr=$(sudo -i fcli agent disk.disks --pretty-print | grep "READ_CACHE" | awk '{print $2}');sudo /usr/sbin/smartctl -l devstat $ssdr | grep Endurance;sudo /usr/sbin/smartctl -a $ssdr | grep -w 245
Beispiel: Beziehen Sie sich auf die fünf Beispiele in Schritt, um den richtigen Prozentsatz für die Lebensdauer auf dem Node zu erhalten.