PowerFlex 5.X: Laitteen raportoitu viive
Yhteenveto: Näyttöön tulee hälytys, kun laitteen viivekynnys ylittyy.
Oireet
Hälytysviesti
Warning
A Device on Storage Node <Node Name> (ID: <Node ID>), Device: <Device Path> has crossed the warning threshold for acceptable latency
Virhe
A Device on Storage Node <Node Name> (ID: <Node ID>), Device: <Device Path> has crossed the error threshold for acceptable latency
Varoituskynnykset
Varoitus - 10 sekuntia
Virhe - 20 sekuntia
Vaikutus
Laitteen viive voi aiheuttaa toistuvia DGWT-virheitä, I/O-virheitä ja metatietoyksikön (MU)epäonnistuneen tilan.
Syy
Useat tekijät vaikuttavat tai aiheuttavat laitteen viiveen. Ongelma voi liittyä esimerkiksi käyttöjärjestelmään (OS), PowerFlex-koodiin, laiteohjelmistoon (FW) ja laitteistoon (HW).
Tarkkuus
Vahvista laitteen tila ja kunto ja vaihda se tarvittaessa.
Viiveen arviointiin voidaan käyttää I/O-työkaluja, kuten dd, fio tai vdbench. Laitteen kunto voidaan tarkistaa myös Linux-apuohjelmilla (sar, smartctl) tai PowerFlex SCLI:llä.
Mahdollinen skenaario:
- Laitteen resurssien käyttö on korkea intensiivisen kuormituksen vuoksi
- Laitteen laitteistotyyppiä ei tueta
- Laitteen laiteohjelmistoversiota ei tueta
- Laitteessa on todellinen HW-ongelma - huonot sektorit, virhetila jne.
Laitteen tilan ja erilaisten tietojen tarkistaminen PowerFlex SCLI:n avulla:
# scli --query_device --device_id bb5e945300050009
Device ID: bb5e945300050009 Name: DGWT_Node6--0000:e4:00.0-nvme-1
Path: /dev/disk/by-path/pci-0000:e4:00.0-nvme-1
Capacity: 3.5 TB (3576 GB)
DGWT Id: c14bba1400000005
Node Id: b8ad8a9800000005
Device Group Id: 2e16482200000000
Current Path: /dev/disk/by-path/pci-0000:e4:00.0-nvme-1
Error: No
Bandwidth:
Primary-reads 0 IOPS 0 Bytes per second
Primary-writes 0 IOPS 0 Bytes per second
Secondary-reads 0 IOPS 0 Bytes per second
Secondary-writes 0 IOPS 0 Bytes per second
Backward-rebuild-reads 0 IOPS 0 Bytes per second
Backward-rebuild-writes 0 IOPS 0 Bytes per second
Forward-rebuild-reads 0 IOPS 0 Bytes per second
Forward-rebuild-writes 0 IOPS 0 Bytes per second
Rebalance-reads 0 IOPS 0 Bytes per second
Rebalance-writes 0 IOPS 0 Bytes per second
Volume-migration-reads 0 IOPS 0 Bytes per second
Volume-migration-writes 0 IOPS 0 Bytes per second
Enter-protected-maintenance-mode-reads 0 IOPS 0 Bytes per second
Enter-protected-maintenance-mode-writes 0 IOPS 0 Bytes per second
Exit-protected-maintenance-mode-reads 0 IOPS 0 Bytes per second
Exit-protected-maintenance-mode-writes 0 IOPS 0 Bytes per second
State: Normal
Device HW checks enabled: TRUE
Physical Device Information:
Device Type: UNKNOWN
Media Type: SSD
Vendor Name: N/A
Model Name: N/A
Serial Number: N/A
Slot Number: N/A
Firmware Version: N/A
Cache Look-ahead: not Active
Write Cache: not Active
ATA Security: not Active
Logical Sector Size: 0 B
Physical Sector Size: 0 B
Capacity: 0 GB
LED Setting: OFF
SMART Information:
Aggregated State: NEVER_FAILED
Temperature State: NEVER_FAILED
Current Value: 0 Worst Value: 0 Threshold: 0
Media Wearout Indicator State: NEVER_FAILED
Current Value: 0 Worst Value: 0 Threshold: 0
RAID Controller Information:
Serial Number: N/A
RAID vDisk status: N/A
RAID vDisk Type: N/A
RAID vDisk Cache: N/A
Smartctl:n käyttäminen laitteen tilan ja erilaisten tietojen vahvistamiseen:
sudo smartctl -i /dev/<device>
Katso laitteisto- ja laiteohjelmistotiedot tuloksista seuraavista keskeisistä määritteistä:
- Tuote – aseman laitteistotunniste
- Toimittaja – Ilmaisee laitteiston valmistajan. Jotkut laitteet osoittavat tämän nimenomaisesti; toiset vain tuotteen nimeämisen kautta.
- Versio – asemassa käynnissä oleva laiteohjelmiston versio.
- Laitetyyppi – Ilmaisee, onko laite HDD, SSD vai NVMe.
Etsi huonoille sektoreille seuraavat keskeiset ominaisuudet tuotoksesta:
- Reallocated_Sector_Ct - Ilmaisee niiden huonojen sektoreiden määrän, jotka on korvattu varasektoreilla.
- Muu kuin nolla-arvo viittaa siihen, että asemassa on ollut huonoja sektoreita.
- Current_Pending_Sector - Alat, jotka odottavat uudelleentestausta tai uudelleenkohdentamista.
- Jos arvo ei ole nolla, asemassa saattaa silti olla lukukelvottomia sektoreita.
- Offline_Uncorrectable – Niiden sektoreiden määrä, joita ei voitu korjata offline-tarkistuksen aikana.
- Suuri arvo tässä on punainen lippu.
Jos tila on vain luku tai epäonnistunut, etsi tuloksesta seuraavat maininnat:
- Vain luku -tilassa: Käytössä
- SMART-yleisterveystestin tulos: EPÄONNISTUI → saattaa tarkoittaa pakotettua vain luku -muotoa
Versiot, joita ongelma koskee
PowerFlex 5.x