VxRail: vSAN-objektia ei voi käyttää, levyvika, liiallinen I/O-viive, levyn yleinen kunto punainen
Summary: Älä poista levyjä vSANin uudelleensynkronoinnin aikana, koska se voi johtaa tietojen menetykseen.
Symptoms
Tämä artikkeli koskee sekä VxRail 7.x- että VxRail 8.x -versioita.
vSAN-kuntotarkistus löytää levyvian tai vmware-vsan-health-summary-result.log Löytää physdiskoverall Terveys on punainen tai keltainen.
VxRail-Virtual-SAN-Cluster-xxxxxxxxx Overall Health : red Group physicaldisks health : red Test physdiskoverall health : red DisksWithIssues: Host Disk OverallOperationHealth Metadata Operational InCmmds/Vsi OperationalState Recommendation Uuid (Host-10, LocalToshibaDisk(Naa.50000xxxxxxxxxx), Red, Green, Red, Yes/Yes, ImpendingPermanentDiskFailure,EvacuationFailedDueToInaccessibleObjects, PleaseReferTo'Data'HealthCheckAndResolveTheInaccessibleObjects
vsandevicemonitord.log reports:
INFO vsandevicemonitord WARNING - WRITE Average Latency on VSAN device naa.50000xxxxxxxx has exceeded threshold value 2000000 us 2 times. INFO vsandevicemonitord Tier 2 (naa.50000xxxxxxxx) as unhealthy
Cause
vSANin Dying Disk Handling (DDH) -ominaisuus diagnosoi levyn tai levyryhmän kunnon havaitsemalla joko vSAN-levyn liiallisen I/O-viiveen tai lokin ruuhkautumisen enimmäismäärän, jonka vSAN määrittää johtuvan vSAN-levyryhmän pitkäaikaisista lokivuoto-ongelmista. Epäterveet levyt tai levyryhmät merkitään sellaisiksi, eikä levyä tai levyryhmiä enää käytetä uusien tietojen sijoittamiseen.
Kun DDH havaitsee, että levy on ylittänyt I/O-viiveen valvontajakson aikana, vSAN luo VMkernel-havainnon (VOB) ja kirjaa viestin vsandevicemonitord.log tiedosto /var/run/log hakemisto. Alla oleva lokimerkintä on esimerkki levystä, joka on vaihdettava, kun vaadittu tietojen evakuointi on valmis ja levy on evakuoitu:
WARNING - WRITE Average Latency on VSAN device <NAA disk name> has exceeded threshold value <IO latency threshold for disk> us <# of intervals with excessive IO latency> times.
Kun DDH havaitsee, että välimuistitasolla on liian suuri lokien ruuhkaisuus valvontajakson aikana, vSAN luo VOB-signaalin ja kirjaa lokiin vsandevicemonitord.log tiedosto. Liialliset lokien ruuhkautumisilmoitukset ovat tässä muodossa:
WARNING - Maximum log congestion on VSAN device <NAA disk name> <current intervals with excessive log congestion>/<intervals required to be unhealthy>
Molemmissa tilanteissa vSAN käynnistää tietojen tai joidenkin tietojen evakuoinnin levyltä tai levyryhmistä, joita ongelma koskee. vSANin kunnon seurannan käyttöliittymän levyjen yleinen kunto-osa raportoi haavoittuvuuden sisältävän levyn tai levyryhmien toimintatiloista ja antaa suosituksia käyttäjälle. Evakuoinnin jälkeen annettavat suositukset vaihtelevat sen mukaan, havaitsiko vSAN liiallisia I/O-viiveitä tai liiallista lokiruuhkia.
Resolution
Katso lisätietoja VMware-artikkelista 326878, Dying Disk Handling (DDH) vSANissa
Älä irrota tai vaihda levyä seuraavissa tilanteissa, kun vSANin uudelleensynkronointi on käynnissä. Jos teet niin, tietoja voidaan menettää.
Impending permanent disk failure, data evacuation failed due to insufficient resources (Health state - Red)
Tai
Impending permanent disk failure, data evacuation failed due to inaccessible objects (Health state - Red)
Älä poista tai vaihda levyä, kun objekti ei ole käytettävissä.
Objekti ei ole käytettävissä tarkoittaa, että kaikki objektin kopiot puuttuvat. Jos poistat tai vaihdat levyn, saatat menettää tietoja.
Tilapäisratkaisu:
- Ota VMware mukaan
- Jos liiallinen I/O-viive aiheutti kapasiteettilevyn epäterveellisen tilan, palauta levy asentamalla se uudelleen. Levyn uudelleenasennus ei muuta levyn vSAN UUID -tunnusta.
esxcli vsan storage diskgroup unmount -u <disk group UUID> esxcli vsan storage diskgroup mount -u <disk group UUID>