PowerFlex 3.X: Hidas kirjoittaminen käyttöjärjestelmälevylle voi aiheuttaa useita MDM-ongelmia.
Summary: Hidas kirjoittaminen käyttöjärjestelmälevylle voi aiheuttaa useita MDM-ongelmia.
Symptoms
MDM:n hidas käyttöjärjestelmälevy voi aiheuttaa monenlaisia skenaarioita.
ScaleIO 3.0:ssa MDM-mekanismista on tehty vankempi, jotta se pystyy käsittelemään paremmin erittäin hitaita käyttöjärjestelmälevyongelmia. (10+ sekunnin viive)
Kun MDM:t ovat käynnissä käyttöjärjestelmälevyillä, joiden kirjoittaminen kestää liian kauan, seuraavia oireita saattaa ilmetä:
-
SDS:n asettaminen ylläpitoon katkaisee MDM-pääyhteyden katkeamisen.
-
Uudelleenmääritys aiheuttaa sen, että pää-MDM:n ja mahdollisesti myös ala-ajan MDM:ien yhteys katkeaa.
-
MDM-vaihto ei toimi; Orja-MDM:t eivät voi ottaa pää-MDM:n vastuita, joten mikään MDM ei ole päälaite.
-
Komennon scli --query_cluster tulos näyttää, että slave-MDM:iä ei synkronoida ajoittain.
-
SDC kirjoittaa IO-virheitä.
Kaikissa tilanteissa MDM trc -lokeissa lukee "Kovettuminen kesti liian kauan":
08/12 03:36:42.336327 0x7f64207f4eb0:replFile_WriteUnlocked:00667: WARNING: Harden took too long: 1360 ms 08/12 03:36:44.811987 0x7f6420668eb0:replFile_WriteUnlocked:00667: WARNING: Harden took too long: 1840 ms 08/12 03:36:46.463661 0x7f642072eeb0:replFile_WriteUnlocked:00667: WARNING: Harden took too long: 2210 ms
Vaikutus
Jos MDM-säilö tallennetaan kovettumiskynnyksen yli, MDM:ää ei ole synkronoitu.
Tämä tarkoittaa, että MDM-klusteria ei synkronoida ja MDM-prosessit käynnistyvät uudelleen.
Jos MDM:t käynnistyvät uudelleen nopeasti/riittävän toistuvasti, suorita loppuun tilanteet, joissa data ei ole käytettävissä (kun pää-MDM:ää ei ole käytettävissä), kuten MDM-klusterissa, kun toistuvia vikasietoja voi esiintyä.
Cause
Kun pää-MDM:n on tehtävä muutoksia tietolohkojen tilaan, sen on kirjoitettava nämä tilamuutokset MDM-säilötiedostoon ja synkronoitava muutokset sitten ala-ajan MDM:iin. Kun nämä kirjoitukset on tehty, MDM ilmoittaa SDS:ille, että muutokset on viimeistelty, ja ne voivat tallentaa IO:ita SDC:ille vain ensisijaisesta kopiosta (kunnes uudelleenmääritys on valmis). Jos muutosten kirjoittaminen paikalliseen säilöön kestää kauemmin kuin 500 millisekuntia (1/2 sekuntia), MDM:n trc-lokeissa näkyvät "Kovettaminen kesti liian kauan". Tämän vuoksi MDM ei pysty vastaamaan SDSes-pyyntöihin riittävän nopeasti, mikä voi aiheuttaa IO-virheitä SDC:issä. MDM pysyy tässä tilassa, kunnes IO pystyy kirjoittamaan säilöön alle 500 millisekunnissa, tai 10 sekunnin kuluttua, kun MDM-kytkin omistaa klusterissa.
Resolution
Ratkaisu on ratkaista käyttöjärjestelmän levyn viiveongelma.
Tämä voi johtua:
-
RAID-uudelleenrakennukset (14G Ready Node -solmuissa on BOSS-kortteja ja 2x M.2 SATA -asemaa RAID1-tilassa)
-
Levyn kuluminen/ikä
-
Käyttöjärjestelmälevyjen virheellinen koko/valinta (kiintolevy, hidas/halpa SSD jne. yleensä vain ohjelmistokokoonpanoissa)
-
Virheet käyttöjärjestelmän levyohjaimessa / levyn laiteohjelmistossa
-
Levyvika / ennakoiva vikatila
-
Mutta yleisin syy on ulkopuolinen IO-kuormitus OS-levyllä.
Käyttöjärjestelmälevyn suorituskyvyn seuranta/profilointi on joka tapauksessa välttämätöntä.
Levyn viivettä voidaan valvoa sar: lla tai iostatilla.
Helpoin/yleisin työkalu on iostaatti.
Suorita
iostat -xtN 1
Ja tarkkaile odotusaikoja, jotka ilmoitetaan millisekunteina.
Tämä koskee kaikkia versioita.