En stasjon kan måtte byttes ut på grunn av I/O-feil eller hvis programvaredefinert lagring markerer disken som defekt eller ubrukelig

요약: Brukere kan be om at en stasjon byttes ut på grunn av I/O-feil eller hvis stasjonen er merket som "defekt" eller "ubrukelig" av en SDS-løsning (Software-Defined-Storage).

이 문서는 다음에 적용됩니다. 이 문서는 다음에 적용되지 않습니다. 이 문서는 특정 제품과 관련이 없습니다. 모든 제품 버전이 이 문서에 나와 있는 것은 아닙니다.

지침

Det finnes flere forskjellige SDS-løsninger som Ceph (Linux), vSAN (VMware), Nutanix og så videre. Flere identisk konfigurerte servere slås sammen over et nettverk for å opprette en lagringsklynge. Serverne er konfigurert med en vertsbussadapter (HBA) i stedet for en PERC, slik at diskene presenteres for operativsystemet "som de er". Operativsystemet administrerer alle diskene på hver server direkte uten noen innblanding fra HBA-en. Disken er oppført som "Healthy" i Dells overvåkingsverktøy (som iDRAC og OMSA) og ePSA Offline Diagnostics. SMARTCTL-data for stasjonen kan ha ukorrigerte lese- og skrivefeil eller ikke. SMART-tester (kort, lang og forlenget) passerer, og stasjonen er oppført som "Sunn".

 

Programvaredefinerte lagringsløsninger (SDS) flytter alle lagringsrelaterte kontroller fra maskinvare til programvare ved hjelp av vertsbussadapter (HBA) for å gi fysisk tilkobling til diskene.

 

RAID-kontrolleren (PERC) er ansvarlig for å utføre flere proaktive vedlikeholdsaktiviteter på stasjonene, som omfatter patruljerese- og konsekvenskontroller på virtuelle disker. Siden SDS-løsninger bruker vertsbussadapter (HBA) i stedet for PERC, utfører programvaren nå alle disse proaktive vedlikeholdsaktivitetene.

 

Brukere kan rapportere at SDS merker en stasjon som "mislykket eller ubrukelig", eller det kan føre til I/O-feil på en stasjon. Dells overvåkingsverktøy som iDRAC og OMSA rapporterer disken som frisk og operativ.

 

Verktøy som «SMARTMON» eller «SMARTCTL» kan vise noen feil på én eller flere angitte stasjoner, men den generelle disktilstanden er oppført som «SUNN eller OK».

 

 

Denne uoverensstemmelsen skyldes følgende faktorer:

  • iDRAC viser tilstandsstatus for komponenten. Hvis diskfastvaren rapporterer at den er i orden, gjenspeiler iDRAC det samme. Hvis fastvaren for disken angir at den er i prediktiv feil-tilstand, gjenspeiler iDRAC det samme.
  • Alle stasjoner kan tolerere noen dårlige blokker eller uopprettelige feil og fortsette å fungere uten funksjonell påvirkning. Terskelen for ugyldige blokker programmeres inn i diskfastvaren av stasjonsprodusenten og er ikke et standardtall eller en prosentandel.
  • Diskene forblir i drift til det totale antallet ugyldige blokker eller uopprettelige feil på disken bryter den prediktive feil- eller feilterskelen.
  • En forskyvningsadresse på disken er merket som en ugyldig blokk, og dataene flyttes BARE hvis en skriveoperasjon mislykkes på den bestemte adressen. Diskfastvaren anser ikke READ-feil for merking av sektorer som ugyldige blokker.
  • I/O-feil som er logget på operativsystemnivå, gjenspeiles kanskje ikke i Lifecycle-loggene.

 

I et slikt scenario er frekvensomformerne funksjonelle og godt innenfor driftsparametrene. De kvalifiserer ikke for eller krever utskifting av maskinvare. Den anbefalte handlingsplanen her er å utføre de nødvendige vedlikeholdsaktivitetene fra programvarelaget for å løse problemet.

 

I et slikt scenario må du registrere en komplett pakke med operativsystemloggen eller rapporter fra én eller flere berørte servere. Kontakt Dell SST (hvis dekket av garantiavtalen) eller operativsystemleverandøren for logggjennomgang, da de må gi råd om de neste korrigerende trinnene.

 

Dell SST eller leverandøren av operativsystemet bestemmer følgende detaljer:

  • Totale I/O-feil registrert av operativsystemkjernen (hvis noen).
  • Hvilke enheter (en eller flere) er feilene logget mot.
  • Type skade: Fil- eller metadatanivå (hvis aktuelt)
  • Krasjet lagringstjenesten? Hvis ja, hvorfor?
  • Korrigerende tiltak er tilgjengelige i SDS for å løse slike feil.

 

MERK: Punktene nevnt ovenfor for Dell SST eller leverandøren av operativsystemet er ikke en altomfattende liste. Det kan være flere andre referanser eller datapunkter i undersøkelsen.

 

해당 제품

Rack Servers
문서 속성
문서 번호: 000219050
문서 유형: How To
마지막 수정 시간: 17 6월 2025
버전:  4
다른 Dell 사용자에게 질문에 대한 답변 찾기
지원 서비스
디바이스에 지원 서비스가 적용되는지 확인하십시오.