Dell Unity: SMB- eller NFS-delte ressurser kan bli utilgjengelige på grunn av blokkerte tråder
Summary: Slik håndterer du blokkerte trådhendelser i et Dell Unity-system. (Dell-korrigerbar)
Symptoms
Hensikten med denne artikkelen er å gi generell veiledning om hvordan du håndterer blokkerte trådhendelser, da riktig håndtering er avgjørende for rotårsaksanalyse (RCA) og reparasjon.
Det finnes andre artikler som er spesifikke for visse Unity OE-versjoner, for eksempel artikkel 000002643: DTA 503606: Unity: Arrayer som bruker CIFS/SMB som kjører Operating Environment (OE) 4.2.0.9392909 eller 4.2.0.9433914, bør oppgradere til OE 4.2.0.9476662 (eller nyere), som løser et potensielt problem med datautilgjengelighet. (Det er bare registrerte Dell-brukere som har tilgang til denne artikkelen.)
NAS-servere, filsystem og delte ressurser vises på Internett på Dell Unity-siden, men blokkerte tråder fører til at SMB- eller NFS-delinger ikke er tilgjengelige for klienter.
Mulige feilkoder:
13:102d0003 neo-13:102d0003 neo-13:102d0007
Cause
Det er forskjellige årsaker til blokkerte tråder, og hvert tilfelle og system må undersøkes separat.
Her er noen av de vanligste årsakene til at disse kan oppstå:
- Vranglås der to tråder venter på en ressurslås eid av den andre tråden
- Behandling av utvidet drift (for eksempel forsinket godkjenning, viruskontroll og så videre)
Resolution
Umiddelbar (midlertidig) løsning:
En omstart eller panikk av SP rapportering av blokkerte tråder meldinger gjenoppretter tilgang umiddelbart. En omstart og en panikk er i hovedsak den samme, den eneste forskjellen er at panikken gir en minnedumpfil for etteranalyse.
Informativ:
- Selv om en enkel omstart midlertidig lindrer problemet, fjerner det sannsynligvis muligheten til å RCA.
- Det er bare en SP-dump (panikk) som samles inn mens tilstanden er til stede, slik at Dells tekniske avdeling kan undersøke fullstendig og forårsake rot til den bestemte årsaken til blokkerte tråder.
- Det er bare Dell som kan utføre SP-panikk. Kontakt teknisk støtte hos Dell eller din autoriserte servicerepresentant, og oppgi denne Dell-artikkel-ID-en.
- Dette er ikke en permanent løsning, og hvis den underliggende årsaken til de blokkerte trådene ikke løses, kan dette skje igjen til reparasjonen er implementert.
Flere feilrettinger er tilgjengelige for å løse denne tilstanden, avhengig av hvilken Unity OE-versjon som er installert.
I tilfeller der det ikke finnes en feilretting, er det nødvendig med SP-panikk , siden dette gjør at Dell kan hente en dumpfil med arrayets gjeldende tilstand for gjennomgang. RCA er kanskje ikke mulig uten denne dumpfilen. En SP-panikk krever root-tilgang.
Additional Information
/EMC/backend/log_shared er bare til stede (montert) på den primære SP-en, må du være i den primære SP-en (live eller logger) for å få tilgang til denne plasseringen og disse filene.
I feilmeldingene ser du den berørte SP-en (SP-en som må startes på nytt):
service@spa~# zgrep -i blocked /EMC/backend/log_shared/EMCSystemLogFile* EMCSystemLogFile.log:"2017-07-26T18:12:55.428Z" "unitymgr01_spa" "Kittyhawk_safe" "12657" "unix/spa/root" "ERROR" "13:102d0003" :: "ThreadsServicesSupervisor: Service:CIFS Pool:SMB2 BLOCKED for 423 seconds: Server operations may be impacted ." :: Category=System Component=DART_KERNEL EMCSystemLogFile.log:"2017-07-26T18:27:55.474Z" "unitymgr01_spa" "Kittyhawk_safe" "12657" "unix/spa/root" "ERROR" "13:102d0003" :: "ThreadsServicesSupervisor: Service:CIFS Pool:SMB2 BLOCKED for 1323 seconds: Server operations may be impacted ." :: Category=System Component=DART_KERNEL EMCSystemLogFile.log:"2017-07-26T18:42:55.520Z" "unitymgr01_spa" "Kittyhawk_safe" "12657" "unix/spa/root" "ERROR" "13:102d0003" :: "ThreadsServicesSupervisor: Service:CIFS Pool:SMB2 BLOCKED for 2222 seconds: Server operations may be impacted ." :: Category=System Component=DART_KERNEL
EMCSystemLogFile logger, sjekk alltid direkte i ktraces For å være sikker.
Informasjonen i
ktrace Filer kan brytes raskt, slik at disse meldingene kanskje ikke finnes i den siste ukomprimerte filen. Anbefalingen vil være å sjekke inn alle c4_safe_ktrace filer (funnet i /EMC/C4Core/log/).
På den berørte SP-en (SP-en der den berørte NAS-serveren befinner seg), går du til
/EMC/C4Core/log/ og kjør kommandoen nedenfor (kontroller at ordet BLOKKERT er i store bokstaver). Hvis du er usikker på hva SP er berørt, kjører du dette på begge, og den berørte SP-en skal vise disse meldingene:
service@spa~# zgrep -h BLOCKED c4_safe_ktrace* | sort ... 2017/09/20-07:46:... sade:KERNEL: 3: 3:[core] ThreadsServicesSupervisor: Service:CIFS Pool:SMB2BLOCKED for 33730 seconds: Server operations may be impacted 2017/09/20-08:01:... sade:KERNEL: 3: 3:[core] ThreadsServicesSupervisor: Service:CIFS Pool:SMB2BLOCKED for 34630 seconds: Server operations may be impacted 2017/09/20-08:16:... sade:KERNEL: 3: 3:[core] ThreadsServicesSupervisor: Service:CIFS Pool:SMB2BLOCKED for 35530 seconds: Server operations may be impacted 2017/09/20-08:31:... sade:KERNEL: 3: 3:[core] ThreadsServicesSupervisor: Service:CIFS Pool:SMB2BLOCKED for 36430 seconds: Server operations may be impacted 2017/09/20-08:46:... sade:KERNEL: 3: 3:[core] ThreadsServicesSupervisor: Service:CIFS Pool:SMB2BLOCKED for 37330 seconds: Server operations may be impacted 2017/09/20-09:01:... sade:KERNEL: 3: 3:[core] ThreadsServicesSupervisor: Service:CIFS Pool:SMB2BLOCKED for 38230 seconds: Server operations may be impacted 2017/09/20-09:16:... sade:KERNEL: 3: 3:[core] ThreadsServicesSupervisor: Service:CIFS Pool:SMB2BLOCKED for 39130 seconds: Server operations may be impacted 2017/09/20-09:31:... sade:KERNEL: 3: 3:[core] ThreadsServicesSupervisor: Service:CIFS Pool:SMB2BLOCKED for 40030 seconds: Server operations may be impacted