Dell Unity: SMB- of NFS-shares kunnen ontoegankelijk worden als gevolg van geblokkeerde threads
Summary: Omgaan met gebeurtenissen met geblokkeerde threads in een Dell Unity-systeem. (op te lossen door Dell)
Symptoms
Het doel van dit artikel is om algemene richtlijnen te geven voor het omgaan met geblokkeerde threadgebeurtenissen, aangezien de juiste afhandeling cruciaal is voor Root Cause Analysis (RCA) en fix.
Er zijn andere artikelen beschikbaar die specifiek zijn voor bepaalde Unity OE-versies, zoals artikel 000002643: DTA-503606: Unity: Arrays die CIFS/SMB gebruiken met Operating Environment (OE) 4.2.0.9392909 of 4.2.0.9433914 moeten worden geüpgraded naar OE 4.2.0.9476662 (of hoger), wat een mogelijk probleem met niet-beschikbaarheid van data aanpakt. (Alleen geregistreerde Dell Support gebruikers hebben toegang tot dit artikel.)
NAS-servers, bestandssysteem en shares worden online weergegeven aan de Dell Unity-zijde, maar geblokkeerde threads zorgen ervoor dat SMB- of NFS-shares niet beschikbaar zijn voor clients.
Mogelijke foutcodes:
13:102d0003 neo-13:102d0003 neo-13:102d0007
Cause
Er zijn verschillende oorzaken voor geblokkeerde threads en elk geval en systeem moet afzonderlijk worden onderzocht.
Hier zijn enkele van de meest voorkomende redenen waarom deze kunnen optreden:
- Deadlock waarbij twee threads wachten op een resourcevergrendeling die eigendom is van de andere thread
- Uitgebreide operationele verwerking (zoals vertraagde verificatie, viruscontrole, enzovoort)
Resolution
Onmiddellijke (tijdelijke) oplossing:
Een herstart of paniekaanval van de SP die de berichten over geblokkeerde threads meldt, herstelt de toegang onmiddellijk. Een herstart en een paniek zijn in wezen hetzelfde, het enige verschil is dat de paniek een geheugendumpbestand biedt voor post-analyse.
Informatieve:
- Hoewel een eenvoudige herstart het probleem tijdelijk verlicht, wordt waarschijnlijk de mogelijkheid om RCA te gebruiken verwijderd.
- Alleen een SP-dump (paniek) die is verzameld terwijl de conditie aanwezig is, stelt Dell Engineering in staat om de specifieke oorzaak van geblokkeerde threads volledig te onderzoeken en te RCA'en.
- Alleen Dell kan een SP-panic uitvoeren. Neem contact op met de technische support van Dell of met uw geautoriseerde servicevertegenwoordiger en vermeld deze Dell artikel-ID.
- Dit is geen permanente oplossing en als de onderliggende oorzaak van de geblokkeerde threads niet wordt opgelost, kan dit opnieuw gebeuren totdat de oplossing is geïmplementeerd.
Er zijn meerdere oplossingen beschikbaar om deze situatie op te lossen, afhankelijk van de geïnstalleerde Unity OE-versie.
In gevallen waarin er geen oplossing bestaat, is een SP-panic vereist omdat Dell dan een dumpbestand met de huidige status van de array ter beoordeling kan ophalen. RCA is mogelijk niet mogelijk zonder dit dumpbestand. Voor een SP-panic is roottoegang vereist.
Additional Information
/EMC/backend/log_shared alleen aanwezig is (gekoppeld) op de primaire SP, moet u zich op de primaire SP (live of logboeken) bevinden om toegang te krijgen tot deze locatie en deze bestanden.
In de foutmeldingen ziet u de betreffende SP (de SP die opnieuw moet worden opgestart):
service@spa~# zgrep -i blocked /EMC/backend/log_shared/EMCSystemLogFile* EMCSystemLogFile.log:"2017-07-26T18:12:55.428Z" "unitymgr01_spa" "Kittyhawk_safe" "12657" "unix/spa/root" "ERROR" "13:102d0003" :: "ThreadsServicesSupervisor: Service:CIFS Pool:SMB2 BLOCKED for 423 seconds: Server operations may be impacted ." :: Category=System Component=DART_KERNEL EMCSystemLogFile.log:"2017-07-26T18:27:55.474Z" "unitymgr01_spa" "Kittyhawk_safe" "12657" "unix/spa/root" "ERROR" "13:102d0003" :: "ThreadsServicesSupervisor: Service:CIFS Pool:SMB2 BLOCKED for 1323 seconds: Server operations may be impacted ." :: Category=System Component=DART_KERNEL EMCSystemLogFile.log:"2017-07-26T18:42:55.520Z" "unitymgr01_spa" "Kittyhawk_safe" "12657" "unix/spa/root" "ERROR" "13:102d0003" :: "ThreadsServicesSupervisor: Service:CIFS Pool:SMB2 BLOCKED for 2222 seconds: Server operations may be impacted ." :: Category=System Component=DART_KERNEL
EMCSystemLogFile logboeken, controleer dan altijd direct in de ktraces om zeker te zijn.
De
ktrace Bestanden kunnen snel teruglopen, waardoor deze berichten mogelijk niet aanwezig zijn in het nieuwste niet-gecomprimeerde bestand. De aanbeveling zou zijn om alle c4_safe_ktrace bestanden (te vinden in /EMC/C4Core/log/).
Ga op de betreffende SP (de SP waar de getroffen NAS-server zich bevindt) naar
/EMC/C4Core/log/ en voer de onderstaande opdracht uit (zorg ervoor dat het woord BLOCKED in hoofdletters staat). Als u niet zeker weet welke SP wordt beïnvloed, voert u dit op beide SP uit. De betreffende SP zou de volgende meldingen moeten weergeven:
service@spa~# zgrep -h BLOCKED c4_safe_ktrace* | sort ... 2017/09/20-07:46:... sade:KERNEL: 3: 3:[core] ThreadsServicesSupervisor: Service:CIFS Pool:SMB2BLOCKED for 33730 seconds: Server operations may be impacted 2017/09/20-08:01:... sade:KERNEL: 3: 3:[core] ThreadsServicesSupervisor: Service:CIFS Pool:SMB2BLOCKED for 34630 seconds: Server operations may be impacted 2017/09/20-08:16:... sade:KERNEL: 3: 3:[core] ThreadsServicesSupervisor: Service:CIFS Pool:SMB2BLOCKED for 35530 seconds: Server operations may be impacted 2017/09/20-08:31:... sade:KERNEL: 3: 3:[core] ThreadsServicesSupervisor: Service:CIFS Pool:SMB2BLOCKED for 36430 seconds: Server operations may be impacted 2017/09/20-08:46:... sade:KERNEL: 3: 3:[core] ThreadsServicesSupervisor: Service:CIFS Pool:SMB2BLOCKED for 37330 seconds: Server operations may be impacted 2017/09/20-09:01:... sade:KERNEL: 3: 3:[core] ThreadsServicesSupervisor: Service:CIFS Pool:SMB2BLOCKED for 38230 seconds: Server operations may be impacted 2017/09/20-09:16:... sade:KERNEL: 3: 3:[core] ThreadsServicesSupervisor: Service:CIFS Pool:SMB2BLOCKED for 39130 seconds: Server operations may be impacted 2017/09/20-09:31:... sade:KERNEL: 3: 3:[core] ThreadsServicesSupervisor: Service:CIFS Pool:SMB2BLOCKED for 40030 seconds: Server operations may be impacted