Dell Unity: Sdílené složky SMB nebo NFS mohou být nedostupné kvůli zablokovaným vláknům
Summary: Jak zpracovat události zablokovaných vláken v systému Dell Unity. (oprava společností Dell)
Symptoms
Účelem tohoto článku je poskytnout obecné pokyny ke zpracování událostí zablokovaných vláken, protože správné zpracování je zásadní pro analýzu hlavní příčiny (RCA) a opravu.
Pro určité verze prostředí Unity OE jsou k dispozici další články, například článek 000002643: 503606 DTA: Unity: Pole využívající CIFS/SMB s operačním prostředím (OE) 4.2.0.9392909 nebo 4.2.0.9433914 by měla provést upgrade na verzi OE 4.2.0.9476662 (nebo novější), která řeší potenciální problém s nedostupnosti dat (K tomuto článku mohou mít přístup pouze registrovaní uživatelé podpory společnosti Dell.)
Servery NAS, systém souborů a sdílené složky se zobrazují online na straně Dell Unity, ale blokovaná vlákna způsobují, že sdílené složky SMB nebo NFS nejsou pro klienty dostupné.
Možné chybové kódy:
13:102d0003 neo-13:102d0003 neo-13:102d0007
Cause
Existují různé příčiny zablokování vláken a každý případ a systém je nutné prozkoumat samostatně.
Zde jsou některé z nejčastějších důvodů, proč k nim může dojít:
- Zablokování, kdy dvě vlákna čekají na uzamčení prostředku vlastněný druhým vláknem
- Rozšířené zpracování operací (například zpožděné ověřování, antivirová kontrola atd.)
Resolution
Bezprostřední (dočasné) řešení:
Restartování nebo panika procesoru úložiště, který hlásí zablokovaná vlákna, okamžitě obnoví přístup. Restart a panika jsou v podstatě stejné, jediný rozdíl je v tom, že panika poskytuje soubor výpisu paměti pro následnou analýzu.
Informační:
- I když jednoduchý restart problém dočasně zmírní, pravděpodobně odebere možnost RCA.
- Pouze výpis procesoru úložiště (panika) získaný během trvání daného stavu umožňuje technickému oddělení společnosti Dell plně prozkoumat a analyzovat konkrétní příčinu zablokování vláken.
- Paniku procesoru úložiště může provést pouze společnost Dell. Obraťte se na technickou podporu společnosti Dell nebo autorizovaného servisního zástupce a uveďte ID tohoto článku společnosti Dell.
- Nejedná se o trvalou opravu a pokud není vyřešena hlavní příčina zablokování vláken, může k tomu dojít znovu, dokud nebude provedena oprava.
Pro vyřešení tohoto problému je k dispozici více oprav v závislosti na nainstalované verzi prostředí Unity OE.
V případech, kdy oprava neexistuje, je vyžadována panika procesoru úložiště, která společnosti Dell umožní získat soubor výpisu s aktuálním stavem pole pro kontrolu. Bez tohoto souboru výpisu nemusí být možné provést analýzu hlavní příčiny. Panika procesoru úložiště vyžaduje přístup uživatele root.
Additional Information
/EMC/backend/log_shared Pokud chcete získat přístup k tomuto umístění a k těmto souborům, musíte být na primárním procesoru úložiště (live nebo logs).
V chybových zprávách se zobrazí dotčený procesor úložiště (procesor úložiště, který je nutné restartovat):
service@spa~# zgrep -i blocked /EMC/backend/log_shared/EMCSystemLogFile* EMCSystemLogFile.log:"2017-07-26T18:12:55.428Z" "unitymgr01_spa" "Kittyhawk_safe" "12657" "unix/spa/root" "ERROR" "13:102d0003" :: "ThreadsServicesSupervisor: Service:CIFS Pool:SMB2 BLOCKED for 423 seconds: Server operations may be impacted ." :: Category=System Component=DART_KERNEL EMCSystemLogFile.log:"2017-07-26T18:27:55.474Z" "unitymgr01_spa" "Kittyhawk_safe" "12657" "unix/spa/root" "ERROR" "13:102d0003" :: "ThreadsServicesSupervisor: Service:CIFS Pool:SMB2 BLOCKED for 1323 seconds: Server operations may be impacted ." :: Category=System Component=DART_KERNEL EMCSystemLogFile.log:"2017-07-26T18:42:55.520Z" "unitymgr01_spa" "Kittyhawk_safe" "12657" "unix/spa/root" "ERROR" "13:102d0003" :: "ThreadsServicesSupervisor: Service:CIFS Pool:SMB2 BLOCKED for 2222 seconds: Server operations may be impacted ." :: Category=System Component=DART_KERNEL
EMCSystemLogFile protokoly, vždy zkontrolujte přímo v ktraces Aby bylo jasno.
Skript
ktrace Soubory se mohou rychle zabalit, takže tyto zprávy se nemusí vyskytovat v posledním nekomprimovaném souboru. Doporučujeme vrátit se se změnami ve všech c4_safe_ktrace souborů (nachází se v /EMC/C4Core/log/).
U dotčeného procesoru úložiště (procesor úložiště, ve kterém se nachází dotčený server NAS) přejděte do části
/EMC/C4Core/log/ a spusťte níže uvedený příkaz (ujistěte se, že slovo BLOCKED je napsáno velkými písmeny). Pokud si nejste jistí, který procesor úložiště je dotčený, spusťte příkazy na obou. Dotčený procesor úložiště by měl zobrazit tyto zprávy:
service@spa~# zgrep -h BLOCKED c4_safe_ktrace* | sort ... 2017/09/20-07:46:... sade:KERNEL: 3: 3:[core] ThreadsServicesSupervisor: Service:CIFS Pool:SMB2BLOCKED for 33730 seconds: Server operations may be impacted 2017/09/20-08:01:... sade:KERNEL: 3: 3:[core] ThreadsServicesSupervisor: Service:CIFS Pool:SMB2BLOCKED for 34630 seconds: Server operations may be impacted 2017/09/20-08:16:... sade:KERNEL: 3: 3:[core] ThreadsServicesSupervisor: Service:CIFS Pool:SMB2BLOCKED for 35530 seconds: Server operations may be impacted 2017/09/20-08:31:... sade:KERNEL: 3: 3:[core] ThreadsServicesSupervisor: Service:CIFS Pool:SMB2BLOCKED for 36430 seconds: Server operations may be impacted 2017/09/20-08:46:... sade:KERNEL: 3: 3:[core] ThreadsServicesSupervisor: Service:CIFS Pool:SMB2BLOCKED for 37330 seconds: Server operations may be impacted 2017/09/20-09:01:... sade:KERNEL: 3: 3:[core] ThreadsServicesSupervisor: Service:CIFS Pool:SMB2BLOCKED for 38230 seconds: Server operations may be impacted 2017/09/20-09:16:... sade:KERNEL: 3: 3:[core] ThreadsServicesSupervisor: Service:CIFS Pool:SMB2BLOCKED for 39130 seconds: Server operations may be impacted 2017/09/20-09:31:... sade:KERNEL: 3: 3:[core] ThreadsServicesSupervisor: Service:CIFS Pool:SMB2BLOCKED for 40030 seconds: Server operations may be impacted