Dell Unity: SMB- oder NFS-Freigaben sind aufgrund blockierter Threads möglicherweise nicht mehr zugänglich
Summary: Umgang mit blockierten Threads in einem Dell Unity-System. (von Dell korrigierbar)
Symptoms
Der Zweck dieses Artikels besteht darin, allgemeine Anleitungen zum Umgang mit blockierten Threadereignissen bereitzustellen, da die ordnungsgemäße Behandlung für die Ursachenanalyse (RCA) und die Fehlerbehebung von entscheidender Bedeutung ist.
Es sind weitere Artikel verfügbar, die spezifisch für bestimmte Unity OE-Versionen verfügbar sind, z. B. Artikel 000002643: DTA-503606: Unity: Arrays, die CIFS/SMB mit Betriebsumgebung (OE) 4.2.0.9392909 oder 4.2.0.9433914 ausführen, sollten ein Upgrade auf OE 4.2.0.9476662 (oder höher) durchführen, um ein potenzielles Problem mit der Nichtverfügbarkeit von Daten zu beheben. (Nur registrierte Dell Support-Nutzer können auf diesen Artikel zugreifen.)
NAS-Server, Dateisysteme und Freigaben werden auf der Dell Unity-Seite online angezeigt, aber blockierte Threads führen dazu, dass SMB- oder NFS-Freigaben für Clients nicht verfügbar sind.
Mögliche Fehlercodes:
13:102d0003 neo-13:102d0003 neo-13:102d0007
Cause
Es gibt verschiedene Ursachen für blockierte Threads, und jeder Fall und jedes System muss separat untersucht werden.
Hier sind einige der häufigsten Gründe, warum diese auftreten können:
- Deadlock, bei dem zwei Threads auf eine Ressourcensperre warten, die dem anderen Thread gehört
- Erweiterte Vorgangsverarbeitung (z. B. verzögerte Authentifizierung, Virenprüfung usw.)
Resolution
Sofortige (temporäre) Lösung:
Ein Neustart des SP, der blockierte Threads meldet, oder ihn in den Fehlerzustand zu versetzen, stellt den Zugriff sofort wieder her. Ein Neustart und ein Fehler sind im Wesentlichen identisch, der einzige Unterschied besteht darin, dass der Fehler eine Speicherabbilddatei für die Nachanalyse bereitstellt.
Mitteilsam:
- Obwohl ein einfacher Neustart das Problem vorübergehend behebt, wird wahrscheinlich die Möglichkeit zur RCA entfernt.
- Nur, wenn während des Ereignisses ein SP-Speicherabbild (Fehlerzustand) erfasst wird, kann Dell Engineering die jeweilige Ursache für blockierte Threads vollständig untersuchen und eine RCA erstellen.
- Nur Dell kann einen SP in den Fehlerzustand versetzen. Wenden Sie sich an den technischen Support von Dell oder Ihren autorisierten Servicemitarbeiter und geben Sie diese Dell Artikel-ID an.
- Dies ist keine permanente Korrektur. Wenn die zugrunde liegende Ursache der blockierten Threads nicht behoben wurde, kann sie erneut auftreten, bis die Korrektur implementiert wurde.
Je nach installierter Unity OE-Version sind mehrere Korrekturen verfügbar, um diese Situation zu beheben.
In Fällen, in denen keine Korrektur vorhanden ist, muss der SP in den Fehlerzustand versetzt werden, damit Dell eine Speicherabbilddatei mit dem aktuellen Zustand des Arrays zur Überprüfung erhält. Eine RCA ist ohne diese Speicherauszugsdatei nicht möglich. Das Versetzen des SP in den Fehlerzustand erfordert Root-Zugriff.
Additional Information
/EMC/backend/log_shared nur auf dem primären SP vorhanden (gemountet) ist, müssen Sie sich auf dem primären SP befinden (aktiv oder Protokolle), um auf diesen Speicherort und diese Dateien zugreifen zu können.
In den Fehlermeldungen wird der betroffene SP angezeigt (der SP, der neu gestartet werden muss):
service@spa~# zgrep -i blocked /EMC/backend/log_shared/EMCSystemLogFile* EMCSystemLogFile.log:"2017-07-26T18:12:55.428Z" "unitymgr01_spa" "Kittyhawk_safe" "12657" "unix/spa/root" "ERROR" "13:102d0003" :: "ThreadsServicesSupervisor: Service:CIFS Pool:SMB2 BLOCKED for 423 seconds: Server operations may be impacted ." :: Category=System Component=DART_KERNEL EMCSystemLogFile.log:"2017-07-26T18:27:55.474Z" "unitymgr01_spa" "Kittyhawk_safe" "12657" "unix/spa/root" "ERROR" "13:102d0003" :: "ThreadsServicesSupervisor: Service:CIFS Pool:SMB2 BLOCKED for 1323 seconds: Server operations may be impacted ." :: Category=System Component=DART_KERNEL EMCSystemLogFile.log:"2017-07-26T18:42:55.520Z" "unitymgr01_spa" "Kittyhawk_safe" "12657" "unix/spa/root" "ERROR" "13:102d0003" :: "ThreadsServicesSupervisor: Service:CIFS Pool:SMB2 BLOCKED for 2222 seconds: Server operations may be impacted ." :: Category=System Component=DART_KERNEL
EMCSystemLogFile Logs, prüfen Sie immer direkt in der ktraces Um sicher zu sein.
Die Spalte
ktrace Dateien können schnell umbrochen werden, sodass diese Meldungen möglicherweise nicht in der neuesten unkomprimierten Datei vorhanden sind. Es wird empfohlen, alle c4_safe_ktrace Dateien (zu finden in /EMC/C4Core/log/).
Navigieren Sie auf dem betroffenen SP (dem SP, auf dem sich der betroffene NAS-Server befindet) zu
/EMC/C4Core/log/ und führen Sie den folgenden Befehl aus (stellen Sie sicher, dass das Wort BLOCKED ausschließlich in Großbuchstaben geschrieben ist). Wenn Sie nicht sicher sind, welcher SP betroffen ist, führen Sie dies auf beiden aus und der betroffene SP sollte diese Meldungen zurückgeben:
service@spa~# zgrep -h BLOCKED c4_safe_ktrace* | sort ... 2017/09/20-07:46:... sade:KERNEL: 3: 3:[core] ThreadsServicesSupervisor: Service:CIFS Pool:SMB2BLOCKED for 33730 seconds: Server operations may be impacted 2017/09/20-08:01:... sade:KERNEL: 3: 3:[core] ThreadsServicesSupervisor: Service:CIFS Pool:SMB2BLOCKED for 34630 seconds: Server operations may be impacted 2017/09/20-08:16:... sade:KERNEL: 3: 3:[core] ThreadsServicesSupervisor: Service:CIFS Pool:SMB2BLOCKED for 35530 seconds: Server operations may be impacted 2017/09/20-08:31:... sade:KERNEL: 3: 3:[core] ThreadsServicesSupervisor: Service:CIFS Pool:SMB2BLOCKED for 36430 seconds: Server operations may be impacted 2017/09/20-08:46:... sade:KERNEL: 3: 3:[core] ThreadsServicesSupervisor: Service:CIFS Pool:SMB2BLOCKED for 37330 seconds: Server operations may be impacted 2017/09/20-09:01:... sade:KERNEL: 3: 3:[core] ThreadsServicesSupervisor: Service:CIFS Pool:SMB2BLOCKED for 38230 seconds: Server operations may be impacted 2017/09/20-09:16:... sade:KERNEL: 3: 3:[core] ThreadsServicesSupervisor: Service:CIFS Pool:SMB2BLOCKED for 39130 seconds: Server operations may be impacted 2017/09/20-09:31:... sade:KERNEL: 3: 3:[core] ThreadsServicesSupervisor: Service:CIFS Pool:SMB2BLOCKED for 40030 seconds: Server operations may be impacted