Dell Unity: Engellenen İş Parçacıkları Nedeniyle SMB veya NFS Paylaşımları Erişilemez Hale Gelebilir
Summary: Dell Unity sisteminde engellenen iş parçacığı olaylarını işleme. (Dell Tarafından Düzeltilebilir)
Symptoms
Bu makalenin amacı, Kök Neden Analizi (RCA) ve düzeltme için doğru işlem çok önemli olduğundan, engellenen iş parçacığı olaylarının nasıl işleneceği hakkında genel rehberlik sağlamaktır.
Belirli Unity OE sürümlerine özel, örneğin makale 000002643 içeren başka makaleler de vardır: DTA 503606: Unity: İşletim Ortamı (OE) 4.2.0.9392909 veya 4.2.0.9433914 çalıştıran CIFS/SMB kullanan diziler, olası bir veri noksanlığı sorununu ele alan OE 4.2.0.9476662'ye (veya sonraki bir sürüme) yükseltilmelidir. (Bu makaleye yalnızca kayıtlı Dell Desteği kullanıcıları erişebilir.)
NAS sunucuları, dosya sistemi ve paylaşımlar Dell Unity tarafında çevrimiçi olarak gösterilir ancak engellenen iş parçacıkları, SMB veya NFS paylaşımlarının istemciler tarafından kullanılamamasına neden olur.
Olası hata kodları:
13:102d0003 neo-13:102d0003 neo-13:102d0007
Cause
Engellenen iş parçacıklarının farklı nedenleri vardır ve her olay ve sistem ayrı ayrı araştırılmalıdır.
Bunların ortaya çıkmasının en yaygın nedenlerinden bazıları şunlardır:
- İki iş parçacığının diğer iş parçacığına ait bir kaynak kilidini beklediği kilitlenme
- Genişletilmiş işlem işleme (Gecikmeli kimlik doğrulama, virüs kontrolü vb.)
Resolution
Acil (geçici) çözüm:
Engellenen iş parçacığı mesajlarını bildiren SP'nin yeniden başlatılması veya bu SP'de panik oluşması, erişimi hemen geri yükler. Yeniden başlatma ve panik temelde aynıdır, tek fark paniğin analiz sonrası için bir bellek döküm dosyası sağlamasıdır.
Bilgi:
- Basit bir yeniden başlatma, sorunu geçici olarak hafifletse de büyük olasılıkla RCA özelliğini ortadan kaldıracaktır.
- Yalnızca durum mevcutken toplanan bir SP dökümü (panik), Dell Mühendislik ekibinin Engellenen İş Parçacıklarının spesifik nedenini tam olarak araştırmasına ve RCA'ya izin verir.
- Yalnızca Dell bir SP panik durumu gerçekleştirebilir. Dell Teknik Destek ekibiyle veya yetkili servis temsilcinizle iletişime geçin ve bu Dell makalesinin kimliğini belirtin.
- Bu kalıcı bir çözüm değildir ve engellenen iş parçacıklarının altında yatan neden çözülmezse çözüm uygulanana kadar bu durum tekrarlanabilir.
Yüklü Unity OE sürümüne bağlı olarak bu durumu çözmek için birden çok çözüm mevcuttur.
Çözüm mevcut olmayan durumlarda, Dell'in incelenmek üzere dizinin mevcut durumunu içeren bir döküm dosyası almasına olanak tanıyacak bir SP panik durumu gerekir. Bu döküm dosyası olmadan RCA mümkün olmayabilir. SP panik durumu için kök erişimi gerekir.
Additional Information
/EMC/backend/log_shared yalnızca birincil SP'de bulunursa (bağlıysa). Bu konuma ve bu dosyalara erişmek için birincil SP'de (canlı veya günlükler) olmanız gerekir.
Hata mesajlarında etkilenen SP'yi (yeniden başlatılması gereken SP) görürsünüz:
service@spa~# zgrep -i blocked /EMC/backend/log_shared/EMCSystemLogFile* EMCSystemLogFile.log:"2017-07-26T18:12:55.428Z" "unitymgr01_spa" "Kittyhawk_safe" "12657" "unix/spa/root" "ERROR" "13:102d0003" :: "ThreadsServicesSupervisor: Service:CIFS Pool:SMB2 BLOCKED for 423 seconds: Server operations may be impacted ." :: Category=System Component=DART_KERNEL EMCSystemLogFile.log:"2017-07-26T18:27:55.474Z" "unitymgr01_spa" "Kittyhawk_safe" "12657" "unix/spa/root" "ERROR" "13:102d0003" :: "ThreadsServicesSupervisor: Service:CIFS Pool:SMB2 BLOCKED for 1323 seconds: Server operations may be impacted ." :: Category=System Component=DART_KERNEL EMCSystemLogFile.log:"2017-07-26T18:42:55.520Z" "unitymgr01_spa" "Kittyhawk_safe" "12657" "unix/spa/root" "ERROR" "13:102d0003" :: "ThreadsServicesSupervisor: Service:CIFS Pool:SMB2 BLOCKED for 2222 seconds: Server operations may be impacted ." :: Category=System Component=DART_KERNEL
EMCSystemLogFile günlükleri, her zaman doğrudan kontrol edin ktraces emin olmak için.
Komutta
ktrace Dosyalar hızlı bir şekilde paketlenebilir ve bu nedenle bu mesajlar, en son sıkıştırılmamış dosyada bulunmayabilir. Tavsiye, tüm kontrol etmek olacaktır. c4_safe_ktrace dosyalar (şurada bulunur: /EMC/C4Core/log/) olarak adlandırılır.
Etkilenen SP'de (etkilenen NAS sunucusunun bulunduğu SP) şuraya gidin:
/EMC/C4Core/log/ tıklayın ve aşağıdaki komutu çalıştırın (BLOCKED kelimesinin tamamının büyük harflerle yazıldığından emin olun). Hangi SP'nin etkilendiğinden emin değilseniz bu komutu her ikisinde de çalıştırın. Etkilenen SP şu mesajları göstermelidir:
service@spa~# zgrep -h BLOCKED c4_safe_ktrace* | sort ... 2017/09/20-07:46:... sade:KERNEL: 3: 3:[core] ThreadsServicesSupervisor: Service:CIFS Pool:SMB2BLOCKED for 33730 seconds: Server operations may be impacted 2017/09/20-08:01:... sade:KERNEL: 3: 3:[core] ThreadsServicesSupervisor: Service:CIFS Pool:SMB2BLOCKED for 34630 seconds: Server operations may be impacted 2017/09/20-08:16:... sade:KERNEL: 3: 3:[core] ThreadsServicesSupervisor: Service:CIFS Pool:SMB2BLOCKED for 35530 seconds: Server operations may be impacted 2017/09/20-08:31:... sade:KERNEL: 3: 3:[core] ThreadsServicesSupervisor: Service:CIFS Pool:SMB2BLOCKED for 36430 seconds: Server operations may be impacted 2017/09/20-08:46:... sade:KERNEL: 3: 3:[core] ThreadsServicesSupervisor: Service:CIFS Pool:SMB2BLOCKED for 37330 seconds: Server operations may be impacted 2017/09/20-09:01:... sade:KERNEL: 3: 3:[core] ThreadsServicesSupervisor: Service:CIFS Pool:SMB2BLOCKED for 38230 seconds: Server operations may be impacted 2017/09/20-09:16:... sade:KERNEL: 3: 3:[core] ThreadsServicesSupervisor: Service:CIFS Pool:SMB2BLOCKED for 39130 seconds: Server operations may be impacted 2017/09/20-09:31:... sade:KERNEL: 3: 3:[core] ThreadsServicesSupervisor: Service:CIFS Pool:SMB2BLOCKED for 40030 seconds: Server operations may be impacted