PowerScale:SMB 程序中的 audit_flt 驅動程式處於關機狀態,導致節點 DU
Summary: OneFS 9.7 程式碼發現問題,其中稽核驅動程式無法在 SMB 程序中正確載入。這可能會導致資料不可用性 (DU)。
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
如果叢集的版本代碼為 9.7.1.0 - 9.7.1.6,此問題可能會受到影響。主要癥狀是:
- SMB 使用者無法存取部分或全部節點。
- 部分或所有節點上的SMB服務顯示處於 關閉 狀態的大量連接。雖然處於 關閉 狀態的連接可能由於各種原因而發生,但它也是與此特定問題相關的癥狀。若要檢查這一點,請使用下列命令:
isi_for_array -X 'netstat -an | grep "\.445 " | grep CLOSED | wc -l' | sort -V
您應該期望在輸出中看到所有 “0” 。以下是出現此問題的叢集範例:
MyCluster-1# isi_for_array -X 'netstat -an | grep "\.445 " | grep CLOSED | wc -l' | sort -V
MyCluster-1: 208
MyCluster-2: 425
MyCluster-3: 2228
MyCluster-4: 146
MyCluster-5: 5284
MyCluster-6: 964
- 已在叢集上啟用稽核。使用此命令檢查:
isi audit settings global view | grep "Protocol Auditing"
MyCluster-1# isi audit settings global view | grep "Protocol Auditing"
Protocol Auditing Enabled: Yes
- 您的叢集正在執行受影響的程式碼:9.7.1.0 - 9.7.1.6
若要最終確定您的叢集是否遇到此問題,請向 Dell 支援提出服務要求。它們可以幫助檢查來自 LWIO 服務的 SMB 核心轉儲。
Cause
出現此問題的原因是 SMB 進程未正確載入 audit_flt 啟動時的驅動程式。此問題通常在重新啟動SMB服務時觸發,例如在群集之間的代碼升級或故障轉移和故障回復期間。但是,如果SMB因任何原因重新啟動,則可能會發生這種情況。
Resolution
若要緩解此問題,請重新啟動SMB服務。在正常情況下,隔離的 SMB 重新開機應該就足夠了:
MyCluster-1# killall -6 lwio
這可以在多個節點上完成 isi_for_array。以下是在節點 1-4 上重新啟動 SMB 服務的範例:
MyCluster-1# isi_for_array -n1-4 'killall -6 lwio'
如果這不能緩解問題,可能需要重新啟動SMB和所有依賴項:
MyCluster-1# /usr/likewise/bin/lwsm restart lwio
同樣地,這可以同時在多個節點上完成,使用 isi_for_array。以下是在節點 1 至 4 上重新啟動 SMB 堆疊的範例:
MyCluster-1# isi_for_array -n1-4 '/usr/likewise/bin/lwsm restart lwio'
此問題已在 OneFS 9.7.1.7 之後的程式碼中解決。
Affected Products
Isilon, PowerScale OneFSArticle Properties
Article Number: 000286634
Article Type: Solution
Last Modified: 22 Aug 2025
Version: 4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.