PowerProtect Data Manager:在 PPDM UI 中,搜尋叢集的狀態顯示特定搜尋節點處於故障狀態

Summary: 搜索節點變得無回應,索引作業仍處於排隊狀態,因為它們無法在故障節點上運行。19.16 版本或更早版本的搜索節點可能會發生這種情況。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

在故障狀態的搜尋節點上,前往 /var/log 並檢查訊息記錄。您會看到類似以下內容的項目:

2024-07-08T10:00:12.049322-04:00 search_node_name kernel: [518834.025665][    C1] watchdog: BUG: soft lockup - CPU#1 stuck for 235970s! [nfsd:2692]

受影響的版本:19.16 及更低版本

由 Dell 工程部門在 PPDMESC-6808 中進行調查

 

Cause

Search Cluster 上的 NFS 守護程式達到作業系統層級的「軟鎖定」。有關軟鎖定的更多詳細資訊,請閱讀:
https://www.suse.com/support/kb/doc/?id=000018705此超連結會帶您前往 Dell Technologies 以外的網站。

 

Resolution

因應措施:
登入其 nfsd 沒有回應的搜尋節點。

注意:如果您需要搜尋節點的登入資料,請以根使用者身分在 PPDM 裝置上執行下列命令:
source /opt/emc/vmdirect/unit/vmdirect.env  &&  /opt/emc/vmdirect/bin/infranodemgmt get -secret 

這會提供搜尋節點的管理員和根登入資料。以管理員使用者身分開啟至相關搜尋節點的 SSH 工作階段,並執行下列命令:

echo 20 > /proc/sys/kernel/watchdog_thresh

此命令會將監視程式閾值修改為 20。但是,套用此組態變更 不會在伺服器重新開機後持續存在進行以下更改以在伺服器重新啟動時保留此狀態。

echo "kernel.watchdog_thresh=20" > /etc/sysctl.d/99-watchdog_thresh.conf
sysctl -p  /etc/sysctl.d/99-watchdog_thresh.conf

永久修正:PowerProtect Data Manager 版本 19.16 P2 和 19.17+ 版本

 

Products

PowerProtect Data Manager
Article Properties
Article Number: 000228169
Article Type: Solution
Last Modified: 07 Jul 2025
Version:  2
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.