PowerProtect Data Manager:在 PPDM UI 中,搜索群集的状态显示特定搜索节点处于故障状态
Summary: 搜索节点变得无响应,索引作业保持排队状态,因为它们无法在故障节点上运行。搜索节点为 19.16 版或更早版本时可能会发生这种情况。
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
在处于故障状态的搜索节点上,转至 /var/log 并检查消息日志。您会看到类似以下内容的条目:
2024-07-08T10:00:12.049322-04:00 search_node_name kernel: [518834.025665][ C1] watchdog: BUG: soft lockup - CPU#1 stuck for 235970s! [nfsd:2692]
受影响的版本:19.16 及更低版本
由戴尔工程部门在 PPDMESC-6808 中进行了调查
Cause
搜索群集上的 NFS 守护程序命中作系统级别“软锁定”。有关软锁定的更多详细信息,请阅读:
https://www.suse.com/support/kb/doc/?id=000018705
Resolution
解决方法:
登录到具有 nfsd 无响应的搜索节点。
提醒:如果您需要搜索节点的凭据,请以根用户身份在 PPDM 设备上运行以下命令:
source /opt/emc/vmdirect/unit/vmdirect.env && /opt/emc/vmdirect/bin/infranodemgmt get -secret
这将为搜索节点提供管理员和根凭据。以管理员用户身份打开与相关搜索节点的 SSH 会话,并运行以下命令:
echo 20 > /proc/sys/kernel/watchdog_thresh
此命令将监护程序阈值修改为 20。但是,应用此配置更改不会在服务器重新启动后持续存在。进行以下更改以在服务器重新启动时保留此更改。
echo "kernel.watchdog_thresh=20" > /etc/sysctl.d/99-watchdog_thresh.conf sysctl -p /etc/sysctl.d/99-watchdog_thresh.conf
永久修复:PowerProtect Data Manager 版本 19.16 P2 和 19.17+ 版本
Products
PowerProtect Data ManagerArticle Properties
Article Number: 000228169
Article Type: Solution
Last Modified: 07 Jul 2025
Version: 2
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.