NetWorker:NetWorker DDBoost 備份裝置上的 RPC 錯誤

摘要: 具有使用中會話的 Data Domain 觀察到通訊問題,導致 Data Domain 裝置進入過時狀態。即使沒有任何寫入內容,它仍會保留無法運作的會話,也不會發佈媒體管理資料庫中使用的會話資訊。與相同集區和儲存節點相關聯的所有裝置都無法接受任何會話;受影響的裝置不會接受任何備份或複製工作,導致 RPC 錯誤。

本文适用于 本文不适用于 本文并非针对某种特定的产品。 本文并非包含所有产品版本。

症状

  • NetWorker 伺服器上的所有備份/複製作業都會保持在「停止」/「Queued」狀態,因為 DDBOOST 裝置處於未掛接狀態,而且會在動作記錄中看到下列錯誤: 
無法取得裝置的使用者名稱和密碼;RPC 傳送作業失敗;errno = 斷管
 
  • 由於無法復原的錯誤,儲存集的備份失敗是其中一個重大錯誤訊息。
  • 雖然 NetWorker 和 Data Domain 之間沒有連線能力問題,但 Data Domain 裝置會在備份視窗期間取消掛接。
  • NetWorker 工作資料庫損毀,導致 NetWorker 備份應用程式與工作資料庫不一致

原因

應定期監控 Data Domain DDBOOST 備份裝置上的 RPC 錯誤並採取更正措施,否則備份/複製工作仍處於等候狀態,即使沒有任何寫入狀態,它仍會保留無法運作的會話,也不會發佈媒體管理資料庫所使用的會話資訊。

解决方案

NetWorker 服務可在第一個實例中重新開機,而且我們可能會注意到問題再次發生,因為 DDBOOST 裝置上的基本 RPC 錯誤仍然存在。 

NetWorker 儲存節點上的逾時值必須根據 NetWorker 備份環境考慮和 NetWorker 裝置優化指南進行微調。

在 Linux Networker 儲存節點上,請按照以下步驟設定適當的 TCP Keep Alive 逾時值,如下所示。
1.切換至 root:sudo su -
2。執行下列命令以修改tcp_keepalive設定:
# echo 700 > /proc/sys/net/ipv4/tcp_keepalive_time
# echo 10 > /proc/sys/net/ipv4/tcp_keepalive_intvl
# echo 20 > /proc/sys/net/ipv4/tcp_keepalive_probes
在 Windows Networker 儲存節點上,請按照以下步驟設定適當的 TCP Keep Alive 逾時值,如下所示:
1.進行變更前,請先備份 Windows 登錄檔。
2.流覽至「HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\Tcpip\Parameters」。
3.建立名為「KeepAliveTime」的新 REG-DWORD 專案。
4.提供十進位 900000 (15 分鐘) 的值。
5.必須重新開機,才能啟用新值。

注意:其他 TCP 調整詳情請參閱《NetWorker 效能優化規劃指南》,可透過HTTPs://www.dell.com/support/home/product-support/product/networker/docs取得。

定義上述參數後,必須重新開機儲存節點 NetWorker 服務。請確定這些值在 NetWorker 儲存節點重新開機時保持一致。

此外,NetWorker 備份應用程式上與 NetWorker 儲存節點上的 nsrmmd 程式有關的任何不一致之處,都必須執行以下步驟來消除。

1.停止備份伺服器上的 NetWorker 服務。

Linux:nsr_shutdown
Windows:net stop nsrexecd /y

2.在NetWorker 伺服器上重新命名 /nsr/res/jobsdb、/nsr/logs/daemon.raw 和 /nsr/tmp 資料夾。
3.在備份伺服器上再次重新開機 NetWorker 服務,這將重新初始化 NetWorker 儲存作業,而且不會注意到進一步的 RPC 連線重設和非作用中逾時值。

Linux:systemctl start networker
Windows:如果已在 NetWorker 伺服器上安裝NMC,net start nsrd

net start gstd

文章属性
文章编号: 000217738
文章类型: Solution
上次修改时间: 15 11月 2023
版本:  2
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。