NetWorker:NetWorker DDBoostバックアップ デバイスでのRPCエラー

Summary: アクティブなセッションを持つData Domainは、Data Domainデバイスが古い状態になる通信の問題を観察します。書き込みがない場合でも、動作していないセッションが保持され、メディア管理データベースから使用されているセッション情報は解放されません。同じプールとストレージ ノードに関連づけられているすべてのデバイスは、これ以上セッションを受け入れることができません。影響を受けるデバイスがバックアップまたはクローン ジョブを受け入れず、RPCエラーが発生します。 ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

  • DDBOOSTデバイスがアンマウント ステータスで、アクション ログに次のエラーが表示されるため、NetWorkerサーバー上のすべてのバックアップ/クローン操作はハング/キュー状態のままになります。 
デバイス。RPC送信操作が失敗しました。errno = 破損したパイプ
 
  • 回復不能なエラーが原因でセーブセットのバックアップが失敗しました。これは重大なエラー メッセージの1つです。
  • Data Domainデバイスはバックアップ ウィンドウ中にアンマウントされますが、NetWorkerとData Domainの間には接続の問題はありません。
  • NetWorkerジョブ データベースが破損し、NetWorkerバックアップ アプリケーションとジョブ データベースの間に不整合が生じる

Cause

Data Domain DDBOOSTバックアップ デバイス上のRPCエラーを定期的に監視し、対応処置を実行する必要があります。それ以外の場合、バックアップ/クローン ジョブは待機中のステータスのままであり、何も書き込みがない場合でも、動作していないセッションを保持し、メディア管理データベースから使用されているセッション情報を解放しません。

Resolution

NetWorkerサービスの再起動は最初のインスタンスで実行できます。また、DDBOOSTデバイス上の基盤となるRPCエラーが引き続き引き続き発生するため、問題が再度発生する可能性があります。 

NetWorkerストレージ ノードのタイムアウト値は、 NetWorkerバックアップ環境の考慮事項およびNetWorkerデバイス最適化ガイド に従って微調整する必要があります。

Linux Networkerストレージ ノードで、次の手順に従って、次のように適切なTCPキープ アライブ タイムアウト値を設定します。
1.root:sudo su -
2に切り替えます。次のコマンドを実行して、tcp_keepalive設定を変更します。
# echo 700 > /proc/sys/net/ipv4/tcp_keepalive_time
# echo 10 > /proc/sys/net/ipv4/tcp_keepalive_intvl
# echo 20 > /proc/sys/net/ipv4/tcp_keepalive_probes
Windows Networkerストレージ ノードで、次の手順に従って、次のように適切なTCPキープ アライブ タイムアウト値を設定します。
1.変更を行う前に、Windowsレジストリーをバックアップします。
2.「 HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\Tcpip\Parameters 」に移動します。
3.「 KeepAliveTime 」という名前の新しいREG-DWORDエントリーを作成します。
4.10進900000(15分)の値を指定します。
5.新しい値をアクティブにするには、再起動が必要です。

メモ: その他のTCPチューニングについては、「 NetWorkerパフォーマンス最適化計画ガイド 」を 参照してください。詳細については、 https://www.dell.com/support/home/product-support/product/networker/docs を参照してください。

上記のパラメーターが定義されたら、ストレージ ノードのNetWorkerサービスを再起動する必要があります。これらの値がNetWorkerストレージ ノードの再起動全体で一貫していることを確認します。

また、NetWorkerストレージ ノード上のnsrmmdプロセスに関連するNetWorkerバックアップ アプリケーションの不整合は、次の手順を実行して排除する必要があります。

1.バックアップ サーバーでNetWorkerサービスを停止します。

Linux: windows nsr_shutdown
: net stop nsrexecd /y

2.NetWorkerサーバー上の/nsr/res/jobsdb、/nsr/logs/daemon.raw、/nsr/tmpフォルダーの名前を変更します。
3.バックアップ サーバーでNetWorkerサービスを再起動すると、NetWorkerの保存操作が再初期化され、RPC接続のリセットと非アクティブ タイムアウト値が表示されなくなります。

Linux: systemctl start networker
Windows: net start nsrd

NMCがNetWorkerサーバーにインストールされている場合: net start gstd

Article Properties
Article Number: 000217738
Article Type: Solution
Last Modified: 15 Nov 2023
Version:  2
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.