Avamar:Data Domainの統合: レプリケーションで「ストリーム外」エラーが報告される
Summary: Data Domainと統合されたAvamar環境で、「ストリーム外」エラーによる例外が発生してレプリケーションが完了しています。
Symptoms
Data Domain(DD)と統合されたAvamar環境では、レプリケーションは部分的に完了していますが、ログには次の例外が表示されます。
2019-07-01 17:02:14 avtar Info <41435>: - Data Domain configured in Stand-Alone mode.
2019-07-01 17:02:14 avtar Info <40206>: Setting default storage unit to 'avamar-1315232775' for handle 2
2019-07-01 17:02:14 avtar Info <41440>: Data Domain handle:2 capabilities:0x0020021B
2019-07-01 17:02:14 avtar Info <10609>: Data Domain Destination login to ddxxxx.net complete
2019-07-01 17:02:15 avtar Info <42385>: id:1 Range-Replication selected because it is supported since DDOS 6.0 (container.1.cdsf)
2019-07-01 17:02:15 avtar Info <40160>: - Establishing a connection to the Data Domain system with basic authentication (Connection mode: A:0 E:0).
..
2019-07-01 17:02:18 avtar Info <40160>: - Establishing a connection to the Data Domain system with basic authentication (Connection mode: A:0 E:0).
2019-07-01 17:02:21 avtar Error <0000>: Replication failed - id: 3, unexpected exception caught: ddr_replthread:3:replicateSlice: ddp_filecopy_status failed
[179027] [140372932351744] Mon Jul 1 17:02:21 2019
ddp_filecopy_status() failed, start_offset[0], length[20971520], Err: 5539-filecopy operation failed (nfs: Out of Streams)
[179027] [140372932351744] Mon Jul 1 17:02:19 2019
ddp_filecopy_stop() failed, Err: 5004-nfs filecopy stop failed (nfs: No such file or directory)
...
[179027] [140372992386816] Mon Jul 1 17:02:15 2019
ddp_access() failed, Path avamar-1437556709/STAGING/09a1003e41e2a0d9e3333cf9fbb3345e0b665a0e/BACKUP-01974498BF0587FFD2EC4A97BD201139F29D9516-1D52F902DDF23FC, mode 0 Err: 5004-nfs lookup failed (nfs: No such file or directory)
[179027] [140372992386816] Mon Jul 1 17:02:14 2019
ddp_access() failed, Path avamar-1315232775/STAGING/09a1003e41e2a0d9e3333cf9fbb3345e0b665a0e/BACKUP-01974498BF0587FFD2EC4A97BD201139F29D9516-1D52F902DDF23FC, mode 0 Err: 5004-nfs lookup failed (nfs: No such file or directory)
..
2019-07-01 17:02:29 avtar Info <40176>: - Multi-stream restore summary (current 0, max active 0, max cloned 0, total cloned 0, ddr handle 2):
2019-07-01 17:02:29 avtar FATAL <0000>: Replication failed
2019-07-01 17:02:29 avtar FATAL <40009>: DDR encountered errors.
2019-07-01 17:02:29 avtar Info <9772>: Starting graceful (staged) termination, DDR_ERROR event received (fatal severity) (wrap-up stage)
2019-07-01 17:02:29 avtar Info <0000>: Entering the 'final' phase of termination, DDR_ERROR need to exit)
2019-07-01 17:02:29 avtar Info <40176>: - Multi-stream restore summary (current 0, max active 0, max cloned 0, total cloned 0, ddr handle 2):
2019/07/01-14:02:29.25907 [avtar] INTERNAL ERROR: <0001> assert error (result == MSG_ERR_NONE), /local/jenkins/workspace/server_rollup_hotfix_SLES11-64/src/avtar/ade/adelib/interfaceade.cpp line 396
2019-07-01 17:02:29 avtar Info <5675>: Replicated 0 of 78 backups (0 errors) for client "ddxxxx.net"
2019-07-01 17:02:29 avtar Error <6655>: Replicate interrupted.
2019-07-01 17:02:29 avtar Info <7925>: Restored 940.4 KB from selection(s) with 6.000 GB in 1 files
2019-07-01 17:02:29 avtar Info <6090>: Restored 940.4 KB in 0.34 minutes: 159.9 MB/hour (174 files/hour)
AvamarとソースData Domainの両方、およびソースとターゲットのData Domain間の接続がすでに検証されている(ポート111、2049、2051、2052でping、ssh、telnet(またはcurl)を使用)。
Cause
1つのレプリケーション グループに複数の(4+)クライアントが含まれていました。
レプリケーション グループでは、「max-concurrent-processes」が4に設定され、4つのクライアントが同時にレプリケートされました。
その結果、ソースとターゲットのData Domain間のストリーム数が、使用可能なストリーム数を上回りました。
Resolution
1.Data Domainで次のコマンドを実行して、Data Domainのソースとターゲットの両方で最大ストリーム数を確認する必要があります。
ddboost@dd# ddboost streams show active
--------- Active Streams -------- --------- Soft Limits -------- - Hard Limit -
Name Read Write Repl-out Repl-in Read Write Repl Combined Combined
----------------- ---- ----- -------- ------- ---- ----- ---- -------- --------------
avamar-xxxxx 0 0 0 0 - - - - -
----------------- ---- ----- -------- ------- ---- ----- ---- -------- --------------
DD System Stream Limits: read=6 write=35 repl-in=20 repl-out=18 combined=30
2.次のように、許可される最大数と実際のストリーム アクティビティーを比較します。 repl-in または repl-out ターゲットDDとソースDDにそれぞれ追加されます。
ナレッジベース記事 「Data Domain: 「DDOS 6.0でサポートされているストリーム数」には、モデルごとのサポートされているストリーム数のリストもあります。この記事には、以前のDDOSバージョン4.0から5.7へのリンクも含まれています。
3.max-concurrent-processesとData Domainレプリケーション ストリームの最大数を確認します。
-
クライアントがアルファベット順にレプリケートされている場合は、次のようになります。
- 4つのクライアントが同時にレプリケートして、24のストリームを作成します(デフォルトではクライアントごとに6つ)
- デフォルトは、フリーフォーム フラグ「
[avtar]ddr-repl-max-parallel-streams" を UI 内の値が 1 から 29 に設定します。
-
クライアントが並列レプリケートされている場合(プールベースのレプリケーション)、クライアントあたりのストリーム数を制御する追加の設定[Maximum number of Data Domain Replication Streams]があります。
リソースの使用率と管理に関するベスト プラクティスとして、クライアントが複数のレプリケーション グループに分割されていることを確認します。
Additional Information
-
「
max-streams"は、UIの"Maximum concurrent processes"に相当します。 -
「
max-ddr-streams」は、UIの「Data Domainレプリケーション ストリームの最大数」に相当します。