NetWorker:NetWorkerでのテープ ライブラリーの問題のトラブルシューティング」
概要: この記事では、NetWorkerサポートとNetWorkerバックアップ管理者の両方がテープ ライブラリー関連の問題に取り組み、トラブルシューティングを行うのを支援することを目的としています。
手順
テープ ライブラリーの問題を調査する前に、次の点を考慮することが重要です。
- テープ ドライブは、データとラベルをメディアに読み書きし、すべてのメディア機能を提供しますが、テープ カートリッジ自体を移動することはできません
- テープ ライブラリーは、メディア テープ カートリッジをエレメントからエレメントへと移動します。ドライブ、スロット、インポートおよびエクスポート ポート、データの読み取りまたは書き込みを行いません
テープ カートリッジを移動できないためにNetWorker操作が失敗した場合は、いくつかの一般的な原因が考えられます。
- ライブラリ ロボットまたは内部のハードウェアまたはファームウェアの問題
- NetWorkerホストからLibrary Robotics over Transportへの接続の問題
- OS、ドライバー、またはNetWorkerホストとライブラリ間の互換性の問題
- テープ ライブラリーのタイプ、状態、アドレス指定に関するNetWorker構成の問題
これらの手順を時系列順にたどって、問題の性質を特定し、場合によっては解決します。このドキュメントで問題が解決しない場合は、問題を絞り込み、スペシャリストが作業を継続するのに役立つテストを提供します。
1.環境情報
NetWorkerサーバーおよび影響を受けるストレージ ノードから、次の手順を実行します。
- ホスト名、OSタイプ、バージョン。
- NetWorkerのバージョンとビルド番号。
- 「」の出力
inquire' コマンドでテープとライブラリを表示します。 - 現在のZIPコピー
nsrdb(ロールバックのために必要に応じて現在のジュークボックス情報を保存するため)
Linux:/nsr/res/nsrdb
Windows(デフォルト):C:\Program Files\EMC NetWorker\nsr\res\nsrdb - ストレージ ノード、ライブラリのNetWorker名、影響を受けるノード、デバイス、ボリュームのリスト
- 問題の共通点(特定のボリューム、特定のドライブ、特定のノードなど)
nsrget -o:d 影響を受けるサーバーとノード上。
-o:d テープが書き込みビジー状態になっているテープのあるホスト上。これは、NetWorker Management Console (NMC)の モニタリング -> デバイスから確認できます 。
次の記事では、NSRGETの取得と使用に関する情報を提供します。NetWorker:「NSRGet NetWorkerデータ コレクション ツールの使用方法(英語)」
2.ライブラリーの準備状況のテスト
- 影響を受けるライブラリーのストレージ ノード所有者が有効で準備ができているかどうかを確認します。
- NMCで、デバイス->ストレージ ノードに移動します。
- [View ->Diagnostic Mode]が有効になっていることを確認します。
- 右側のペインの [Enabled ]列と [Ready ]列を確認します。
- 有効であるはずのストレージ ノードが有効でない場合は、ストレージ ノードを右クリックし、 有効/無効 をクリックして 有効にします 。
- ストレージ ノードが1、2分以内にReady にならない場合は、個別にフォローアップする必要があります。ストレージ ノードにアクセスできないため、ライブラリが応答していません。
- 影響を受けるライブラリーが有効で準備ができているかどうかを確認します。
- NMCで、[デバイス] -[>ライブラリー]に移動します。
- [View ->Diagnostic Mode]が有効になっていることを確認します。
- 右側のペインの [Enabled ]列と [Ready ]列を確認します。ライブラリの状態が [Ready ]と表示されている場合は、セクション[
4]. - 有効になっていない場合は、左側のライブラリインスタンスを右クリックし、[有効化/無効化]を選択して再度有効にすることができます。
- 有効になったら、1〜2分待ってから、[ライブラリ]コンテナをもう一度クリックし、[準備完了]列に緑色のチェックマークが表示されるかどうかを確認します。
- ライブラリーの準備ができていない場合は、左側のライブラリー インスタンスを右クリックして Propertiesを選択し、 General タブでControl Port の値が
scsidev@#.#.#から表示されるアドレスinquireに指定します。 - Control Portが一致しない場合は、[Enabled]を[No]に設定して[OK]をクリックします。次に、プロパティを再入力し、
inquireアドレスが検出されました。Control Portをアップデートした後、EnabledをYesに戻し、再度OKをクリックして再度有効にします。1、2分待って、ライブラリーが 「Ready」になったかどうかを確認します。 - 最後に、 Control Port の値を修正した後でライブラリが Readyにならない場合は、最後にライブラリのプロパティを入力します。[ Advanced ] タブで、[ Debug Trace Level ] を 5 に設定します。をクリックし、 無効化 してから再度 有効にして 、デーモン ログに起動シーケンスを 2 分間キャプチャします。
セクション[2.2]で、次のことを確認します。 nsrlcpd 目的のストレージ ノードで起動します。また、単独で停止または再起動しないことも確認してください。プロセスID(PID)が変化し続ける場合は、プロセスがソフトウェアによって停止または強制終了されているか、コアがダンプされていることを示しています。また、起動を妨げる可能性のある、サーバーとストレージ ノード間の名前解決の問題にも注意してください。サーバーがノードに対して解決する名前は、ノード自体のnsrladb名およびノードのサーバー名と一致する必要があります。
- ライブラリの準備状況に関する問題の高度なトラブルシューティング情報については、「 NetWorkerでのテープ ライブラリーの準備状況の問題のトラブルシューティング 」を参照してください。
- 『NetWorkerトラブルシューティング ガイド』を参照してください。プロセス クラッシュとコア ダンプ(ノードの
nsrexecd、nsrsnmd、またはnsrlcpdコアダンプです。
NetWorkerのホストごとのプロセスの概要の詳細については、次を参照してください。NetWorkerプロセスとポート
これらのサービスに関するメッセージは、ホストの daemon.rawファイルに置き換えます。
- Linuxの場合
/nsr/logs/daemon.raw - Windows(デフォルト):
C:\Program Files\EMC NetWorker\nsr\logs\daemon.raw - NetWorker:nsr_render_logを使用して.rawログ ファイルをレンダリングする方法
3.ライブラリーの応答性を判断します。
ライブラリーの準備が整っておらず、原因を特定できない場合は、ライブラリー自体に接続できることを確認します。
- エラー コードまたはメッセージの診断を支援するため、
inquire[1.3]をクリックし、ライブラリが出力に「Autochanger」として表示されることを確認し、SCSI#.#.#住所を提供する必要があります。 - ライブラリが
inquire出力する場合は、OSがそれを検出できることを確認します。ライブラリーがNetWorkerで構成され、有効になっている場合、Solarisホストはライブラリーを報告しません。サポートについては、「NetWorkerでのテープ ライブラリー検出の問題のトラブルシューティング」を参照してください。 - ライブラリーが基本的なライブラリー コマンドに応答していることを確認します。[
3.1]、次を実行します。'sjisn #.#.#'.ライブラリー テスト コマンドの詳細については、「NetWorkerでのテープ ライブラリー アクセスの問題のトラブルシューティング」を参照してください。 - SJIコマンドが失敗した場合は、転送またはハードウェアの問題の可能性を考慮してください。サポートについては、「NetWorkerのテープ ライブラリー ハードウェアの問題のトラブルシューティング 」を参照してください。
- OSがライブラリーを検出せず、SJIコマンドに正しく応答し、NetWorkerが検出に失敗するという問題がある場合は、
jbconfigコマンドを実行し、オプション 2 を選択します。これが機能しない場合は、オプション 4 を試し、ライブラリアドレスを手動で指定し、標準ライブラリとして構成します (オプション 56)。詳細については、「 NetWorkerでのテープ ライブラリ構成の問題のトラブルシューティング 」を参照してください。
4.テープの動きとボリュームの稼働状態をテストする
ライブラリーの準備ができていて、応答しているように見えても、ボリュームのロードに問題がある場合は、さまざまな原因が考えられます。
- 可能であれば、ライブラリ全体を空にします。他の操作を停止できる場合は、右クリックして、[デバイス]-[>ライブラリ]タブからライブラリーをリセットします。
- 1 つのテープカートリッジを 1 つのデバイスにロードしようとしましたが、その場合は両方がロードの問題の影響を受けていると考えられます。必要に応じて、各試行後にアンロードします。
- 異なるドライブ内の同じボリューム、および影響を受けると考えられるドライブ内の異なるボリュームと比較します。エラーとパターンがある場合は、メモします。
- デバイスに関係なく、ボリュームのロードが確実に失敗する場合は、次のラベル チェックを試してください。
- マウントせずにボリュームをロードする テープ・カートリッジがエラーなく動く場合は、アームが機械的に機能していることを確認しています。
- そのノードで
nsrmm -pv -f networker_device検証済みのラベルで応答する場合は、メディアも有効で正常であることを確認しています。 - ライブラリーのプロパティで、診断モードを有効にして、タイマータブに移動し、スリープのロードを60に設定してからOKをクリックします。
- ボリュームをアンロードし、成功した場合はボリュームの再ロードを試みます。この問題はタイミングの問題である可能性があります(再び障害が発生するまで、より低いスリープ値を試すことができます)。
- ここで、
nsrmmコマンドが失敗しました。さらにテストが必要です。NMCで問題のドライブを右クリックし、[ 有効化/無効化]を選択して無効にします。- 次のコマンド:
scannerコマンドをデバイス上で実行します。- NetWorkerサーバーのローカル ストレージ ノードの場合は、次のコマンドを実行します。
scanner -nizv local_device - 「リモート」NetWorkerストレージ ノードの場合は、次のコマンドを実行します。
scanner -s server -nizv local_device
- NetWorkerサーバーのローカル ストレージ ノードの場合は、次のコマンドを実行します。
- ~20行の後で区切り、ラベルの読み取りメッセージを確認します。成功は次のように示されます。
8936:scanner: scanning media_type tape volume_name on device_nameの詳細を確認してください。 - 「Fusion」
scannerメッセージ unexpected file number, wanted 2, got higher_number data loss has occurred, most suspected due to SCSI reset;NetWorkerでのラベルの上書きとSCSIリセットのトラブルシューティングを確認します。
- 次のコマンド:
- ここで、
scannerを返します。message 8945:scanner: Read: -1 bytesボリュームが他のノードまたはドライブで読み取れるかどうかを判断し、問題の傾向を判断します。デバイスがLTO-4以降であり、一部のノードでは一部のボリュームを読み取ることができるが、他のボリュームを読み取ることができない場合は、ドライブ復号化の失敗を考慮してください。LTOハードウェア暗号化とNetWorker。
高度なメディア検証情報については、次を参照してください。NetWorkerでのメディア マウントの問題のトラブルシューティング。
5. ドライブの順序に関する問題をテストします
ロードおよびマウント コマンドは成功するが、ラベルの読み取りまたは単純なマウントが失敗する場合は、ドライブの順序が正しくない可能性があります。
- 可能であれば、ライブラリ全体を空にします。他の操作を停止できる場合は、右クリックして、[デバイス]-[>ライブラリー]からライブラリーをリセットします。
- 1 つのテープカートリッジを 1 つのデバイスにロードしようとしましたが、その場合は両方がロードの問題の影響を受けていると考えられます。必要に応じて、各試行後にアンロードします。
- 異なるドライブ内の同じボリューム、および影響を受けると考えられるドライブ内の異なるボリュームと比較します。エラーとパターンがある場合は、メモします。
- 読み込みが確実に失敗する場合は、次のラベル チェックを試してください。
ライブラリーのロード問題に関するより高度なサポートについては、以下を参照してください。NetWorker.
でのテープ ライブラリーのロード問題のトラブルシューティングこれらのテストがすべて失敗し、それ以上の作業ができない場合は、この記事の各手順に従って結果を文書化し、NetWorkerサポートに連絡してください。ソリューションを迅速化し、「繰り返しのステップ」を制限するには、明確な詳細が不可欠です。