NetWorkerでのテープ ライブラリー ハードウェアの問題のトラブルシューティング
概要: この記事は、サポートおよびNetWorker管理者がライブラリー レベルまたはトランスポート レベルで問題を検証し、ホスト レベルとアプリケーション レベルの両方の問題を除外するのに役立ちます。
現象
- NetWorkerバックアップにライブラリーを安定的に使用できない
- システム ログまたはアプリケーション ログでのASC/ASCQ/SCSI SENSEエラーまたはメッセージの受信
- 目的のロボット制御ホストからライブラリの存在を検出できません
- NetWorkerでライブラリーを準備完了状態に移行できない
- 特定またはランダムなライブラリ操作を実行する散発的または一貫性のあるエラー
原因
ライブラリが以前に動作していて、突然問題が発生した場合は、操作を妨げる可能性のある変更を検討してください。
- ロボット、スイッチ、またはアダプターのファームウェア、ドライバー、または構成の変更
- テープ・ハードウェア、テープ・カートリッジ、またはその他のライブラリー・コンポーネントの追加、交換、または除去
- NetWorkerソフトウェア バージョン、オペレーティング システム パッチの変更
- データ パス内のコンポーネントの電源喪失や再起動などのハードウェア イベント
- 図書館のドアを開ける作業
解決方法
テープ ライブラリー内のハードウェアの問題を特定するには、最も権限委譲されたレベルで操作をテストする必要があります。問題を切り分けるために、SCSIベースの転送がデータパスから削除され、純粋なライブラリ関数がテストされます
いくつかのライブラリコンポーネントが機能しているように見える場合があることに注意してください。非表示のコンポーネントに障害が発生すると、ライブラリがホスト アプリケーションに対して正常に動作できなくなる可能性があります。たとえば、ロボットはボリュームを正しく移動できますが、内部ロジックによってドライブのシリアル番号が誤って識別されたり、エレメントの場所を見失ったりする可能性があります。Webインターフェイスを介してコマンドが成功しても、ライブラリーがSANスイッチにログインできない場合があります。これは、ターゲット側のGBICまたはバックプレーンの問題を示している可能性があります。
次の基本的なテストを実行して、各インターフェイスでどの機能が動作するかを確認します。ライブラリー ベンダーと連携する前に、これらの手法を使用してリカバリーを試みます。
ライブラリー ハードウェア - LCDパネル
トラブルシューティングは、可能な限りローカルでロボットから開始します - ほとんどのライブラリ管理者にとって、これはライブラリユニットの前面にあるディスプレイパネルを意味します。この時点から開始すると、SCSI転送、Ethernet、またはWeb GUI固有の問題を除外するのに役立ちます。
- エラーのチェック - 通常、ストレージ内の明らかな障害は、メインウィンドウ、または「アラート」または「エラー」サブメニューのいずれかにエラーコードとして表示されます。ここで問題が見つかった場合は、直ちにベンダーに問い合わせる必要があります(そうしないと、損害が悪化する可能性があります)。
- ユーザー インターフェイスで基本的な操作をテストします(LCDディスプレイでテストしたものと同じ)
- テープカートリッジをスロットからドライブへ、ドライブからドライブへ、ドライブからスロットへ、スロットからスロットへ移動します。
- インポートとエクスポートのスロットまたはマガジンが存在する場合は、上記のようにソースと宛先のすべての組み合わせを使用して、同じ機能をテストします。
- テープ カートリッジをライブラリとの間で物理的にエクスポートおよびインポートする方法をテストします。
- 使用可能な場合は、ライブラリーの初期化、インベントリー、およびリセット機能をテストします。
- テープ カートリッジをロボット ハンド、ドライブ、またはスロットから取り出すことができない場合は、続行する前にライブラリからテープ カートリッジを手動で取り外す必要があります。
- データの表示の確認:
- テープ カートリッジの位置、バーコード、およびドライブのステータスが正しいことを確認します。
- ライブラリのどの機能が有効になっているか(ある場合)を確認し、効果を確認します。
- 仮想ライブラリにはLCDはありませんが、それらの健全性は、それらを仮想化するストレージデバイスのコマンドラインで最も原始的なレベルでチェックできます。物理的な図書館と同様に、専門的なツールと知識を備えたベンダーの支援が必要になる場合があります。
- Data Domainライブラリのテストについては、「VTLターゲットの可視性の問題のトラブルシューティング」を参照してください。
- Dellディスク ライブラリーのテストについては、「EDLサーバーのトラブルシューティング」または「バックアップ アプリケーション(BSP)からEDLへの通信に関する問題のトラブルシューティング」を参照してください
Library Intelligence - Web ユーザー・インターフェース
一般的に利用可能な次のレベルのテストは、ライブラリのユーザーインターフェイスとして機能するWebインターフェイスです。このインターフェイスは、物理テープ ライブラリーと仮想テープ ライブラリーの両方に共通であり、ライブラリーとその機能への包括的なアクセスを提供することを目的としています
このテスト方法では、ホスト ホスト バス アダプター(HBA)、スイッチ、ターゲット ポートなどの通常のSCSIデータパスをバイパスします。SCSIコマンドを組み込みWebサーバーからロボットに直接送信します。そのため、標準的な使用で遭遇する実際の問題を正確に表していない可能性があります。
- 上記のように、ユーザー インターフェイスで、インターフェイス内のアラート、エラー キュー、または表示を確認します。繰り返しになりますが、ライブラリから報告された問題は、ただちにベンダーに問い合わせる必要があります。
- 可能であれば、LCDで行ったように、ユーザー インターフェイスで基本的な操作をテストします
- ホスト接続性、バーコードの位置、ドライブのシリアル番号、その他の関連データなど、LCDで行ったようにユーザー インターフェイスでデータを確認します
図書館サービス - ベンダー:
障害は発生していないが、スイッチ レイヤー、トランスポート レイヤー、またはホスト レイヤーでハードウェアの問題が発生しているとライブラリーに表示される場合は、ベンダーにお問い合わせください。専門的なツールと知識を使用してトラブルシューティングを行うことができます。この作業を行う前に、次の操作を行います。
- ライブラリーの電源を完全に切って、電源を切らない(理想的には電源プラグを抜いた状態)を5分間放置します。テープ ライブラリーのような大型デバイスでは、コンデンサが放電し、場合によっては誤動作状態が解消されるまでに時間が必要です。
- ロボットとドライブのファームウェアのアップグレードを手配します(多くの場合、ベンダーの支援が必要です)。ハードウェアの問題については、最新のコードを使用するのが最善です。
- 不良なケーブルまたはドライブがライブラリから取り外されていることを確認します。1つの不具合のあるコンポーネントが他のコンポーネントに影響を与えることは珍しくありません。可能であれば、疑わしいコンポーネントを交換してテストし、問題をさらに特定します。
その他の情報
Networker:NetWorkerでのテープ ライブラリーの問題のトラブルシューティング
サポートは上記の基準を使用してガイダンスを提供できますが、OS、HBA、またはロボット ベンダーのリソースがありません。この制限により、トラブルシューティングが長引いて失敗する可能性があります。