「Data Domain:ユーザー インターフェイスがダウンする問題または断続的になる問題のトラブルシューティング方法
Summary: この記事では主に、インターフェイスがダウンする問題、複数のインターフェイスがダウンする問題、インターフェイスが断続的になる問題、およびネットワーク カードの不良をトラブルシューティングする手順を提供しています。インターフェイスがダウンする問題を解決する際には、パーツの交換は最後の手段とする必要があります。スイッチ側の確認など、最初にこれらの問題をトラブルシューティングすると、最も迅速に解決できる場合があります。 ...
Instructions
- その問題が、単一のインターフェイス、複数のインターフェイス、断続的なインターフェイス、またはネットワーク カードに関する問題であるかを確認します。
- インターフェイスがダウンしているか、接続が断続的か、応答していないか、またはネットワーク カードに問題があるかどうかを特定します。
- 「Link Status/No」は、電気信号のないダウンしているインターフェイスです。
- 「Intermittent」は、継続的または一定でない、不規則な間隔で接続が喪失します。
- Data Domain上のハードウェア インターフェイスのステータスを確認するには、次のコマンドを実行します。
# net show hardware
- 現在のアラートを確認するには、次のコマンドを実行します。
# alerts show current
- アラートの履歴を確認するには、次のコマンドを実行します。
# alerts show history
- 「net show settings」をチェックして、ダウンしているインターフェイスが仮想ボンド、VLAN、またはエイリアスの一部であるかどうかを確認します。
# net show settings
メモ: インターフェイスにリンク ライトを設定して作動させるには、IPを使用して構成するか、ボンドで構成する必要があります。 - DDOSのアップグレード後にインターフェイスがダウンした場合、ハードウェア障害が原因である可能性は非常に低くなります。
- ダウンしているインターフェイスがボンドにない場合は、次のコマンドを使用して無効にして有効にすることができます。
# net disable ethXx # net enable ethXx
- Dellサポートにケースを開く前に、ネットワーク チームにスイッチの構成を確認することを強くお勧めします。
- アップグレード中に、インターフェイスがネットワークから切断され、DDインターフェイスから応答を受信しないと、スイッチがタイムアウトし、ポートが無効になることがあります。
- スイッチ ポートがタイムアウトして無効になった場合、Data Domainサポートではこの問題を解決できません。ネットワーク チームに連絡して有効にしてもらう必要があります。
- データ センターにオンサイトの担当者がいる場合は、フィールド エンジニアをオンサイトに派遣し、DD側とパッチ パネルまたはスイッチ側の両方からSFPまたはケーブルを取り付け直します。
- Data Domainで新しいインターフェイスを構成したが起動できない場合は、パッチ パネルまたはスイッチ側にケーブルが接続されていることを確認します。
- Data Domainを初めてセットアップして、インターフェイスが起動しない場合は、速度設定に加えて、スイッチ側のポート設定が正しいことを確認します。
- Data Domainで10gインターフェイスを構成する場合は、そのスイッチも10gの速度に設定する必要があります。
- Data Domainで1gの速度を構成する場合、そのスイッチが10gに設定されていると機能しません。これは、スイッチのオートネゴシエーションにより適している可能性があります。
- ファイバーまたはDA銅線インターフェイスを使用して初めてData Domainをセットアップする場合は、互換性のあるSFPとケーブルを使用していることを確認します。
- 再起動またはシステム アップグレード後に、最新アラートで「MissingSlave」と報告され、インターフェイスがダウンしている場合は、Data Domainを再起動します。
例p0-96 Tue Oct 24 16:47:52 2023 CRITICAL Network MissingSlave=veth0_eth1a EVT-NETM-00012: Network interface eth1a is missing. This is a physical interface for veth0.
- この問題は、特定のコンポーネントとレイヤーが正しくない順序でオンラインになったことによる競合状態が原因で発生したハードウェア障害または誤ったアラートのいずれかです。
- 2回目の再起動後に、「MissingSlave」アラートがクリアされず、インターフェイスがまだダウンしている場合は、Data Domainハードウェア サポートにケースを開きます。
- 取り付けられているネットワーク カードのタイプについて出力を取得するには、次のコマンドを実行します。
# system show hardware # enclosure show io-cards
- 過去のAutosupportを表示して現在のステータスと比較するには、UIにログインし、[Maintenance] > [Support] > [Autosupport reports]に移動します。
過去14件のAutosupportが表示され、ダウンロードしてNotepad ++で開くことができます。 - 再起動やアップグレードからではなく、インターフェイスが突然ダウンした場合は、ケーブルまたはSFPの不良である可能性もあります。
メモ: Dellハードウェア サポートは、お客様のパッチ パネル/スイッチ側のケーブルとSFPは交換しません。データ センター側のケーブルとSFPを交換するのは、お客様のデータ センターの責任です。
- データ センター担当者に連絡して、ケーブルまたはSFPを取り付け直してもらいます。
- 取り付け直してもリンク ライトが点灯しない場合は、データ センターにスイッチ側のケーブルとファイバーSFPを交換してもらいます。
- ケーブルとファイバーSFPを交換する場合は、データ センターにパッチ パネルまたはスイッチ側のポートを確認してもらい、別のポートを試してみます。
- すべての手順に従っても起動しない場合は、Dellハードウェア ケースを開いてDD側のSFPを交換してもらいます。
- ダウンしているインターフェイスが仮想ボンドの一部である場合のトラブルシューティング手順:
- アップグレードまたは再起動後にインターフェイスが起動しなかった場合は、ネットワーク チームにスイッチ ポート側を確認してもらい、無効化と有効化を試みます。
- ネットワーク チームがスイッチ ポートを確認し、ポートを無効にして有効にしたら、Data Domain側も試すことができます。
- Data Domain側では、次のコマンドを使用して仮想ボンドを無効化し、再度有効にすることができます。
# net disable vethXx # net enable vethXx
- インターフェイスをボンドから削除してから、ボンドに追加し直すことができます。これは、UIまたはコマンド ラインによって実行できます。
#net aggregate del vethX interface ethXx #net aggregate add vethX interface ethXx
#net failover del vethX interfaces ethXx #net failover add vethX interfaces ethXx
- インターフェイスを削除して追加しても問題が解決しない場合は、仮想ボンドを破棄してから再作成してみてください。
メモ: ボンド全体を破棄する場合は、常に冗長性を確保し、ボンド以外の別の接続にSSHで接続する必要があります。これは、UIから簡単に実行できます。
仮想ボンドの破棄に不安があり、それがData Domainへの唯一の接続である場合は、続行しないでください。
「Data Domain - GUI(グラフィカル ユーザー インターフェイス)を使用した物理インターフェイスの構成」 - 仮想ボンドを破棄して再作成してもインターフェイスが起動しなかった場合は、再度破棄してIPアドレスをインターフェイスに割り当てます。
インターフェイスにIPアドレスを割り当てた後に起動した場合は、スイッチ側が正しく構成されていない可能性が高く、これはData Domainサポートの範囲外であるため、ネットワーク チームに連絡してください。 - インターフェイスがまだダウンしている場合のトラブルシューティング手順:
- データ センター担当者に連絡して、ケーブルまたはSFPを取り付け直してもらいます。
- 取り付け直してもリンク ライトが点灯しない場合は、データ センターにスイッチ側のケーブルとファイバーSFPを交換してもらいます。
- ケーブルとファイバーSFPを交換する場合は、データ センターにパッチ パネルまたはスイッチ側のポートを確認してもらい、別のポートを試してみます。
- すべての手順に従っても起動しない場合は、Dellハードウェア ケースを開いてDD側のSFPを交換してもらいます。
メモ: Dellハードウェア サポートは、お客様のパッチ パネル/スイッチ側のケーブルとSFPは交換しません。データ センター側のケーブルとSFPを交換するのは、お客様のデータ センターの責任です。
- データ センターにオンサイトのフィールド担当者がいる場合は、フィールド担当者により解決する場合のトラブルシューティング手順を次に示します。
- ケーブルがData Domain側にしっかりと接続され、スイッチ ポートまたはパッチ パネル ポート側にも接続されていることを確認します。
- 可能であれば、ケーブルを追跡して、Data Domainの背面にある正しいポートに接続されていることを確認します。
- スイッチ ポートまたはパッチ パネル ポートにリンク ライトがあるかどうかを確認します。
- Data Domainポートのリンク ライトが点灯していない場合は、ケーブルを抜き差しします。
- パッチ パネル ポートまたはスイッチ ポートの背面にあるリンク ライトが点灯していない場合は、ケーブルを抜き差しします。
- Data Domain側とパッチ パネル ポートまたはスイッチ ポート側で抜き差しした後にリンク ライトが点灯しない場合は、ケーブルを交換します。
- フィールド担当者がオンサイトにいる場合は、動作確認済みのインターフェイス ケーブルをData Domain上でダウンしているインターフェイス ポートで交換するように指示することもできます。
フィールド担当者が交換した後、リンク ライトが点灯し、Data Domainで「net show hard」に「link/yes」と表示されるはずです。# net show hardware
- 交換後にリンク ライトが点灯した場合、問題はData Domain側のSFPの不良、ケーブルの不良、スイッチ側のSFPの不良、またはパッチ パネル スイッチ側のポートの不良が原因です。
- データ センター担当者向けのもう1つのトラブルシューティング手順として、ループバック テストを実行します。
- Data Domain上に同じタイプの未設定の空きインターフェイスがある場合は、そのインターフェイスから別のインターフェイスにループします。
例えば、eth1aが銅線で、eth4aも銅線であるが使用されていない場合は、eth1aをeth4aに接続します。
eth4aはダミーのIPアドレスで構成する必要があり、次のような任意のIPアドレスを入力できます。# net config eth4a 1.2.3.4 netmask 255.255.255.0
ループバック テストが終了したら、ダミーIPの設定をクリアします。# net config eth4a 0.0.0.0
- ループバック テストが機能せず、SFPまたはケーブル、またはその両方が交換されている場合は、Data Domainハードウェア サポート チームにケースを作成します。
- Data Domain上に同じタイプの未設定の空きインターフェイスがある場合は、そのインターフェイスから別のインターフェイスにループします。
- ケーブルがData Domain側にしっかりと接続され、スイッチ ポートまたはパッチ パネル ポート側にも接続されていることを確認します。
-
物理ファイバー インターフェイスと直接接続銅線インターフェイスのトラブルシューティングを行います。
次の例では、出力が異なる場合があります。
物理ファイバー インターフェイスの出力例:sysadmin@dd3300-ddsupport# net show hardware Port Speed Duplex Supp Speeds Hardware Address Physical Link Status State Autonegotiation ----- -------- ------- ----------- ----------------- -------- ----------- ------- --------------- eth1b unknown unknown 1000/10000 00:0c:29:46:fc:1b Fiber no up on ----- -------- ------- ----------- ----------------- -------- ----------- ------- ---------------
物理DA銅線インターフェイスの出力例:sysadmin@ddsupport# net show hardware Net Show Hardware ----------------- Port Speed Duplex Supp Speeds Hardware Address Physical Link Status ----- ------- ------- ----------- ----------------- --------- ----------- ------- eth8a unknown unknown 25000 34:80:0d:94:70:52 DA Copper no up ----- ------- ------- ----------- ----------------- --------- ----------- -------
ほとんどのお客様の環境では、ファイバー インターフェイスには、Data Domain側のSFP、光ケーブル、およびお客様のパッチ パネルまたはスイッチ側のSFPを含む、3つのコンポーネントがあります。
ただし、お客様の中には、Data Domainをパッチ パネルに接続し、ブレイクアウト ケーブルを使用して、他の接続を持つQSFPに接続している場合もあります。
場合によっては、Data Domainからパッチ パネルまたはスイッチ側への問題ではなく、その後の他のコンポーネントや接続がインターフェイスに影響を与える可能性があるため、お客様の接続について問い合わせる必要があります。 -
アップグレード後に、インターフェイスに速度の不一致があることを示すアラートが生成された場合は、次の情報を確認します。
例
Id Post Time Severity Class Object Message ------ ------------------------ -------- ------- ----------------------------- -------------------------------------------------------------------------------- p0-618 Tue Oct 20 09:50:53 2023 CRITICAL Network Bonded Interface Name=veth1 EVT-NETM-00015: One or more interfaces in the bonded group has a speed mismatch. ------ ------------------------ -------- ------- ----------------------------- --------------------------------------------------------------------------------
これは、ボンド内の1つのインターフェイスの速度が100mbsに設定され、別のインターフェイスが1000mbsに設定されていることを意味します。
これは、Data Domainとは何の関係もないいくつかの理由で発生する可能性があります。- Ethernetケーブルの障害
- パッチ パネルまたはスイッチ側のポートの障害
- スイッチ ポートの構成による速度制限
- スイッチ速度の制限
- 仮想ボンド内のインターフェイスが正しいインターフェイスでない
- インターフェイスが間違ったスイッチまたはスイッチ ポートに接続されている
以下に、追加のトラブルシューティング手順を示します。
これらの手順は、UIを使用して実行することもできます。
「Data Domain - GUI(グラフィカル ユーザー インターフェイス)を使用した物理インターフェイスの構成」- Data Domain上のハードウェア インターフェイスのステータスを確認するには、次のコマンドを実行します。
# net show hardware
- 現在のアラートを確認するには、次のコマンドを実行します。
# alerts show current
- 「net show settings」をチェックして、ダウンしているインターフェイスが仮想VLANまたはエイリアスの一部であるかどうかを確認します。
# net show settings
- DDOSのアップグレード後にインターフェイスがダウンした場合、ハードウェア障害が原因である可能性は非常に低くなります。
- Data Domain上のハードウェア インターフェイスのステータスを確認するには、次のコマンドを実行します。
# net disable ethXx # net enable ethXx
- 以前にインターフェイスが一致していなかった可能性はありますが、アラートはアップグレードまたは再起動後にのみ表示されるため、履歴を確認できます。
# alerts show history
- スイッチ構成についてネットワーク チームに確認し、スイッチ速度を再設定するか、オートネゴシエーションを再構成します。
- スイッチ ポートを無効にして有効にします。
- LACPが使用されている場合は、AutosupportのLLDP情報を確認して、LACPボンドに正しいインターフェイスがあるかどうかを確認します。
- ボンドからインターフェイスを削除します。
# net failover del vethX interfaces ethXx
- ダミーのIPアドレスを使用してインターフェイスを設定します。
# net config ethXx 1.2.3.4 netmask 255.255.255.0
- 手動で速度を変更してみます。
メモ: インターフェイスとData Domainのモデルによっては、速度を設定できません。
#net config ethXx duplex full speed 1000
- 前述の手順を実行してダミーIPをクリアしたら、次のコマンドを実行します。
#net config ethXx 0.0.0.0
- ボンドに追加し直します。
# net failover add vethX interfaces ethXx
- それでも問題が解決しない場合は、ケーブルを交換してスイッチ側をもう一度確認することをお勧めします。
システム上の物理インターフェイスがダウンすることがある理由のリスト:
ハードウェアの問題からネットワークの問題に至るまで、さまざまな理由により、システム上の物理インターフェイスがダウンすることがあります。一般的な理由のリストを次に示します。
- 物理的なケーブルの切断:インターフェイスをネットワークまたは別のデバイスに接続しているケーブルが物理的に切断されたことにより、インターフェイスがダウンする可能性があります。
- 間違ったインターフェイス:ケーブルがData Domain側で間違ったインターフェイスに接続されています。
- 間違ったインターフェイス:ケーブルがパッチ パネルとスイッチ側で間違ったインターフェイスに接続されています。
- ハードウェアの障害:ネットワーク インターフェイス カード(NIC)、スイッチ、ルーター、ケーブルなどのハードウェア コンポーネントに障害が発生すると、インターフェイスのダウンタイムが発生する可能性があります。
- 電源の問題:ネットワーク機器に対する電源の変動、アウテージ、または不十分な電力供給が原因で、インターフェイスがダウンする可能性があります。
- オーバーヒート:過度の熱によってハードウェア コンポーネントが損傷し、インターフェイスの障害やシステムのシャットダウンが発生する可能性があります。
- ネットワーク輻輳:高レベルのネットワーク トラフィックまたは輻輳がインターフェイスを圧倒し、インターフェイスが応答しなくなったりダウンしたりする可能性があります。
- ソフトウェア エラー:デバイス ドライバー、ファームウェア、オペレーティング システム内の問題、不具合、または非互換性の問題により、インターフェイスの障害が生じる可能性があります。
- 構成エラー:IPアドレスの競合や誤ったサブネット マスクなど、ネットワーク構成が正しくないと、インターフェイスにアクセスできなくなる可能性があります。
- セキュリティ対策:侵入検出やファイアウォール ルールなどのセキュリティ ポリシーは、インターフェイスを介してトラフィックを誤ってブロックまたは制限する可能性があります。
- 物理的な損傷:浸水、衝撃、摩耗や損傷などのハードウェアへの物理的な損傷は、インターフェイスの障害につながる可能性があります。
- 環境的要因:極端な温度、湿度、ほこり、その他の環境要因は、ハードウェアの機能に影響を与え、インターフェイスがダウンする可能性があります。
- ファームウェア/ソフトウェアのアップデート:ファームウェアまたはソフトウェアのアップデートが正しく適用されていないと、不安定になり、インターフェイスの障害が発生する可能性があります。
- ネットワーク攻撃:サービス妨害(Dos)攻撃、分散型サービス妨害(DDoS)攻撃、またはその他の悪意のあるアクティビティによって、インターフェイスが過負荷になり、障害が発生する可能性があります。
- ルーティングの問題:ルーティング テーブルのエントリーが正しくないか、動的ルーティング プロトコルの問題により、インターフェイスを介した接続が中断される可能性があります。
- 物理的なインターフェイス構成:速度とデュプレックスの設定が正しくない、オートネゴシエーションの問題、接続されているデバイス間の構成が一致しない場合、インターフェイスのダウンタイムが発生する可能性があります。
- ケーブルの品質:品質の低いケーブルや損傷したケーブルにより、断続的な接続や完全なインターフェイス障害が発生する可能性があります。
- スイッチまたはルーターの障害:インターフェイスに接続するスイッチやルーターなどのネットワーキング機器で障害が発生すると、ダウンストリーム インターフェイスの問題が発生する可能性があります。
- ネットワーク プロバイダーの問題:システムが外部ネットワーク プロバイダーに接続している場合、その側の問題(メンテナンス、アウテージ、構成エラー)が原因でインターフェイスがダウンする可能性があります。
- リソースの枯渇:システム内のメモリーまたは処理能力が不足すると、特にトラフィックの多いシナリオでインターフェイス障害が発生する可能性があります。
- 物理ポートの無効化:管理者、ネットワーク管理システム、セキュリティ ポリシーによって物理ポートを無効にする手動または自動によるアクション。
- ファイバ オプティックス信号の損失:ファイバ オプティックスの接続では、曲がり、汚れ、破損による信号損失などの問題により、インターフェイスがダウンする可能性があります。
「Data Domain - GUI(グラフィカル ユーザー インターフェイス)を使用した物理インターフェイスの構成」
「Data Domain :コマンド ライン インターフェイス(CLI)を使用した物理インターフェイスの構成」
Additional Information
次のビデオを参照してください。
Data Domainネットワーク インターフェイスのトラブルシューティング
再生時間:00:03:07 (hh:mm:ss)
利用可能な場合、このビデオ プレーヤーのCCアイコンを使用してクローズド キャプション(字幕)の言語設定を選択できます。
このビデオはYouTubeでも視聴できます。