「PowerEdge:ファンの異音の一般的な原因を特定してトラブルシューティングする方法
概要: この記事では、PowerEdgeサーバーで発生するファンの異音の一般的な原因と、それらをトラブルシューティングする方法について説明します。 また、100%のファン速度にも関係します。
手順
PowerEdgeサーバーで発生するファンの異音の一般的な原因
- ファンの障害、ファンの欠落、ファンの損傷
- ファームウェアが古い
- Integrated Dell Remote Access Controller (iDRAC)、Baseboard Management Chip (BMC)、またはChassis Management Controller (CMC、MXシャーシの場合はOME-M)との通信の中断
- サポートされていないハードウェアがインストールされている
- 不完全な2番目のCPUアップグレード(システム タイプに依存)または異なるタイプのファンを取り付ける必要があるマシンへの一般的なアップグレード
- 温度が通常のファン速度の範囲を超えている(高負荷のワークロードにより、CPU使用率と温度が高くなり、エアフローが悪くなる)
- システム カバーが外れているか、正しく取り付けられていないイントルージョン スイッチがトリガーされたか、機能していない可能性がある
- 構成設定
- 吸気温度センサーが故障し、誤った出力をする
ファンの障害、ファンの欠落、ファンの損傷
このシナリオでは、少なくとも1つのファンまたはファン アセンブリー(2つのファンを含む)が損傷しているか(コネクター、ファン ブレード、ファン ブレード フレーム)、欠落しているか、故障しています。
問題の原因となっているファン アセンブリーまたはファンを特定するには、次の手順を順番に実行します。
- 前面LCDまたはシステム イベント ログを確認して、どのファンが報告されているかを確認します。
- 障害が報告されたファンを特定したら、ふたのファン番号の位置を確認し(または サーバーのユーザー ガイドを参照して)、ファンが動作しているかどうかを確認します。
注意:電源を切らずにサーバーのカバーを開けるため、ファンを確認するときは注意してください。内側の素子は、高温または鋭利であるか、またはその両方である可能性があります。
- ファンの回転が遅い、まったく回転しない、または不規則な異音が発生する(引っかくような音、こすれる音)がある場合は、マシンの電源を切り、ファン アセンブリーを取り外して検査します。
- ファンを引っかいたり擦ったりすると、目に見える傷が残ります。
- ごみやほこりが原因でファンの動作が不規則になることがあります。この場合は、ファンを掃除すると役立つ場合があります。
- マザーボードまたはファン コントローラー基板のコネクターと、ファンのコネクターのいずれにも損傷がないかを確認します。
- ファンの損傷や接続の問題がない場合は、ファン、エアフロー カバー(ある場合)、シャーシ カバーを取り付け直し、マシンの電源を入れ直します。
それでもファンの障害が報告される場合は、このリストで次の可能性を確認してください。
ビデオ
PowerEdgeファンの問題を特定します。
再生時間:00:00:00 (hh:02:31)
利用可能な場合は、このビデオ プレーヤーのCCアイコンを使用してクローズド キャプション(字幕)の言語設定を選択できます。
PowerEdge R740のファンを交換する方法
再生時間:00:00:53 (hh:mm:ss)
利用可能な場合、このビデオ プレーヤーのCCアイコンを使用してクローズド キャプション(字幕)の言語設定を選択できます。
ファームウェアが古い
ファームウェアが古いと、他に問題がなくてもファンが高速で回転する(異音が発生する)ことがあります。これは、ファームウェアの一部がアップデートされ、一連のセンサー データ収集で一部の要素がアップデートされなかった場合によく発生します。
以下に、調査の次のステップとして、アップデートを確認する必要があるファームウェア バージョンを示します。
- iDRAC、CPLD、BIOS
- PERC、BOSS、バックプレーン、NVMeドライブ、SAS/SATAドライブ
- NIC、その他のPCIeカード
- 電源装置(PSU)
- その他のハードウェア
iDRACを使用してファームウェアをアップデートする場合( この記事では、PowerEdge: iDRAC Webインターフェイスを使用してファームウェアをリモートでアップデートする方法)では、インポートされた左から右、上から下の順にアップデートが一覧表示されます。
各リスト項目は、更新を一度に更新できるガイドとして使用する必要があります (ただし、最初の項目ではありません)。
ファームウェアが最新になったら、リストの次の項目に進みます。
ビデオ
iDRAC9を使用してファームウェアをアップデートする方法。
再生時間:00:01:16 (hh:mm:ss)
利用可能な場合、このビデオ プレーヤーのCCアイコンを使用してクローズド キャプション(字幕)の言語設定を選択できます。
Integrated Dell Remote Access Controller (iDRAC)、Baseboard Management Chip (BMC)、またはChassis Management Controller (CMC、MXシャーシの場合はOME-M)との通信の中断
iDRAC、BMC、CMC/OME-Mがセンサー スイートへの接続を失うと、ファンは管理対象外の速度(フル)に戻り、システムが過熱しないように保護します。
そのため、最初に電源を入れたときに、ファンが回転を始め、速度を下げる音が聞こえます。iDRAC、BMC、またはCMC/OME-Mが起動して、ファン速度の調整を開始するまでには数分かかります。
LCD(ある場合)にテキストは表示されません。システム タイプがモジュラー型の場合は、CMCと通信できないため、シャーシで電源が入らない場合があります。
その場合は、サポート チームにお問い合わせください。
この問題をトラブルシューティングするには、次の手順を実行します。
- すべてのiDRACシステムで、i - ボタンを16秒間押し続けます。
- BMCを搭載したシステムの場合、または手順1が機能しない場合は、次の手順を実行します。
- サーバーの電源を切ります
- そこから電源ケーブルを取り外します。
- 電源ボタンを10秒間押し続けます。
- 電源ケーブルを再度接続します。
- 約2分間待ちます。
- サーバーを再起動します。
- CMCまたはOME-Mを搭載したシステムの場合:
- CMCまたはOME-Mが2台取り付けられている場合は、フェールオーバー手順に従って、他のユニットにフェールオーバーします。
- CMCまたはOME-Mが1台しか取り付けられていない場合は、シャーシからモジュールを取り外し、2分間待ってから、モジュールを再度挿入し、20分間待ちます。
- モジュールの抜き差しまたはフェールオーバーが機能しない場合は、完全な再初期化のためにシャーシの再起動が必要です。
- 稼働中のシャーシに依存するすべてのサーバーと接続されているデバイスのダウンタイムをスケジュールします。
- サーバーの電源をオフにしてから、シャーシの電源をオフにします。
- 電源ケーブルを取り外します。
- 10分以上待つか、電源ボタン(ある場合)を押したままにします。
- 電源ケーブルを再度接続します。
- シャーシの電源を入れ直し、20~30分待ちます。
- サーバーを再起動します。
- エラーやファンの異音なくすべてが稼働したら、外部からシャーシに再接続します。
それでも同じファンの異音が聞こえる場合は、リストの確認を続行します。
ビデオ
「PowerEdge:センサー スイートへの接続切断が原因で発生するファンの問題
再生時間:00:02:53 (hh:mm:ss)
利用可能な場合、このビデオ プレーヤーのCCアイコンを使用してクローズド キャプション(字幕)の言語設定を選択できます。
サポートされていないハードウェアがインストールされている
サポートされていないハードウェアや認定されていないサード ベンダーのハードウェアを使用すると、システムのファンが通常よりも速く、または最高速度で作動する可能性があります。
この問題をトラブルシューティングするには、次の手順を実行します。
- デバイスが作動しているかどうかを確認します。
- デバイスが適切なタイプのスロット(該当する場合)に正しく取り付けられていることを確認します。
- iDRACは、特定のデバイスに対して、または不明な場合はデフォルトとして、ファンを回転させる可能性があります。
- 続行するには、サード パーティー製デバイスを取り外し、ファンの異音が正常に戻るかどうかを確認します。
- これが有効である場合は、サード パーティー ベンダーに問い合わせて、軽減策があるかどうか、またはDell PowerEdgeサーバーでのデバイスの使用に関する推奨事項があるかどうかを確認してください。
この時点までリストに従っていて、さらにサポートが必要な場合は、さらに下までリストに従ってください。
ビデオ
サポートされていないハードウェアが原因で過剰なファンの異音が発生します。
再生時間:00:00:38 (hh:mm:ss)
利用可能な場合、このビデオ プレーヤーのCCアイコンを使用してクローズド キャプション(字幕)の言語設定を選択できます。
不完全な2番目のCPUアップグレード(システム タイプに依存)または異なるタイプのファンを取り付ける必要があるマシンへの一般的なアップグレード
システムをアップグレードした場合、またはシステムをアップグレードする場合、一部のアップグレードでは、追加のパーツ(ファン、メモリーDIMM)または異なるタイプのファン(標準ファンからシルバー ファンまたはゴールド ファンへのアップグレード)が必要になります
これらのアップグレードは次のとおりです(完全なリストではありません。セールス担当者にお問い合わせください)。
- 1つのCPUを搭載して購入でき、2つのCPUを搭載できるシステムの2番目のCPUアップグレード(システム タイプによって異なります)
- これには、ダミーの取り外し、同じステッピングを持つ追加のCPU、追加のメモリー、そして多くの場合、1台の追加のファンが必要になる可能性があります。
- 一部のシステムでは、すべてのファンを標準ファンからシルバー ファン、またはゴールド ファンにアップグレードする必要がある場合もあります(システムおよびアップグレード固有の要件)。
- GPUまたはGPGPUをサポートするシステムでそれをアップグレードする場合
- これには、追加のライザーとサポート ケーブルが必要になる可能性があります。また、元のレイアウトとすでに取り付けられているファンによっては、追加の冷却も必要になります。
- 追加のPCIeカードまたはNVMeドライブ
- これには、冷却要件に応じてファンを追加したり、より強力なファンの種類が必要になったりすることがあるため、新しいパーツを取り付けた後、冷却要件に沿っていることをさらに確認する必要があります。
これらに従った後、問題がないことが確実な場合は、続けてリストに従ってください。
ビデオ
アップグレードされたPowerEdgeサーバーの冷却
再生時間:00:01:49 (hh:mm:ss)
利用可能な場合は、このビデオ プレーヤーのCCアイコンを使用してクローズド キャプション(字幕)の言語設定を選択できます。
温度が通常のファン速度の範囲を超えている(高負荷のワークロードにより、CPU使用率と温度が高くなり、エアフローが悪くなる)
システムにCPUの負荷がかかり、他のパーツにも同様に負荷がかかる場合、より多くの電力を使用するため、通常よりも冷却要件が高くなります
また、換気の良い場所や、一般的にほこりの蓄積と見なされる障害物によって空気の流れが制限される場合、時間の経過とともにファン速度が上昇する可能性もあります
次の手順を確認して、存在する問題と、問題を軽減または解消するために実行できる手順を確認します。
- CPU使用率が常に高負荷(90-100%)下にあるかどうかを確認します。
- その場合は、その理由と、それが予期される動作であるかどうかを確認することをお勧めします(それは通常のワークロードが原因ですか、それともオペレーティング システム(OS)の最近のアップデートまたはアップグレード後に発生し始めた場合など、不明な原因ですか)。
- その動作が通常どおりでない場合は、どのアプリケーションまたはサービスが高い負荷を引き起こしているかを確認して、その負荷をさらに調査します。
- 一見正常な操作が原因でこの動作が発生し、マシンのソフトウェアに最近アップデート(または意図的または意図せずに再起動)が行われていない場合は、マシンが設計による限界に達し、ワークロードがそれを実行しているハードウェアを超えている可能性があります。特に、同じようなワークロード タイプを実行する同じような負荷がかかった複数のシステムで、同じ問題が発生している場合は、セールス担当者に相談して、拡張やアップグレードの観点からこの問題への対応策について確認してください。
- 通気口が塞がれたり制限されたりしていないか、またはファン自体が何らかの方法で塞がれたり制限されたりしていないかを確認します。
- 時間の経過によるほこりの蓄積はよくあります。100%ほこりのない環境は、状況によっては非現実的で維持するのが難しい場合があります。そのため、マシンを物理的に清掃し、通気を確保する定期的なメンテナンスは必須であり、少なくとも毎年1回は実施されるすべてのメンテナンス スケジュールに組み込む必要があります(マシンがほこりの多い環境にある場合は、より頻繁に)。
- 通気口やファンがふさがれていることに気付いた場合は、マシンのメンテナンスをスケジュールし、ほこりや障害物をすべて取り除きます。詳細については、「Dell Technologiesの機器を清潔に保つためのガイダンス」を参照してください。
これに従った後に同じ問題が発生した場合は、さらにリストを確認します。
ビデオ
「PowerEdge:温度が通常のファン速度範囲を超えています。
再生時間:00:02:36 (hh:mm:ss)
利用可能な場合、このビデオ プレーヤーのCCアイコンを使用してクローズド キャプション(字幕)の言語設定を選択できます。
システム カバーが外れているか、正しく取り付けられていないイントルージョン スイッチがトリガーされたか、機能していない可能性がある
一部のシステムでは、システム カバーを閉じて、イントルージョン スイッチを閉じた状態(押した状態)にする必要があります。カバーが取り付けられておらず、イントルージョン スイッチがトリガーされた場合は、予防措置としてファン速度が最大に上昇します。
これは、これらのシステムのイントルージョン スイッチに障害が発生した場合にも発生することがあります。壊れたスイッチは常に開いており、この場合は常にトリガーされ、システム カバーが開いていることを示します
次の点を確認します。
- システム カバーを取り外し、再度取り付け直して、正しく収まっていることを確認します。
- これは、ラックの外部で使用可能な電源を備えたテスト ベンチまたはワーク ベンチでテストして、安全な環境を確保すると便利です。
- また、システム カバーの取り付け状況や、イントルージョン スイッチやスイッチ自体の破損がどうなっているかも、よりわかりやすくなります。
- スイッチが正しく取り付けられているかどうか、および押し戻した時にトリガーされ、押すと無効になるかどうかを確認します。
- イントルージョン スイッチがトリガーされると、システム イベント ログにエントリーが生成されます(システムのiDRACで確認できます)。
- システム カバーを正しく閉じて、装着状態を点検し、すべてのパーツが正しく取り付けられていることを確認します。
この後もさらにサポートが必要な場合は、リストの別のトピックを参照してください。
ビデオ
PowerEdge R750のイントルージョン スイッチを交換する方法。
再生時間:00:01:28 (hh:mm:ss)
利用可能な場合、このビデオ プレーヤーのCCアイコンを使用してクローズド キャプション(字幕)の言語設定を選択できます。
構成設定
iDRACはマシンの温度設定を制御し、すべてのパーツが正しく冷却されるようにします。これらの設定を手動で変更して、ファン速度のオフセットを増減したり、デフォルトの温度プロファイルを変更したりすることができます。また、デフォルトのプロファイルから変更すると、ファン速度が上がる場合があります。
使用されている設定が不明な場合は、次の手順を使用して設定をリセットできます。
- POST中にF2を押します。
- [System Services]を選択します。
- 右下隅にある[Defaults]を見つけて押します。
- [Exit]を選択します。
- プロンプトが表示されたら、[Save and Reboot]を選択します。
- 再起動したら、POST中にもう一度F2を押します。
- [iDRAC settings]>[Thermal]を選択します。
- 設定が設定または選択されておらず、プロファイルに デフォルトの温度プロファイル設定(最大パフォーマンス)が表示されていることを確認します。
- 終了して再起動します。
このパートを終えても解決策が見つからない場合は、上記のリストを確認することを検討してください。このリストを使い切った場合は、サポートログ ファイル[TSR](テクニカルサポートレポート)を収集し、サポートチームにお問い合わせください。
ビデオ
iDRAC温度プロファイルをリセットします。
再生時間:00:01:26 (hh:mm:ss)
利用可能な場合、このビデオ プレーヤーのCCアイコンを使用してクローズド キャプション(字幕)の言語設定を選択できます。
吸気温度センサーが故障し、誤った出力をする
iDRACのシステム イベント ログ(SEL)に、吸気温度に障害が発生したか、または読み出し値が予想どおり高い(測定時の環境温度がセンサー出力とあまり一致しない)ことを示す警告メッセージが表示される可能性があります。センサーはマシン前面の温度を測定し、iDRACは提供されたデータを使用して、それに基づいて必要な冷却を計算します。その結果、センサーに障害が発生したり、センサーが誤って測定されたりすると、ファン速度が速くなったり、最大化したりします。
この問題をトラブルシューティングするには、次の手順を実行します。
- SELで警告またはエラー メッセージを確認します。
- ファームウェア セクションで説明されているアクションを実行していない場合は、そのセクションに従って、情報が一致しない原因としてファームウェアを除外します。
- すべてのファームウェア アップデートが完了したら、SELを再度確認します。
- iDRAC Webインターフェイスで吸気温度を確認し、予想よりもまだ高いか、まったく読み取られていないかを確認します。
- 問題が解決しない場合は、 新しいTSRを収集し 、 サポートチームに連絡してください。
ここからリストに戻ることができます。