PowerFlex ESXi Dell PERC H730またはH730P RAIDコントローラーの問題

Zusammenfassung: PowerFlexディスク デバイスでランダムに障害が発生しているか、ディスク デバイスのエラーが報告されています。ESXiは、ディスク デバイスのエラーとLSI RAIDコントローラー エラー(SCSIの中止およびリセット コマンド)を報告します。

Dieser Artikel gilt für Dieser Artikel gilt nicht für Dieser Artikel ist nicht an ein bestimmtes Produkt gebunden. In diesem Artikel werden nicht alle Produktversionen aufgeführt.

Symptome

シナリオ:
ESXi 5.5または6.0のみが影響を受けます。
ScaleIOシステムがディスク デバイス エラーを報告しており、ディスク デバイスでランダムに障害が発生しています。ディスク デバイスが「オンライン」に戻ると、システムは次のディスク デバイスに障害が発生するまで、期待どおりに動作し続けます。

Data unavailability might occur when disk devices fail on different SDSs.

現象: 
ScaleIOシステム イベント レポート データの縮退:

2016-01-22 17:28:35.213 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state.

ScaleIOシステム イベントは、ディスク デバイスのエラーまたは障害を報告します。

799 2016-01-22 17:28:39.818 SDS_DEV_ERROR_REPORT ERROR Device error reported on SDS: 10.3.1.21, Device: /dev/sdb. State: NORMAL upDownState: UP processState: DEV_ERR_INPROGRESS devErrState: REPORT

VMkernelログの例:

2016-01-2613:48:09.254 2016-01-26T13:50:35.576Z esxi-vcd-compute-03 vmkernel: cpu11:301656)VSCSI: 2590: handle 8194(vscsi0:0):Reset request on FSS handle 279624493 (0 outstanding commands) from (vmm0:scsi-test-4)
2016-01-2613:48:09.254 2016-01-26T13:50:35.576Z esxi-vcd-compute-03 vmkernel: cpu11:32946)VSCSI: 2868: handle 8194(vscsi0:0):Reset [Retries: 0/0]from (vmm0:scsi-test-4)
2016-01-2613:48:09.255 2016-01-26T13:50:35.576Z esxi-vcd-compute-03 vmkernel: cpu11:32946)lsi_mr3: mfi_TaskMgmt:254: Processing taskMgmt virt reset for device: vmhba0:C2:T0:L0
2016-01-2613:48:09.255 2016-01-26T13:50:35.576Z esxi-vcd-compute-03 vmkernel: cpu11:32946)lsi_mr3: mfi_TaskMgmt:258: VIRT_RESET cmd # 2514475
2016-01-2613:48:09.255 2016-01-26T13:50:35.576Z esxi-vcd-compute-03 vmkernel: cpu11:32946)lsi_mr3: mfi_TaskMgmt:262: ABORT

VMkernelログの例:

2015-09-04T14:05:58.860Z cpu20:32859)lsi_mr3: mfi_TaskMgmt:254: Processing taskMgmt virt reset for device: vmhba0:C2:T0:L0
2015-09-04T14:05:58.860Z cpu20:32859)lsi_mr3: mfi_TaskMgmt:258: VIRT_RESET cmd # 28267605
2015-09-04T14:05:58.860Z cpu20:32859)lsi_mr3: mfi_TaskMgmt:262: ABORT
2015-09-04T14:05:58.864Z cpu8:33188)lsi_mr3: fusionWaitForOutstanding:2516: megasas: [ 0]waiting for 1 commands to complete

SCSI中止コマンドは、SVMのメッセージ ファイルに表示されます。

Sep 2 21:35:09 ScaleIO-10-100-7-66 kernel: [28986.521362] sd 5:0:15:0: [sdw] task abort on host 5, ffff880095a00d80
Sep 2 21:35:09 ScaleIO-10-100-7-66 kernel: [28986.782459] sd 4:0:4:0: [sdg] task abort on host 4, ffff8800959d65c0
Sep 2 21:35:09 ScaleIO-10-100-7-66 kernel: [28986.782466] sd 4:0:4:0: [sdg] Failed to abort cmd ffff8800959d65c0

影響:

  • ディスク デバイスでランダムに障害が発生し、再構築と再バランシングが発生し、システム パフォーマンスに影響を及ぼしています。
  • データ使用不可が発生する場合があります。 
  • ディスク デバイスに問題があり、ディスク デバイスが何らかの理由で応答しない場合、SVM/OSはディスク デバイスをオフラインにします。

Ursache

ドライバーまたはファームウェアの問題
VMwareは、Dell PERC H730コントローラーの既知の問題を認識しています。

Lösung

回避策:
Dellでは、(問題発生時)最新のファームウェアまたはドライバーにアップグレードすることをお勧めします。

障害が発生したディスク デバイスを「オンライン」にするには、次の記事「PowerFlexがSDSデバイス エラーをクリアできない - デバイスの状態がOSレベルでオフラインである(英語)」を参照してください。

Betroffene Produkte

PowerFlex rack, ScaleIO
Artikeleigenschaften
Artikelnummer: 000283423
Artikeltyp: Solution
Zuletzt geändert: 06 März 2025
Version:  3
Antworten auf Ihre Fragen erhalten Sie von anderen Dell NutzerInnen
Support Services
Prüfen Sie, ob Ihr Gerät durch Support Services abgedeckt ist.