PowerFlex ESXi Dell PERC H730またはH730P RAIDコントローラーの問題
Zusammenfassung: PowerFlexディスク デバイスでランダムに障害が発生しているか、ディスク デバイスのエラーが報告されています。ESXiは、ディスク デバイスのエラーとLSI RAIDコントローラー エラー(SCSIの中止およびリセット コマンド)を報告します。
Dieser Artikel gilt für
Dieser Artikel gilt nicht für
Dieser Artikel ist nicht an ein bestimmtes Produkt gebunden.
In diesem Artikel werden nicht alle Produktversionen aufgeführt.
Symptome
シナリオ:
ESXi 5.5または6.0のみが影響を受けます。
ScaleIOシステムがディスク デバイス エラーを報告しており、ディスク デバイスでランダムに障害が発生しています。ディスク デバイスが「オンライン」に戻ると、システムは次のディスク デバイスに障害が発生するまで、期待どおりに動作し続けます。
Data unavailability might occur when disk devices fail on different SDSs.
現象:
ScaleIOシステム イベント レポート データの縮退:
2016-01-22 17:28:35.213 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state.
ScaleIOシステム イベントは、ディスク デバイスのエラーまたは障害を報告します。
799 2016-01-22 17:28:39.818 SDS_DEV_ERROR_REPORT ERROR Device error reported on SDS: 10.3.1.21, Device: /dev/sdb. State: NORMAL upDownState: UP processState: DEV_ERR_INPROGRESS devErrState: REPORT
VMkernelログの例:
2016-01-2613:48:09.254 2016-01-26T13:50:35.576Z esxi-vcd-compute-03 vmkernel: cpu11:301656)VSCSI: 2590: handle 8194(vscsi0:0):Reset request on FSS handle 279624493 (0 outstanding commands) from (vmm0:scsi-test-4) 2016-01-2613:48:09.254 2016-01-26T13:50:35.576Z esxi-vcd-compute-03 vmkernel: cpu11:32946)VSCSI: 2868: handle 8194(vscsi0:0):Reset [Retries: 0/0]from (vmm0:scsi-test-4) 2016-01-2613:48:09.255 2016-01-26T13:50:35.576Z esxi-vcd-compute-03 vmkernel: cpu11:32946)lsi_mr3: mfi_TaskMgmt:254: Processing taskMgmt virt reset for device: vmhba0:C2:T0:L0 2016-01-2613:48:09.255 2016-01-26T13:50:35.576Z esxi-vcd-compute-03 vmkernel: cpu11:32946)lsi_mr3: mfi_TaskMgmt:258: VIRT_RESET cmd # 2514475 2016-01-2613:48:09.255 2016-01-26T13:50:35.576Z esxi-vcd-compute-03 vmkernel: cpu11:32946)lsi_mr3: mfi_TaskMgmt:262: ABORT
VMkernelログの例:
2015-09-04T14:05:58.860Z cpu20:32859)lsi_mr3: mfi_TaskMgmt:254: Processing taskMgmt virt reset for device: vmhba0:C2:T0:L0 2015-09-04T14:05:58.860Z cpu20:32859)lsi_mr3: mfi_TaskMgmt:258: VIRT_RESET cmd # 28267605 2015-09-04T14:05:58.860Z cpu20:32859)lsi_mr3: mfi_TaskMgmt:262: ABORT 2015-09-04T14:05:58.864Z cpu8:33188)lsi_mr3: fusionWaitForOutstanding:2516: megasas: [ 0]waiting for 1 commands to complete
SCSI中止コマンドは、SVMのメッセージ ファイルに表示されます。
Sep 2 21:35:09 ScaleIO-10-100-7-66 kernel: [28986.521362] sd 5:0:15:0: [sdw] task abort on host 5, ffff880095a00d80 Sep 2 21:35:09 ScaleIO-10-100-7-66 kernel: [28986.782459] sd 4:0:4:0: [sdg] task abort on host 4, ffff8800959d65c0 Sep 2 21:35:09 ScaleIO-10-100-7-66 kernel: [28986.782466] sd 4:0:4:0: [sdg] Failed to abort cmd ffff8800959d65c0
影響:
- ディスク デバイスでランダムに障害が発生し、再構築と再バランシングが発生し、システム パフォーマンスに影響を及ぼしています。
- データ使用不可が発生する場合があります。
- ディスク デバイスに問題があり、ディスク デバイスが何らかの理由で応答しない場合、SVM/OSはディスク デバイスをオフラインにします。
Ursache
ドライバーまたはファームウェアの問題
VMwareは、Dell PERC H730コントローラーの既知の問題を認識しています。
Lösung
回避策:
Dellでは、(問題発生時)最新のファームウェアまたはドライバーにアップグレードすることをお勧めします。
障害が発生したディスク デバイスを「オンライン」にするには、次の記事「PowerFlexがSDSデバイス エラーをクリアできない - デバイスの状態がOSレベルでオフラインである(英語)」を参照してください。
Betroffene Produkte
PowerFlex rack, ScaleIOArtikeleigenschaften
Artikelnummer: 000283423
Artikeltyp: Solution
Zuletzt geändert: 06 März 2025
Version: 3
Antworten auf Ihre Fragen erhalten Sie von anderen Dell NutzerInnen
Support Services
Prüfen Sie, ob Ihr Gerät durch Support Services abgedeckt ist.