PowerFlex ESXi Dell PERC H730 或 H730P RAID 控制器问题
Zusammenfassung: PowerFlex 磁盘设备随机出现故障或报告磁盘设备上的错误。ESXi 报告磁盘设备错误和 LSI RAID 控制器错误(SCSI 中止和重置命令)。
Dieser Artikel gilt für
Dieser Artikel gilt nicht für
Dieser Artikel ist nicht an ein bestimmtes Produkt gebunden.
In diesem Artikel werden nicht alle Produktversionen aufgeführt.
Symptome
场景:
只有 ESXI 5.5 或 6.0 会受到影响。
ScaleIO 系统报告磁盘设备错误,并且磁盘设备随机出现故障。磁盘设备重新“联机”后,系统将继续按预期工作,直至下一个磁盘设备发生故障。
Data unavailability might occur when disk devices fail on different SDSs.
症状:
ScaleIO 系统事件报告数据降级:
2016-01-22 17:28:35.213 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state.
ScaleIO 系统事件报告磁盘设备错误或故障:
799 2016-01-22 17:28:39.818 SDS_DEV_ERROR_REPORT ERROR Device error reported on SDS: 10.3.1.21, Device: /dev/sdb. State: NORMAL upDownState: UP processState: DEV_ERR_INPROGRESS devErrState: REPORT
VMkernel 日志示例:
2016-01-2613:48:09.254 2016-01-26T13:50:35.576Z esxi-vcd-compute-03 vmkernel: cpu11:301656)VSCSI: 2590: handle 8194(vscsi0:0):Reset request on FSS handle 279624493 (0 outstanding commands) from (vmm0:scsi-test-4) 2016-01-2613:48:09.254 2016-01-26T13:50:35.576Z esxi-vcd-compute-03 vmkernel: cpu11:32946)VSCSI: 2868: handle 8194(vscsi0:0):Reset [Retries: 0/0]from (vmm0:scsi-test-4) 2016-01-2613:48:09.255 2016-01-26T13:50:35.576Z esxi-vcd-compute-03 vmkernel: cpu11:32946)lsi_mr3: mfi_TaskMgmt:254: Processing taskMgmt virt reset for device: vmhba0:C2:T0:L0 2016-01-2613:48:09.255 2016-01-26T13:50:35.576Z esxi-vcd-compute-03 vmkernel: cpu11:32946)lsi_mr3: mfi_TaskMgmt:258: VIRT_RESET cmd # 2514475 2016-01-2613:48:09.255 2016-01-26T13:50:35.576Z esxi-vcd-compute-03 vmkernel: cpu11:32946)lsi_mr3: mfi_TaskMgmt:262: ABORT
VMkernel 日志示例:
2015-09-04T14:05:58.860Z cpu20:32859)lsi_mr3: mfi_TaskMgmt:254: Processing taskMgmt virt reset for device: vmhba0:C2:T0:L0 2015-09-04T14:05:58.860Z cpu20:32859)lsi_mr3: mfi_TaskMgmt:258: VIRT_RESET cmd # 28267605 2015-09-04T14:05:58.860Z cpu20:32859)lsi_mr3: mfi_TaskMgmt:262: ABORT 2015-09-04T14:05:58.864Z cpu8:33188)lsi_mr3: fusionWaitForOutstanding:2516: megasas: [ 0]waiting for 1 commands to complete
SCSI 中端命令显示在 SVM 上的消息文件中:
Sep 2 21:35:09 ScaleIO-10-100-7-66 kernel: [28986.521362] sd 5:0:15:0: [sdw] task abort on host 5, ffff880095a00d80 Sep 2 21:35:09 ScaleIO-10-100-7-66 kernel: [28986.782459] sd 4:0:4:0: [sdg] task abort on host 4, ffff8800959d65c0 Sep 2 21:35:09 ScaleIO-10-100-7-66 kernel: [28986.782466] sd 4:0:4:0: [sdg] Failed to abort cmd ffff8800959d65c0
影响:
- 磁盘设备随机发生故障,导致重建和重新平衡,并影响系统性能。
- 可能会出现数据不可用的情况。
- 当磁盘设备出现问题并且磁盘设备由于任何原因没有响应时,SVM/OS 会使磁盘设备离线。
Ursache
驱动程序或固件问题
VMware 已发现 Dell PERC H730 控制器的一个已知问题。
Lösung
解决方法:
戴尔建议升级到最新的固件或驱动程序(在出现问题时)。
要使故障磁盘设备“联机”,请使用以下文章 PowerFlex无法清除 SDS 设备错误 —作系统级别的设备状态为离线
Betroffene Produkte
PowerFlex rack, ScaleIOArtikeleigenschaften
Artikelnummer: 000283423
Artikeltyp: Solution
Zuletzt geändert: 06 März 2025
Version: 3
Antworten auf Ihre Fragen erhalten Sie von anderen Dell NutzerInnen
Support Services
Prüfen Sie, ob Ihr Gerät durch Support Services abgedeckt ist.