PowerFlex ESXi Dell PERC H730 또는 H730P RAID 컨트롤러 문제

Zusammenfassung: PowerFlex 디스크 디바이스가 임의로 실패하거나 디스크 디바이스에 오류가 보고됩니다. ESXi가 디스크 디바이스 오류 및 LSI RAID 컨트롤러 오류(SCSI 중단 및 재설정 명령)를 보고합니다.

Dieser Artikel gilt für Dieser Artikel gilt nicht für Dieser Artikel ist nicht an ein bestimmtes Produkt gebunden. In diesem Artikel werden nicht alle Produktversionen aufgeführt.

Symptome

시나리오:
ESXI 5.5 또는 6.0만 영향을 받습니다.
ScaleIO 시스템이 디스크 디바이스 오류를 보고하고 디스크 디바이스가 임의로 실패합니다. 디스크 디바이스가 다시 "온라인"이 되면 다음 디스크 디바이스 장애가 발생할 때까지 시스템이 예상대로 계속 작동합니다.

Data unavailability might occur when disk devices fail on different SDSs.

증상: 
ScaleIO 시스템 이벤트 보고서 데이터 성능 저하:

2016-01-22 17:28:35.213 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state.

ScaleIO 시스템 이벤트에서 디스크 디바이스 오류 또는 장애를 보고합니다.

799 2016-01-22 17:28:39.818 SDS_DEV_ERROR_REPORT ERROR Device error reported on SDS: 10.3.1.21, Device: /dev/sdb. State: NORMAL upDownState: UP processState: DEV_ERR_INPROGRESS devErrState: REPORT

VMkernel 로그 예:

2016-01-2613:48:09.254 2016-01-26T13:50:35.576Z esxi-vcd-compute-03 vmkernel: cpu11:301656)VSCSI: 2590: handle 8194(vscsi0:0):Reset request on FSS handle 279624493 (0 outstanding commands) from (vmm0:scsi-test-4)
2016-01-2613:48:09.254 2016-01-26T13:50:35.576Z esxi-vcd-compute-03 vmkernel: cpu11:32946)VSCSI: 2868: handle 8194(vscsi0:0):Reset [Retries: 0/0]from (vmm0:scsi-test-4)
2016-01-2613:48:09.255 2016-01-26T13:50:35.576Z esxi-vcd-compute-03 vmkernel: cpu11:32946)lsi_mr3: mfi_TaskMgmt:254: Processing taskMgmt virt reset for device: vmhba0:C2:T0:L0
2016-01-2613:48:09.255 2016-01-26T13:50:35.576Z esxi-vcd-compute-03 vmkernel: cpu11:32946)lsi_mr3: mfi_TaskMgmt:258: VIRT_RESET cmd # 2514475
2016-01-2613:48:09.255 2016-01-26T13:50:35.576Z esxi-vcd-compute-03 vmkernel: cpu11:32946)lsi_mr3: mfi_TaskMgmt:262: ABORT

VMkernel 로그 예:

2015-09-04T14:05:58.860Z cpu20:32859)lsi_mr3: mfi_TaskMgmt:254: Processing taskMgmt virt reset for device: vmhba0:C2:T0:L0
2015-09-04T14:05:58.860Z cpu20:32859)lsi_mr3: mfi_TaskMgmt:258: VIRT_RESET cmd # 28267605
2015-09-04T14:05:58.860Z cpu20:32859)lsi_mr3: mfi_TaskMgmt:262: ABORT
2015-09-04T14:05:58.864Z cpu8:33188)lsi_mr3: fusionWaitForOutstanding:2516: megasas: [ 0]waiting for 1 commands to complete

SCSI abort 명령은 SVM의 메시지 파일에 나타납니다.

Sep 2 21:35:09 ScaleIO-10-100-7-66 kernel: [28986.521362] sd 5:0:15:0: [sdw] task abort on host 5, ffff880095a00d80
Sep 2 21:35:09 ScaleIO-10-100-7-66 kernel: [28986.782459] sd 4:0:4:0: [sdg] task abort on host 4, ffff8800959d65c0
Sep 2 21:35:09 ScaleIO-10-100-7-66 kernel: [28986.782466] sd 4:0:4:0: [sdg] Failed to abort cmd ffff8800959d65c0

영향:

  • 디스크 디바이스가 임의로 실패하여 재구축 및 재조정이 발생하고 시스템 성능에 영향을 미칩니다.
  • 데이터를 사용할 수 없게 될 수 있습니다. 
  • 디스크 디바이스에 문제가 있고 디스크 디바이스가 어떤 이유로든 응답하지 않는 경우 SVM/OS가 디스크 디바이스를 오프라인 상태로 만듭니다.

Ursache

드라이버 또는 펌웨어 문제
VMware는 Dell PERC H730 컨트롤러의 알려진 문제를 알고 있습니다.

Lösung

해결 방법:
Dell은 (문제 발생 시) 최신 펌웨어 또는 드라이버로 업그레이드할 것을 권장했습니다.

장애가 발생한 디스크 디바이스를 "온라인"으로 전환하려면 다음 문서를 사용하십시오. PowerFlex SDS 디바이스 오류를 지울 수 없음 - OS 수준에서 디바이스 상태가 오프라인임

Betroffene Produkte

PowerFlex rack, ScaleIO
Artikeleigenschaften
Artikelnummer: 000283423
Artikeltyp: Solution
Zuletzt geändert: 06 März 2025
Version:  3
Antworten auf Ihre Fragen erhalten Sie von anderen Dell NutzerInnen
Support Services
Prüfen Sie, ob Ihr Gerät durch Support Services abgedeckt ist.