PowerFlex ESXi Dell PERC H730- tai H730P RAID -ohjaimen ongelma
Zusammenfassung: PowerFlex-levylaitteet vikaantuvat satunnaisesti tai ilmoittavat levylaitteiden virheistä. ESXi ilmoittaa levylaitteiden virheistä ja LSI raid -ohjaimen virheistä (SCSI:n keskeytys- ja nollauskomennot). ...
Symptome
Skenaario:
Ongelma koskee vain ESXI 5.5- tai 6.0-versiota.
ScaleIO-järjestelmä ilmoittaa levylaitevirheistä ja levylaitteiden vikaantumisesta satunnaisesti. Kun levylaite on taas online-tilassa, järjestelmä toimii odotetusti, kunnes levy vioittuu seuraavan kerran.
Data unavailability might occur when disk devices fail on different SDSs.
Oireet:
ScaleIO-järjestelmän tapahtumaraportti Tietojen heikentyminen:
2016-01-22 17:28:35.213 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state.
ScaleIO-järjestelmätapahtumat raportoivat levylaitevirheistä tai -virheistä:
799 2016-01-22 17:28:39.818 SDS_DEV_ERROR_REPORT ERROR Device error reported on SDS: 10.3.1.21, Device: /dev/sdb. State: NORMAL upDownState: UP processState: DEV_ERR_INPROGRESS devErrState: REPORT
Esimerkki VMkernel-lokeista:
2016-01-2613:48:09.254 2016-01-26T13:50:35.576Z esxi-vcd-compute-03 vmkernel: cpu11:301656)VSCSI: 2590: handle 8194(vscsi0:0):Reset request on FSS handle 279624493 (0 outstanding commands) from (vmm0:scsi-test-4) 2016-01-2613:48:09.254 2016-01-26T13:50:35.576Z esxi-vcd-compute-03 vmkernel: cpu11:32946)VSCSI: 2868: handle 8194(vscsi0:0):Reset [Retries: 0/0]from (vmm0:scsi-test-4) 2016-01-2613:48:09.255 2016-01-26T13:50:35.576Z esxi-vcd-compute-03 vmkernel: cpu11:32946)lsi_mr3: mfi_TaskMgmt:254: Processing taskMgmt virt reset for device: vmhba0:C2:T0:L0 2016-01-2613:48:09.255 2016-01-26T13:50:35.576Z esxi-vcd-compute-03 vmkernel: cpu11:32946)lsi_mr3: mfi_TaskMgmt:258: VIRT_RESET cmd # 2514475 2016-01-2613:48:09.255 2016-01-26T13:50:35.576Z esxi-vcd-compute-03 vmkernel: cpu11:32946)lsi_mr3: mfi_TaskMgmt:262: ABORT
Esimerkki VMkernel-lokeista:
2015-09-04T14:05:58.860Z cpu20:32859)lsi_mr3: mfi_TaskMgmt:254: Processing taskMgmt virt reset for device: vmhba0:C2:T0:L0 2015-09-04T14:05:58.860Z cpu20:32859)lsi_mr3: mfi_TaskMgmt:258: VIRT_RESET cmd # 28267605 2015-09-04T14:05:58.860Z cpu20:32859)lsi_mr3: mfi_TaskMgmt:262: ABORT 2015-09-04T14:05:58.864Z cpu8:33188)lsi_mr3: fusionWaitForOutstanding:2516: megasas: [ 0]waiting for 1 commands to complete
SCSI:n keskeytyskomennot näkyvät SVM:n viestitiedostossa:
Sep 2 21:35:09 ScaleIO-10-100-7-66 kernel: [28986.521362] sd 5:0:15:0: [sdw] task abort on host 5, ffff880095a00d80 Sep 2 21:35:09 ScaleIO-10-100-7-66 kernel: [28986.782459] sd 4:0:4:0: [sdg] task abort on host 4, ffff8800959d65c0 Sep 2 21:35:09 ScaleIO-10-100-7-66 kernel: [28986.782466] sd 4:0:4:0: [sdg] Failed to abort cmd ffff8800959d65c0
Vaikutus:
- Levylaitteissa on satunnaisia vikaantumisia, mikä aiheuttaa uudelleenmuodostusta ja tasapainotuksia, mikä vaikuttaa järjestelmän suorituskykyyn.
- Tiedot eivät ehkä ole käytettävissä.
- Kun levylaitteessa on ongelma eikä levylaite vastaa jostain syystä, SVM/OS siirtää levylaitteen offline-tilaan.
Ursache
Ajuri- tai laiteohjelmisto-ongelma
VMwaren tiedossa on tunnettu ongelma Dell PERC H730 -ohjaimissa.
Lösung
Tilapäisratkaisu:
Dell suositteli päivittämistä uusimpaan laiteohjelmistoon tai uusimpiin ohjaimiin (ongelmahetkellä).
Jos haluat käyttää viallisen levylaitteen online-tilassa, käytä seuraavaa artikkelia: PowerFlex SDS-laitevirheitä ei voi poistaa – laitteen tila on offline-tilassa käyttöjärjestelmätasolla