PowerFlex 3.x: SDS-tjenesten får kontinuerlig panikk med funksjon drl_IsClean
Summary: I sjeldne tilfeller kan SDS-tjenesten kontinuerlig få panikk med funksjonen drl_IsClean. Dette problemet er observert når SDS-enhetene er større enn 2 TB.
Symptoms
SDS-tjenesten får kontinuerlig panikk med følgende stabelsporing:
/opt/emc/scaleio/sds/logs/exp.0
2024/07/22 21:54:33.819866 Panic in file /data/build/workspace/ScaleIO-Common-Job/src/tgt/bm/drl.c, line 1238, function drl_IsClean, PID 17253.Panic Expression !(offsetInLbs < pDrl->protectedOffsetInLbs) PANIC_ID_tgt_1497349762194.
/opt/emc/scaleio/sds/bin/sds-3.6.400.107(mosDbg_PanicPrepare+0x13a) [0x93ab8a]
/opt/emc/scaleio/sds/bin/sds-3.6.400.107(drl_IsClean+0x5e) [0x9346ae]
/opt/emc/scaleio/sds/bin/sds-3.6.400.107(mgPhyDev_IsDrlGroupClean+0x4b) [0x93476b]
/opt/emc/scaleio/sds/bin/sds-3.6.400.107(mgPhyComb_ReadIntegrityBits+0x130) [0x906040]
/opt/emc/scaleio/sds/bin/sds-3.6.400.107(mgStorageRegion_ReadRegionIntegrity+0xb4) [0x906224]
/opt/emc/scaleio/sds/bin/sds-3.6.400.107(storageRegion_ReadDirtyRegion+0xad) [0x740f4d]
/opt/emc/scaleio/sds/bin/sds-3.6.400.107(raidComb_ReadDrl+0x7d) [0x74105d]
/opt/emc/scaleio/sds/bin/sds-3.6.400.107(ioh_ReadCombDrl+0x758) [0x5eb368]
/opt/emc/scaleio/sds/bin/sds-3.6.400.107(ioh_NewRequest+0x2084) [0x5fb4a4]
/opt/emc/scaleio/sds/bin/sds-3.6.400.107(contNet_RecvIORequest+0x2c4) [0x601534]
Innvirkning
Utilgjengelighet av brukerdata kan oppstå hvis andre SDS-frakoblinger som en del av at de er i en av følgende tilstander:
- Modus for øyeblikkelig vedlikehold (IMM)
- Feiltilstand
- Under en pågående gjenoppbygging
Cause
SDS-tjenesten får panikk forårsaket av store enhetsforskyvninger.
Resolution
Reparasjon:
- PowerFlex 3.6.5 og nyere (avvikling av støtte)
- PowerFlex 4.5 og nyere
Omgåelse av problemet:
Følg ett av alternativene.
Hvis alternativ 1 ikke løser problemet, går du til alternativ 2.
Alternativ 1:
-
- Skriv inn SDS-noden i IMM fra scli-kommandolinjen eller Presentation Server UI.
- Hvis SDS-noden ikke kan angi IMM, stopper du SDS-bakgrunnsprosessen ved å kjøre skriptet
/opt/emc/scaleio/sds/bin/delete_service.sh.Take necessary precautions to prevent the cluster from entering a Data Unavailability (DU) state. Before stopping the SDS daemon, verify that no Rebuild is in progress. If you're unsure about the DU state, consult L2 or an SME.
- Hvis SDS-noden ikke kan angi IMM, stopper du SDS-bakgrunnsprosessen ved å kjøre skriptet
- Stopp SDS-tjenesten når SDS er plassert i IMM
/opt/emc/scaleio/sds/bin/delete_service.sh - Ta ut det delte minnet på SDS (inkludert CloudLink delt minne).
- Flytt filene som genereres av følgende kommando, til en midlertidig katalog
ls -l /dev/shm | egrep -i *EMC_sds* ls -l /dev/shm | egrep emc_scaleio_*
- Flytt filene som genereres av følgende kommando, til en midlertidig katalog
- Start SDS-tjenesten
/opt/emc/scaleio/sds/bin/create_service.sh
- Skriv inn SDS-noden i IMM fra scli-kommandolinjen eller Presentation Server UI.
-
- Avslutt SDS fra IMM ved hjelp av scli eller presentasjonsservergrensesnittet. En gjenoppbygging forventes å starte. Hvis SDS ikke var i IMM, går du til neste trinn
- Kontroller utdataene fra følgende kommando for å sikre at SDS er tilkoblet:
scli --query_all_sds
- Avslutt SDS fra IMM ved hjelp av scli eller presentasjonsservergrensesnittet. En gjenoppbygging forventes å starte. Hvis SDS ikke var i IMM, går du til neste trinn
Alternativ 2:
-
Hvis systemet ikke er i datafeil og tilstrekkelig ledig eller ledig kapasitet er tilgjengelig, fjerner du SDS-noden fra PowerFlex-klyngen. Når rebalanseringen er fullført, legger du til SDS-noden på nytt med alle SDS-enhetene.
VIKTIG:
Bakgrunnsskanner (BGS) og delvis enhetsfeil (PDE) kan potensielt føre til at problemet oppstår igjen. Hvis det er mulig, deaktiver BGS eller bruk BGS i modusen "bare rapport".
Vedvarende kontrollsummer bør ikke utløse problemer. Hvis det imidlertid ikke er samsvar mellom kontrollsummene, startes en liten gjenoppbygging, noe som kan føre til at problemet oppstår igjen. Deaktiver om mulig fast kontrollsum.