PowerFlex 3.x: MDM-paniikki toiminnossa rpl_transmit_mgr.c
Summary: MDM (Mobile Device Management) -prosessi käynnistyy jatkuvasti paniikissa replikoinnin vuoksi
Symptoms
Tässä tapauksessa replikointisivuston kooditaso oli 3.x ja kohdesivuston kooditaso 4.x. Ongelma saattaa kuitenkin vaikuttaa mihin tahansa 3.x-järjestelmään.
Varastointipuolella ei ole tehty muutoksia.
MDM-prosessi käynnistyy jatkuvassa paniikissa seuraavan pinon jäljityksen vuoksi:
2024/11/24 05:51:06.186359 Panic in file /data/build/workspace/ScaleIO-Common-Job/src/mdm/replication/consistency_engine/rpl_transmit_mgr.c, line 833, function rplTransmitManager_ProcessRequestsForTimelinesRFD, PID 19477.Panic Expression ALWAYS_ASSERT . /opt/emc/scaleio/mdm/bin/mdm-3.6.400.107(mosDbg_PanicPrepare+0x13a) [0xabf1ba] /opt/emc/scaleio/mdm/bin/mdm-3.6.400.107(rplTransmitManager_ProcessRequestsForTimelinesRFD+0x1f0) [0x880da0] /opt/emc/scaleio/mdm/bin/mdm-3.6.400.107(consistencyEngine_AnalyzeTimelines+0x7b) [0x7f2ebb] /opt/emc/scaleio/mdm/bin/mdm-3.6.400.107(consistencyEngine_AnalayzerUmtIteration+0x3c) [0x60d96c] /opt/emc/scaleio/mdm/bin/mdm-3.6.400.107(consistencyEngine_AnalayzerUmtRoutine+0x33) [0x60da43] /opt/emc/scaleio/mdm/bin/mdm-3.6.400.107(mosUmt_StartFunc+0x7a) [0x69a9fa] /lib64/libc.so.6(+0x48190) [0x7ff82e834190] /opt/emc/scaleio/mdm/bin/mdm-3.6.400.107(mosUmt_Init+0x129) [0x8f5e89] [(nil)]
Vaikutus:
MDM-klusteri on kaatunut, minkä vuoksi tiedot eivät ole käytettävissä (DU).
Cause
Ongelma havaittiin ohjelmistokoodin virheeksi versiossa 3.x, joka aiheutti MDM:ien Panic-häiriön. Tämän vian vuoksi lähetetyt tiedot ylittivät replikoinnin aikana pakotetun 200 GiB:n rajan. Liiallisten pyyntöjen vuoksi MDM:illä oli vaikeuksia käsitellä niitä, mikä johti epävakauteen ja lopulta paniikkiin.
Tässä nimenomaisessa tapauksessa paljon lähetetyt tiedot johtuivat Windows SDC -trimmikomennosta, mutta ongelma saattoi johtua suuresta tiedonsiirrosta.
Resolution
Tämä ohjelmisto-ongelma on ratkaistu uusimmissa versioissa. Ongelman ratkaisemiseksi pysyvästi on suositeltavaa päivittää versioon 4.5.x tai uudempaan vakauden varmistamiseksi ennen replikoinnin jatkamista:
- Pysäytä SDR:t kaikissa solmuissa.
Tämä ratkaisee paniikin väliaikaisesti. - Keskeytä tai pysäytä kaikki replikoinnin yhtenäisyysryhmät (RCG) ja replikointiparit.
- Päivitä järjestelmä uusimpaan 4.5.x-versioon tai uudempaan.
- Jatka replikointia päivityksen jälkeen.
Versiot, joita ongelma koskee:
PowerFlex 3.x
korjattu versiossa:
PowerFlex 4.5