VxFlex: Vissa Cloudlink-krypterade SDS-enheter har markerat felet efter omstart av SDS-noder
Summary: VxFlex: Vissa Cloudlink-krypterade SDS-enheter har markerat felet efter omstart av SDS-noder
Symptoms
Efter omstart av SDS fortsätter vissa Cloudlink-krypterade enheter att fungera medan resten markeras som fel.
Flera SDS-enheter som är markerade som "Fel"-status i SDS som har startats om. Detta kan leda till minskad kapacitet och eventuellt längre återuppbyggnadstid.
I SDS trc:
21/06 13:09:34.917236 0x7fed52ebbeb0:mosAsyncIO_OpenFileEx:00376: WARNING: Failed to open IO file /dev/mapper/svm_sdg with rc 3 21/06 13:09:34.917238 0x7fed52ebbeb0:file_OpenEx:00707: Open error /dev/mapper/svm_sdg, NOT_FOUND 21/06 13:09:34.917241 0x7fed52ebbeb0:phyDev_ReadDevId:02649: failed to open file: path=/dev/mapper/svm_sdg, NOT_FOUND
SDS:erna cfg/partitions Filen innehåller en eller flera poster med SDS-enheterna med prefixet mapper/svm_sd och en eller flera utan prefix.
I följande exempel visas båda typerna av poster.
8 96 1875374424 mapper/svm_sdg 8 112 1875374424 sdh The device errors can be cleared after the affected SDS has been restarted.
Den ScaleIO-version som används är högre än 2.0.1.3 och KB 000158993 gäller inte, även om symptomet är liknande.
Cause
CloudLink har problem med diskkontroll och låser bara upp vissa enheter innan SDS startas. När SDS startar, /dev/mapper/svm_sd* enhetsfiler för de diskar som ännu inte har låsts upp har inte skapats ännu, vilket innebär att fel om SDS-enheter rapporteras.
Resolution
Det här problemet är åtgärdat i Cloud link 6.8. Se stödmatrisen för att säkerställa att miljön fortfarande stöds.
För att återställa från det här problemet startar du om SDS-tjänsten manuellt och rensar de berörda SDS-enhetsfelen.
Förhindra att problemet uppstår genom att starta SDS efter att CloudLink har låst upp alla diskar:
- Innan du stänger av noden kör du "/opt/emc/scaleio/sds/bin/delete_service.sh"; efter omstart, vänta tills alla diskar som används som SDS-enheter är upplåsta ("svm-status" eller CloudLink Control Center visas) och kör sedan "/opt/emc/scaleio/sds/bin/create_service.sh"; eller
- Redigera "/opt/emc/extra/pre_run.sh" och sätt in "sleep 30" ovanför den sista raden (överväg att justera siffran 30 högre om problemet kvarstår, dvs. alla enheter är inte upplåsta när SDS-processen startar):
... sleep 30 echo pre_run returned...$(date) >> /var/log/svm-sds
Additional Information
Obs! Vilolägeslösningen ovan ingår inte i en uppgradering (till 6.7 eftersom den inte innehåller den permanenta korrigeringen av problemet ännu) och kan behöva tillämpas igen.
Det här är inte ett ScaleIO-programvaruproblem. Problemet finns i Cloud link 6.6 och 6.7 och är åtgärdat i Cloud link 6.8.
Behåll #CCTFY25Q4 som nyckelord i alla versioner i spårningssyfte.