PowerFlex 3.X Under NDU går et SDS-nedbrud under udførelse af mgStorageRegion_CopyFromBuffer-funktionen
Summary: SDS går ned på funktion mgStorageRegion_CopyFromBuffer
Symptoms
- Opgradering fra 3.0 til 3.6
- SDS afslutter øjeblikkelig vedligeholdelsestilstand (IMM)
- Kontrolsum om bord er aktiveret.
SDS går ned med følgende panik:
2022/12/20 10:22:18.543129 Panic in file /data/build/workspace/ScaleIO-Common-Job/src/tgt/storage/mg_impl/mg_storage_region.c, line 4188, function mgStorageRegion_CopyFromBuffer, PID 13108.Panic Expression !(bufferSizeInBytes != ((sizeInLbs) * (512))) PANIC_ID_tgt_1517847817759. /opt/emc/scaleio/sds/bin/sds-3.6.400.107(mosDbg_PanicPrepare+0x13a) [0x93ab8a] /opt/emc/scaleio/sds/bin/sds-3.6.400.107(mgStorageRegion_CopyFromBuffer+0x1a7) [0x810477] /opt/emc/scaleio/sds/bin/sds-3.6.400.107(mgStorageRegion_CopyFromCachedBuffer+0x33) [0x810873] /opt/emc/scaleio/sds/bin/sds-3.6.400.107(storageRegion_CopyFromCachedBuffer+0xde) [0x4d3f3e] /opt/emc/scaleio/sds/bin/sds-3.6.400.107(mgStorageRegion_ReadFromSyncBuf+0x45) [0x4d4a85] /opt/emc/scaleio/sds/bin/sds-3.6.400.107(raidComb_ReadFromRemoteUntilEntireRegionIsAcquired+0x451) [0x74e021] /opt/emc/scaleio/sds/bin/sds-3.6.400.107(raidComb_ReadVolumeFromRemote+0x3ae) [0x74e8ee] /opt/emc/scaleio/sds/bin/sds-3.6.400.107(raidReverseRebuild_LoopAndCopy+0x140f) [0x75518f] /opt/emc/scaleio/sds/bin/sds-3.6.400.107(raidReverseRebuild_Start+0xb56) [0x7583c6] /opt/emc/scaleio/sds/bin/sds-3.6.400.107(raidSyncPool_StartJob+0x375) [0x5e3145]
Kontrolsumfunktionen ombord er aktiveret på storagepuljen/-puljerne/-puljerne:
Storage Pool durpsdsc7p8pool1 (Id: 469b0f6800000007) has 7 volumes and 236.9 TB (242550 GB) free net capacity. 2.5 PB (2524 TB) volume allocation limit. ... Inflight Checksum: Enabled ...
Påvirkning
SDS går ned og kan ikke afslutte IMM. Hvis opgraderingen ikke kan fortsætte under en opgradering.
Cause
Resolution
Deaktiver kontrolsum om bord på lagerpuljen, som SDS bidrager til:
1) Forespørg alle SDS'er for at få SDS-navnet / id:
[root@nestedsvm2 ~]# scli --query_all_sds Query-all-SDS returned 3 SDS nodes. Protection Domain 8eeacbf900000000 Name: pd1 SDS ID: ab471ceb00000002 Name: svm103 State: Connected, Joined IP: 15.15.15.103 Port: 7072 Version: 3.6.500 SDS ID: ab471cea00000001 Name: svm102 State: Connected, Joined IP: 15.15.15.102 Port: 7072 Version: 3.6.500 SDS ID: ab471ce800000000 Name: svm101 State: Connected, Joined IP: 15.15.15.101 Port: 7072 Version: 3.6.500
2) Forespørg SDS ved enten navn / id, og se efter "Storage Pool: ":
Bemærk: de(n) storagepulje(r), den bidrager med enheder til; I dette tilfælde er der kun én, som er navnet "sp1" for lagerpuljen.
[root@nestedsvm2 ~]# scli --query_sds --sds_id ab471ceb00000002 | grep -i 'storage pool:'
1: Storage Pool: sp1 inflight requests factor: 115, inflight bandwidth factor 115
Storage Pool: sp1, Capacity: 198 GB, State: Normal
Storage Pool: sp1, Capacity: 98 GB, State: Normal
Storage Pool: sp1, Capacity: 98 GB, State: Normal
3) Forespørg i storagepuljen, og se efter "Inflight Checksum: ":
[root@nestedsvm2 ~]# scli --query_storage_pool --storage_pool_name sp1 --protection_domain_name pd1 | grep -i 'Inflight checksum'
Inflight Checksum: Enabled
3.a) For at deaktivere kontrolsum om bord kan det gøres ved hjælp af scli eller i præsentationsserveren. For at deaktivere det ved hjælp af scli skal du køre kommandoen nedenfor:
[root@nestedsvm2 ~]# scli --set_checksum_mode --protection_domain_name pd1 --storage_pool_name sp1 --disable_inflight_checksum Checksum mode modified successfully
3.b) I præsentationsserveren skal du gå til Storagepuljer > og vælge Lagerpulje > Rediger > Generelt > Fjern markeringen af "Aktivér kontrolsum om bord" > Anvend.
Påvirkede versioner
PowerFlex 3.5.x
PowerFlex 3.6.x