PowerFlex 3.X: SDS's ontkoppelen na wijziging van MDM-eigendom
Samenvatting: Meerdere SDS-servers worden ontkoppeld nadat een MDM-eigendom is uitgegeven.
Symptomen
MDM-eigendom verandert door een door de beheerder geïnitieerde activiteit.
MDM-eigendom is gewijzigd vanwege een storing op een van de MDM-servers.
MDM-gebeurtenislogboeken waaruit blijkt dat een nieuw primair MDM-knooppunt eigenaar is geworden:
2024-07-04 07:45:28.088000:0114714:MDM_BECOMING_MASTER WARNING This MDM is switching to Master mode. MDM will start running.
Meerdere SDS-exemplaren maken opnieuw verbinding met de nieuwe primaire MDM en verbreken kort de verbinding:
2024-07-04 07:45:41.218000:0115810:SDS_RECONNECTED INFO SDS: sds1 (ID 13f4fe8800000001) reconnected 2024-07-04 07:45:41.377000:0115811:SDS_RECONNECTED INFO SDS: sds2 (ID 13f4fe3b00000002) reconnected 2024-07-04 07:45:43.194000:0115990:SDS_DECOUPLED ERROR SDS: sds1 (id: 13f4fe8800000001) decoupled. 2024-07-04 07:45:44.197000:0116051:SDS_DECOUPLED ERROR SDS: sds2 (id: 13f4fe3b00000002) decoupled. 2024-07-04 07:45:45.192000:0115809:MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state. 2024-07-04 07:45:45.786000:0116061:MDM_DATA_FAILED CRITICAL The system is now in DATA FAILURE state. Some data is unavailable.
In dit geval bleven de ontkoppelde SDS-exemplaren uiteindelijk wel verbonden met de MDM.
SDS-traceringslogboeken waaruit blijkt dat het zichzelf blokkeert:
04/07 07:45:39.606135 0x7fc708919db8:kalive_IsBlocked:00570: Keep-Alive (KA) is blocked: TRUE 04/07 07:45:46.578166 0x7fc702567db8:kalive_ShouldSendKeepAlive:00345: KA aborted because SDS is blocked
Het SDS-proces impliceert zichzelf als het denkt dat het een lokaal probleem heeft. Dit gebeurt om I/O-problemen te voorkomen en pogingen om opnieuw verbinding te maken met de primaire MDM.
Impact
Een of meer storagepools hebben te maken met verminderde capaciteit.
Eén of meer storagepools ervaren een defecte capaciteit.
Oorzaak
Wanneer een nieuwe MDM eigenaar wordt van het cluster, maken alle SDS-exemplaren verbinding met de nieuwe primaire MDM. Tijdens deze overgang ontvangen de SDS's herconfiguratieopdrachten van het MDM. In zeldzame gevallen kunnen de SDS's de herconfiguratie-instructies van de MDM voltooien, maar moeten ze wachten op verdere instructies. Als de MDM niet binnen 5 seconden aanvullende instructies geeft, markeren de SDS's zichzelf als geblokkeerd en proberen ze opnieuw verbinding te maken met de MDM. Dit probleem komt vaker voor in zeer grote omgevingen met 70 of meer SDS-exemplaren, waar de MDM mogelijk niet snel genoeg is om de benodigde instructies te verzenden, waardoor de SDS's de verbinding verbreken en het opnieuw proberen.
Oplossing
Om te voorkomen dat dit probleem zich voordoet, moet u de PowerFlex-software upgraden naar een versie die de oplossing bevat.
Getroffen versie
PowerFlex 3.6 en ouder
Opgelost in versie
PowerFlex 3.6.1 en nieuwer