PowerFlex: Asiakkaan IO-virheet replikointia käytettäessä
Summary: Asiakaspalvelimissa on I/O-virheitä PowerFlexin tukemissa laitteissa. Yleinen taustajärjestelmä (MDM: t ja käyttöturvallisuustiedotteet) näyttää olevan terve. PowerFlexin replikointi on käytössä, ja RPO-virheitä esiintyy yhdessä tai useassa RCG:ssä. ...
Symptoms
- Ei heikentynyttä tai vikaantunutta kapasiteettia
- SDS:iä ei irrotettu eikä SDS-laitteita ilmoitettu virheistä
- Ei irrallisia MDM:iä
- Replikointitoimintoa käytetään
Yksi tai useampi käyttöliittymän hälytys, joka ilmoittaa seuraavista virheistä:
Minor - Remote Consistency Group RPO Exceeded
Major - The RCG consistent image is too large to be consumed by the destination in one piece.
MDM-tapahtumalokit saattavat raportoida seuraavaa:
2024-06-11 15:55:56.592000:0001566:RPL_PD_CAP_UTILIZATION_MINOR WARNING Protection Domain ID <pd_id> Replication journal capacity is at MINOR utilization level
...
2024-06-11 16:20:12.848000:0001567:RPL_PD_CAP_UTILIZATION_MAJOR ERROR Protection Domain ID <pd_id> Replication journal capacity is at MAJOR utilization level
...
2024-06-11 17:19:57.272000:0001584:RPL_PD_CAP_UTILIZATION_CRITICAL CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at VERY_HIGH utilization level
...
2024-06-11 17:52:26.352000:0001585:RPL_PD_CAP_UTILIZATION_CRITICAL CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at CRITICAL utilization level
...
2024-06-11 16:25:14.381000:0001576:RPL_CG_MOVED_TO_SLIM_MODE INFO Replication Consistency Group ID <rcg_id> entered slim mode
...
2024-06-11 18:27:29.738000:0001586:SDR_CRITICAL_CAP_CHANGE ERROR SDR ID <sdr_id>) handling user data changed discarded old user data and stopped to accumulate new user data due critical capacity
Vaikutus
Asiakkaat eivät voi käyttää replikoitavia asemia.
Cause
Harvinainen ohjelmistovirhe voi ilmetä, jos MDM ja SDR-komponentti ovat eri mieltä kirjauskansiokapasiteettiin liittyvistä sisäisistä laskureista.
Tämä ristiriita voi aiheuttaa sen, että MDM ei pysty purkamaan (vapauttamaan) ylimääräistä päiväkirjakapasiteettia, kun SDR:n kapasiteetti on täynnä, mikä voi johtaa I/O-virheisiin asiakaspalvelimissa, jotka käyttävät PowerFlexin tukemia laitteita.
Resolution
Kaikki SDR-komponentit on käynnistettävä uudelleen jatkuvasti, ja MDM:n omistajuus lähdejärjestelmässä on vaihdettava ongelman ratkaisemiseksi.
Käynnistä SDR-komponentit uudelleen kohdesivustossa
1. Tunnista kaikki SDR:t ja varmista, että ne ovat kunnossa, ennen kuin jatkat vaiheeseen 2:
scli --query_all_sdr
2. Käynnistä SDR:n ylläpitotila:
scli --enter_sdr_maintenance_mode --sdr_name <name>
3. Varmista, että SDR on huoltotilassa, suorittamalla komento vaiheessa 1.
4. Käynnistä SDR-osa uudelleen
pkill sdr
5. Toista vaiheet 1–4 kaikille lähdesivuston SDR:ille.
6. SDR:ien poistaminen ylläpitotilasta:
scli --exit_sdr_maintenance_mode --sdr_name <name>
7. Vaihda MDM:n omistajaa, kun kaikki SDR:t on käynnistetty uudelleen ja ne ovat kunnossa:
#3.x
scli --switch_mdm_ownership --new_master_mdm_name <name>
#4.x
scli --switch_mdm_ownership --new_primary_mdm_name <name>
8. Sen varmistaminen, että asiakaspalvelimien I/O-virheitä ei enää raportoida Jos asiakasohjelma on siirtynyt vain luku -tiedostojärjestelmään, asiakaspalvelin saattaa vaatia uudelleenkäynnistyksen.
Versiot, joita ongelma koskee
PowerFlex 3.x
PFMP 4.x
Korjattu versiossa
PowerFlex 4.5.3
PowerFlex 4.5.4 – päivitys versioon 4.5.4 HF1
PowerFlex 4.5.5 – korjausta ei saatavilla
PowerFlex 4.5.6 ja uudemmat
Additional Information
Versiot, joita ongelma koskee
PowerFlex 3.x
PowerFlex 4.x
Korjattu versiossa
PowerFlex 4.5.3
PowerFlex 4.5.4 - päivitys versioon 4.5.4 HF1
PowerFlex 4.5.5 - korjausta ei saatavilla.
PowerFlex 4.5.6 ja uudemmat