PowerFlex: Çoğaltma Kullanılırken İstemci G/Ç Hataları
Summary: İstemci sunucuları, PowerFlex destekli aygıtlara karşı G/Ç hatalarıyla karşılaşıyor. Genel arka uç (MDM'ler ve SDS'ler) iyi durumda görünüyor. PowerFlex çoğaltma kullanılıyor ve bir veya daha fazla RCG'de bazı RPO hataları var. ...
Symptoms
- Performansı düşürülmüş veya arızalı kapasite yok
- Hiçbir SDS ayrıştırılmadı ve hiçbir SDS aygıtı hata bildirmedi
- Bağlı olmayan MDM yok
- Çoğaltma özelliği kullanılıyor
Kullanıcı arayüzünde aşağıdaki hataları bildiren bir veya daha fazla uyarı:
Minor - Remote Consistency Group RPO Exceeded
Major - The RCG consistent image is too large to be consumed by the destination in one piece.
MDM olay günlüklerinde şunlar bildirilebilir:
2024-06-11 15:55:56.592000:0001566:RPL_PD_CAP_UTILIZATION_MINOR WARNING Protection Domain ID <pd_id> Replication journal capacity is at MINOR utilization level
...
2024-06-11 16:20:12.848000:0001567:RPL_PD_CAP_UTILIZATION_MAJOR ERROR Protection Domain ID <pd_id> Replication journal capacity is at MAJOR utilization level
...
2024-06-11 17:19:57.272000:0001584:RPL_PD_CAP_UTILIZATION_CRITICAL CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at VERY_HIGH utilization level
...
2024-06-11 17:52:26.352000:0001585:RPL_PD_CAP_UTILIZATION_CRITICAL CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at CRITICAL utilization level
...
2024-06-11 16:25:14.381000:0001576:RPL_CG_MOVED_TO_SLIM_MODE INFO Replication Consistency Group ID <rcg_id> entered slim mode
...
2024-06-11 18:27:29.738000:0001586:SDR_CRITICAL_CAP_CHANGE ERROR SDR ID <sdr_id>) handling user data changed discarded old user data and stopped to accumulate new user data due critical capacity
Etki
İstemciler çoğaltılan birimlere erişemiyor.
Cause
MDM ve SDR bileşeninin günlük kapasitesiyle ilgili dahili sayaçlar üzerinde anlaşamadığı nadir bir yazılım hatası ortaya çıkabilir.
Bu tutarsızlık, SDR'nin kapasitesi dolduğunda MDM'nin ek günlük kapasitesini ayıramamasına (serbest bırakmasına) neden olabilir ve bu da PowerFlex tarafından desteklenen cihazları kullanan istemci sunucularında G/Ç hatalarına yol açabilir.
Resolution
Sorunu çözmek için tüm SDR bileşenlerinin çalışırken yeniden başlatılması ve Kaynak sistemdeki MDM mülkiyetinin değiştirilmesi gerekir.
Hedef sitede SDR bileşenlerini yeniden başlatın
1. 2. adıma geçmeden önce tüm SDR'leri tanımlayın ve sağlıklı durumda olduklarını doğrulayın:
scli --query_all_sdr
2. SDR'de bakım moduna girin:
scli --enter_sdr_maintenance_mode --sdr_name <name>
3. 1. adımdaki komutu çalıştırarak SDR'nin bakım modunda olduğunu doğrulayın.
4. SDR bileşenini yeniden başlatın
pkill sdr
5. Kaynak sitedeki tüm SDR'ler için 1-4 arası adımları tekrarlayın.
6. SDR'leri bakım modundan çıkarın:
scli --exit_sdr_maintenance_mode --sdr_name <name>
7. Tüm SDR'ler yeniden başlatıldıktan ve iyi durumda olduktan sonra MDM sahipliğini değiştirin:
#3.x
scli --switch_mdm_ownership --new_master_mdm_name <name>
#4.x
scli --switch_mdm_ownership --new_primary_mdm_name <name>
8. İstemci sunucularındaki G/Ç hatalarının artık bildirilmediğini doğrulayın. İstemci salt okunur bir dosya sistemine girdiyse istemci sunucusunun yeniden başlatılması gerekebilir.
Etkilenen Sürümler
PowerFlex 3.x
PFMP 4.x
Düzeltildiği Sürüm
PowerFlex 4.5.3
PowerFlex 4.5.4 - 4.5.4 HF1
sürümüne yükseltme PowerFlex 4.5.5 - düzeltme mevcut
değil PowerFlex 4.5.6 ve üstü
Additional Information
Etkilenen Sürümler
PowerFlex 3.x
PowerFlex 4.x
Düzeltildiği Sürüm
PowerFlex 4.5.3
PowerFlex 4.5.4 - 4.5.4 HF1
PowerFlex 4.5.5 sürümüne yükseltme - düzeltme mevcut değil.
PowerFlex 4.5.6 ve üzeri