PowerFlex VMware Replikasyonu Yüksek CPU Kullanımı ve GÇ Hatalarına Neden Oluyor
Summary: PowerFlex SDC'ler ile VMware Çoğaltma çalıştırırken, ESXi ana bilgisayarı yüksek kullanım ve IO hatalarıyla karşılaşıyor VM'lerin PowerFlex kümesi kullanılarak VMware Çoğaltma ile ilk kez çoğaltılması sırasında, ESXi ana bilgisayarı yüksek CPU kullanımı ve GÇ hatalarıyla karşılaşır. ...
Symptoms
- VMware Replication 8.4 ve altı
- Bir VM veya VM'lerde
ilk çoğaltma - Çoğaltılan VM'de çok sayıda VMDK diski var (15+)
- Çoğaltma başladığında VM'nin barındırıldığı ESXi ana bilgisayarında yüksek CPU kullanımı.
- PowerFlex kümesinden eşlenmiş disk bölümlerinin gecikmesi 20-30 ms'ye, muhtemelen daha fazlasına yükselir.
- Aynı ana bilgisayardaki çoğaltılmayan diğer VM'ler, uygulama açısından düşük performans ve/veya IO hataları görebilir.
- "esxtop" ile disk kuyruklarının görünümü, ana bilgisayarın arka uç birimlerine yapılan GÇ çağrılarını kuyruğa aldığını gösterir.
- Arka uç bileşenleri (MDM/SDS) sağlamdır ve herhangi bir performans sorunu veya hatası göstermez.
- Çoğaltılan VM'lere sahip ESXi ana bilgisayarında, çoğaltma başladıktan kısa bir süre sonra şu mesajlar görüntülenir:
2021-05-19T17:58:08.413Z cpu70:2098596)WARNING: ScsiDeviceIO: 1564: Device eui.1309fbc714390806ba291d4e0000001b performance has deteriorated. I/O latency increased from average value of 796 microseconds to 25965 microseconds.
2021-05-19T17:58:10.048Z cpu70:2098596)WARNING: ScsiDeviceIO: 1564: Device eui.1309fbc714390806ba2944570000005d performance has deteriorated. I/O latency increased from average value of 799 microseconds to 26019 microseconds.
2021-05-19T17:58:12.060Z cpu70:2098596)WARNING: ScsiDeviceIO: 1564: Device eui.1309fbc714390806ba291d3d0000000a performance has deteriorated. I/O latency increased from average value of 676 microseconds to 23641 microseconds.
Etki
Uygulama açısından performans düşüşü ve IO hataları
Cause
VMware Çoğaltma ile bir VM'nin ilk çoğaltması sırasında, VM'nin yapılandırdığı her .vmdk diski için her bloğun sağlama toplamını yapar. Bu sağlama işlemi sırasında GÇ, ESXi ana bilgisayarındaki tek bir iş parçacığı üzerinden gönderilir ve bu da sağlama toplamının seri hale getirilmesine neden olur. Bu iş parçacığı, ana bilgisayarda diğer GÇ amaçları için de kullanılır ve anormal CPU kullanımına ve disk gecikmesine neden olur ve bu da aynı ana bilgisayardaki diğer VM'leri yavaşlatır.
Resolution
VMware, bu sorunu VMware Replication'ın sonraki bir sürümünde düzeltmektedir. Sürüm hala TBD'dir.