Replikacja PowerFlex VMware powoduje wysokie wykorzystanie procesora i błędy we/wy
Summary: Podczas replikacji VMware z PowerFlex SDC host ESXi doświadcza wysokiego poziomu wykorzystania i błędów we/wy Podczas początkowej replikacji maszyn wirtualnych z replikacją VMware Replication przy użyciu klastra PowerFlex host ESXi widzi wysokie wykorzystanie procesora i błędy we/wy. ...
Symptoms
- VMware Replication 8.4 i starsze
- Replikacja początkowa na maszynie wirtualnej lub maszynach
wirtualnych — Replikowana maszyna wirtualna ma wiele dysków VMDK (15+)
— Wysokie wykorzystanie procesora na hoście ESXi, na którym jest hostowana maszyna wirtualna po rozpoczęciu replikacji.
- Opóźnienie na mapowanych woluminach z klastra PowerFlex wzrasta do 20–30 ms, a może nawet więcej.
- Inne maszyny wirtualne na tym samym hoście, które nie są replikowane, mogą odnotowywać spadek wydajności i/lub błędy we/wy z punktu widzenia aplikacji.
- Widok kolejek dysków z "esxtop" pokazuje, że host kolejkuje wywołania we/wy do woluminów zaplecza.
- Komponenty zaplecza (MDM/SDS) są solidne i nie wykazują żadnych problemów z wydajnością ani błędów.
- Host ESXi z replikującymi się maszynami wirtualnymi wyświetla następujące komunikaty wkrótce po rozpoczęciu replikacji:
2021-05-19T17:58:08.413Z cpu70:2098596)WARNING: ScsiDeviceIO: 1564: Device eui.1309fbc714390806ba291d4e0000001b performance has deteriorated. I/O latency increased from average value of 796 microseconds to 25965 microseconds.
2021-05-19T17:58:10.048Z cpu70:2098596)WARNING: ScsiDeviceIO: 1564: Device eui.1309fbc714390806ba2944570000005d performance has deteriorated. I/O latency increased from average value of 799 microseconds to 26019 microseconds.
2021-05-19T17:58:12.060Z cpu70:2098596)WARNING: ScsiDeviceIO: 1564: Device eui.1309fbc714390806ba291d3d0000000a performance has deteriorated. I/O latency increased from average value of 676 microseconds to 23641 microseconds.
Wpływ
Obniżenie wydajności i błędy we/wy z perspektywy aplikacji
Cause
Podczas początkowej replikacji maszyny wirtualnej z replikacją VMware wykonuje sumę kontrolną każdego bloku dla każdego dysku .vmdk skonfigurowanego przez maszynę wirtualną. Podczas tego procesu sumy kontrolnej we/wy są wysyłane przez pojedynczy wątek na hoście ESXi, co powoduje serializację we/wy sumy kontrolnej. Ten wątek jest również używany do innych celów we/wy na hoście, powodując nieprawidłowe wykorzystanie procesora i opóźnienie dysku, co z kolei spowalnia inne maszyny wirtualne na tym samym hoście.
Resolution
Firma VMware naprawia ten problem w nowszej wersji replikacji VMware. Wersja jest nadal do ustalenia.