PowerFlex Репликация VMware приводит к высокой загрузке ЦП и ошибкам ввода-вывода
Summary: При запуске VMware Replication с PowerFlex SDC для хоста ESXi наблюдается высокая загрузка и ошибки ввода-вывода Во время первоначальной репликации виртуальных машин с помощью VMware Replication с использованием кластера PowerFlex хост ESXi видит высокую загрузку ЦП и ошибки ввода-вывода. ...
Symptoms
- VMware Replication 8.4 и ниже
- Начальная репликация на виртуальную машину или виртуальные машины
- Реплицированная виртуальная машина имеет много дисков VMDK (15+)
- Высокая загрузка ЦП на хосте ESXi, где размещена виртуальная машина, на момент начала репликации.
- Задержка на сопоставленных томах из кластера PowerFlex увеличивается до 20–30 мс, а возможно и больше.
- На других виртуальных машинах на том же хосте, который не реплицируется, может наблюдаться снижение производительности и/или ошибки ввода-вывода с точки зрения приложения.
- Представление очередей дисков с «esxtop» показывает, что хост ставит в очередь вызовы ввода-вывода к внутренним томам.
- Серверные компоненты (MDM/SDS) надежны и не показывают никаких проблем с производительностью или ошибок.
- Вскоре после начала репликации на хосте ESXi с реплицируемыми виртуальными машинами появляются следующие сообщения:
2021-05-19T17:58:08.413Z cpu70:2098596)WARNING: ScsiDeviceIO: 1564: Device eui.1309fbc714390806ba291d4e0000001b performance has deteriorated. I/O latency increased from average value of 796 microseconds to 25965 microseconds.
2021-05-19T17:58:10.048Z cpu70:2098596)WARNING: ScsiDeviceIO: 1564: Device eui.1309fbc714390806ba2944570000005d performance has deteriorated. I/O latency increased from average value of 799 microseconds to 26019 microseconds.
2021-05-19T17:58:12.060Z cpu70:2098596)WARNING: ScsiDeviceIO: 1564: Device eui.1309fbc714390806ba291d3d0000000a performance has deteriorated. I/O latency increased from average value of 676 microseconds to 23641 microseconds.
Воздействие
Снижение производительности и ошибки ввода-вывода с точки зрения приложения
Cause
Во время начальной репликации виртуальной машины с помощью VMware Replication она рассчитывает контрольную сумму каждого блока для каждого диска .vmdk, настроенного виртуальной машиной. Во время этого процесса ввода-вывода операции ввода-вывода передаются через один поток на хосте ESXi, что приводит к сериализации операций ввода-вывода контрольной суммы. Этот поток также используется на хосте для других операций ввода-вывода, вызывая аномальное использование ЦП и задержку диска, что, в свою очередь, замедляет работу других виртуальных машин на том же хосте.
Resolution
VMware исправляет эту проблему в более поздней версии VMware Replication. Версия все еще подлежит уточнению.