PowerEdge. Потенциальное повреждение данных на серверах R6415, R7415 и R7425 при использовании PERC H330 под управлением ОС Linux
Summary: В этой статье рассматриваются серверы R7425, R6415, R7415 14G AMD с ОС Linux с использованием контроллеров H330 или ESXi с использованием H330, настроенных как сквозная передача операций ввода-вывода VMDirectPath на виртуальную машину Linux с возможностью повреждения данных. ...
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
В следующих условиях при выполнении интенсивных операций ввода-вывода в хранилище, подключенном к контроллерам PERC H330 на сервере PowerEdge на базе процессоров AMD 14-го поколения, может произойти повреждение данных:
- H330 устанавливается с ОС на базе Linux с включенной функцией CPU Virtualization Technology (VT) в BIOS системы
- Операционные системы VMware/ESXi с контроллером хранилища H330, настроенным как устройство транзита ввода-вывода VMDirectPath (PCI-Passthrough) на виртуальную машину (ВМ) Linux
- Риск повреждения данных возникает только в виртуальной машине, которая подключена к H330 в качестве транзитного устройства.
Какие продукты затронуты?
- Все серверы AMD 14G (одно- или двухпроцессорные)
- R6415
- R7415
- R7425
- Операционные системы на базе Linux, включая, помимо прочего:
- Red Hat Enterprise Linux 7.5
- Red Hat Enterprise Linux 7.6
- Ubuntu 16.04
- Ubuntu ® 18.04 LTS
- CentOS 7.5
- CentOS 7.6
- SLES 12 SP3/SP4
- SLES 15
- Все текущие версии гипервизора ESXi
- ESXi 6.5.x
- ESXi 6.7.x
- Контроллер системы хранения:
- PERC H330 в режиме RAID или без RAID
Сводка. Для возникновения этой проблемы требуется определенная конфигурация.
- Сервер 14G AMD + ОС Linux + контроллер H330
- Сервер 14G AMD + ESXi + H330, настроенный как транзитный канал ввода-вывода VMDirectPath для виртуальной машины Linux
Какие продукты не затронуты?
- Платформы Intel 14G
- Любой контроллер системы хранения данных (HBA330/H730/H740/H840 и т. д.), кроме H330
- Операционные системы Windows
Cause
Корневая причина.
- Драйвер Linux AMD_IOMMU использует диапазон памяти BIOS, зарезервированный для H330 как для буфера данных ввода-вывода, так и для виртуального адреса ввода-вывода для доступа к разным участкам физической памяти, что приводит к повреждению файловой системы. Кроме того, таблица IVRS в BIOS содержит начальный адрес и длину диапазона исключения для H330. Пока драйвер AMD IOMMU настраивает диапазон исключения, драйвер добавляет начальный адрес и длину, предоставленные IVRS, чтобы получить конечный адрес, который он использует для программирования регистра ограничения диапазона исключений в IOMMU, но чтобы получить конечный адрес, он должен добавить длину к начальному адресу и вычесть единицу. В результате мы получаем диапазон исключений, исключающий одну дополнительную страницу после конца указанного в BIOS диапазона исключений. Если ядро использует этот дополнительный адрес страницы в качестве IOVA, то это приводит к повреждению данных.
- VMware/ESXi: Настройка виртуальной машины для использования контроллера H330 в режиме ввода-вывода VMDirectPath может привести к повреждению хранилища и памяти для указанной виртуальной машины
Resolution
- Техническим специалистам Dell известно об этой проблеме, и временное решение BIOS доступно в BIOS версии 1.8.7 или более поздней.
- Dell Technologies рекомендует обновить BIOS до версии 1.8.7 или более поздней.
- Кроме того, разработчики Linux и VMware работают над исправлением ядра. Как только обновленный пакет ядра будет доступен от поставщиков Linux и VMware, он может стать альтернативным решением этой проблемы. Dell старается отмечать здесь информацию об исправлениях от поставщиков Linux и VMware по мере их появления.
- Ссылка на базу знаний VMware: https://knowledge.broadcom.com/external/article?legacyId=68068
- Статья базы знаний Red Hat: https://access.redhat.com/solutions/3978031
(требуется вход)
- СТАТЬЯ ЗНАНИЙ SUSE: https://www.suse.com/support/kb/doc/?id=000019431
- Ссылка на базу знаний VMware: https://knowledge.broadcom.com/external/article?legacyId=68068
Affected Products
SUSE Linux Enterprise Server 12, PowerEdge R6415, PowerEdge R7415, PowerEdge R7425, PowerEdge RAID Controller H330, Red Hat Enterprise Linux Version 7, SUSE Linux Enterprise Server 15, VMware ESXi 6.5.X, VMware ESXi 6.7.XArticle Properties
Article Number: 000176953
Article Type: Solution
Last Modified: 01 Dec 2025
Version: 9
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.