PowerEdge: Possível corrupção de dados no R6415, R7415 e R7425 usando PERC H330 em execução no sistema operacional Linux
Summary: Este artigo discute os servidores AMD R7425, R6415, R7415 14G com sistema operacional Linux usando controladores H330 ou ESXi usando H330 configurados como passagem de E/S VMDirectPath para uma máquina virtual Linux com potencial para enfrentar corrupção de dados. ...
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
Nas seguintes condições, os dados podem ser corrompidos durante a execução de E/S pesada no armazenamento conectado aos controladores PERC H330 em um servidor PowerEdge baseado em AMD de 14ª geração:
- O H330 é instalado com um sistema operacional baseado em Linux com a função de tecnologia de virtualização de CPU (VT) ativada no BIOS do sistema
- Sistemas operacionais VMware/ESXi com controlador de armazenamento H330 configurado como um dispositivo de passagem de E/S VMDirectPath (passagem PCI) para uma máquina virtual (VM) Linux
- O risco de corrupção de dados só é exposto à VM que tem o H330 conectado como um dispositivo de passagem.
O que é afetado?
- Todos os servidores AMD da 14ª geração (processador único ou duplo)
- R6415
- R7415
- R7425
- Sistemas operacionais baseados em Linux, incluindo, mas não se limitando a
- Red Hat Enterprise Linux 7.5
- Red Hat Enterprise Linux 7.6
- Ubuntu 16.04
- Ubuntu® 18.04 LTS
- CentOS 7.5
- CentOS 7.6
- SLES 12 SP3/SP4
- SLES 15
- Todas as versões atuais do hypervisor ESXi
- ESXi 6.5.x
- ESXi 6.7.x
- Controlador de armazenamento:
- PERC H330 no modo RAID ou não RAID
Resumo: Uma configuração específica é necessária para identificar esse problema.
- Servidor AMD de 14ª geração + sistema operacional Linux + controlador H330
- Servidor AMD de 14ª geração + ESXi + H330 configurados como passagem de E/S VMDirectPath para uma VM Linux
O que não é afetado?
- Plataformas Intel de 14ª geração
- Qualquer controlador de armazenamento (HBA330/H730/H740/H840 e assim por diante) diferente de H330
- Sistemas operacionais Windows
Cause
Causa raiz:
- O driver Linux AMD_IOMMU usa o mesmo intervalo de memória do BIOS reservado para H330 como buffer de dados de E/S e endereço virtual de E/S para acessar uma área de memória física diferente, resultando em corrupção do sistema de arquivos. Além disso, a tabela IVRS no BIOS fornece o endereço inicial e o comprimento do intervalo de exclusão para o H330. Enquanto o driver AMD IOMMU está configurando o intervalo de exclusão, o driver está adicionando o endereço inicial e o comprimento fornecidos pelo IVRS para obter o endereço final que ele usa para programar o registro de limite do intervalo de exclusão no IOMMU, mas para obter o endereço final, ele deve adicionar o comprimento ao endereço inicial e subtrair um, o que resulta na exclusão de um intervalo de exclusão de uma página a mais após o final do intervalo de exclusão especificado pelo BIOS. Se o Kernel usar esse endereço de página extra como IOVA, isso levará à corrupção dos dados.
- VMware/ESXi: Configurar uma VM para usar o controlador H330 em um modo de E/S VMDirectPath pode resultar em armazenamento e corrupção de memória da VM em questão
Resolution
- A engenharia da Dell está ciente do problema e uma solução temporária do BIOS é disponibilizada com a versão do BIOS 1.8.7 ou mais recente.
- A Dell Technologies recomenda atualizar o BIOS para a versão 1.8.7 ou posterior.
- Uma correção de kernel também está em andamento por fornecedores Linux e VMware. Uma vez que um pacote de kernel atualizado está disponível nos fornecedores Linux e da VMware, ele pode fornecer uma solução alternativa para esse problema. A Dell tenta anotar informações sobre as correções de fornecedores Linux e VMware aqui à medida que elas se tornam disponíveis.
- Link da KB da VMware: https://knowledge.broadcom.com/external/article?legacyId=68068
- Red Hat KB: https://access.redhat.com/solutions/3978031
(requer login)
- SUSE KB: https://www.suse.com/support/kb/doc/?id=000019431
- Link da KB da VMware: https://knowledge.broadcom.com/external/article?legacyId=68068
Affected Products
SUSE Linux Enterprise Server 12, PowerEdge R6415, PowerEdge R7415, PowerEdge R7425, PowerEdge RAID Controller H330, Red Hat Enterprise Linux Version 7, SUSE Linux Enterprise Server 15, VMware ESXi 6.5.X, VMware ESXi 6.7.XArticle Properties
Article Number: 000176953
Article Type: Solution
Last Modified: 01 Dec 2025
Version: 9
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.