PowerEdge:使用執行 Linux 作業系統的 PERC H330 時,R6415、R7415 和 R7425 可能會導致資料損毀

Summary: 本文探討 R7425、R6415、R7415 14G AMD 伺服器,其 Linux 作業系統使用 H330 控制器,或 ESXi 使用 H330,設定為 VMDirectPath I/O 傳遞至可能發生資料損毀的 Linux 虛擬機器。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

在下列情況下,在第 14 代 PowerEdge AMD 型伺服器上,在連接至 PERC H330 控制器的儲存裝置上執行大量 I/O 時,可能會發生資料損毀: 

  • H330 與 Linux 型作業系統一起安裝,且在系統 BIOS 中啟用了 CPU 虛擬化技術 (VT) 功能
  • VMware 作業系統/具備 H330 儲存控制器的 ESXi 設定為 VMDirectPath I/O 傳遞裝置 (PCI-Passthrough) 至 Linux 虛擬機器 (VM)
    • 資料損毀的風險僅會發生於連接 H330 作為傳遞裝置的 VM。   

哪些裝置受到影響? 

  • 所有 14G AMD 伺服器 (單處理器或雙處理器)
    • R6415
    • R7415
    • R7425
  • Linux 型作業系統,包括但不限於
    • Red Hat Enterprise Linux 7.5
    • Red Hat Enterprise Linux 7.6
    • Ubuntu 16.04
    • Ubuntu ® 18.04 LTS
    • CentOS 7.5
    • CentOS 7.6
    • SLES 12 SP3/SP4
    • SLES 15
  • 所有現行版本的 ESXi Hypervisor
    • ESXi 6.5.x
    • ESXi 6.7.x
  • 儲存裝置控制器:
    • RAID 或非 RAID 模式的 PERC H330

摘要:需要特定組態才能遇到此問題。

  1. 14G AMD 伺服器 + Linux OS + H330 控制器 
  2. 14G AMD 伺服器 + ESXi + 設定為 VMDirectPath I/O 傳遞至 Linux VM 的 H330

 

哪些裝置不受影響

  • 14G Intel 平台
  • H330 以外的所有儲存裝置控制器 (HBA330/H730/H740/H840 等)
  • Windows 作業系統

Cause

根本原因:

  • Linux AMD_IOMMU 驅動程式使用與 BIOS 為 H330 保留的相同記憶體範圍,該範圍用於 I/O 資料緩充區和 I/O 虛擬位址存取不同的實體記憶體區域,導致檔案系統損毀。此外,BIOS 中的 IVRS 表提供 H330 排除範圍的起始位址和長度。當 AMD IOMMU 驅動程式設置排除範圍時,驅動程式正在添加 IVRS 提供的起始位址和長度,以獲取它用於在 IOMMU 中程式設計排除範圍限制寄存器的結束位址,但若要獲取結束位址,它應該將長度添加到起始位址並減去 1, 這會導致排除範圍超出 BIOS 指定排除範圍結束的頁面。如果核心使用這個額外的頁面位址作為 IOVA,則會導致資料損毀。
  • VMware/ESXi:若在 VMDirectPath I/O 模式中設定 VM 使用 H330 控制器,可能會導致上述 VM 的儲存裝置和記憶體損毀

Resolution

  1. Dell 工程部門正在調查此問題,並已於 BIOS 1.8.7 或更新版本中提供 BIOS 因應措施。
  2. Dell Technologies 建議您將 BIOS 更新至 1.8.7 或更新版本。
  3. Linux 廠商和 VMware 也正在進行核心修正。當 Linux 廠商和 VMware 提供核心套件更新時,可能會提供此問題的不同解決方案。當 Linux 廠商和 VMware 的修正程式可用時,Dell 會嘗試在此記下相關資訊。


回到頁首


 
 

Affected Products

SUSE Linux Enterprise Server 12, PowerEdge R6415, PowerEdge R7415, PowerEdge R7425, PowerEdge RAID Controller H330, Red Hat Enterprise Linux Version 7, SUSE Linux Enterprise Server 15, VMware ESXi 6.5.X, VMware ESXi 6.7.X
Article Properties
Article Number: 000176953
Article Type: Solution
Last Modified: 01 Dec 2025
Version:  9
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.