跳转至主要内容
  • 快速、轻松地下订单
  • 查看订单并跟踪您的发货状态
  • 创建并访问您的产品列表
  • 使用“Company Administration”(公司管理),管理Dell EMC站点、产品和产品级联系人。

Dell PowerEdge 14G: Systém ESXi s grafickou kartou Nvidia zobrazuje chybu „Failed to initialize NVML: Unknown Error“

摘要: Chcete-li tento problém vyřešit, nastavte možnost Memory Mapped I/O Base setting na hodnotu 512 GB

本文可能已自动翻译。如果您对其质量有任何反馈,请使用此页面底部的表单告知我们。

文章内容


症状

Popis

Při pokusu o instalaci grafické karty NVIDIA (např. M10) do podporovaného serveru 14G (R740 a R740XD) se po instalaci souboru vib ovladače může zobrazit následující chyba při pokusu o spuštění příkazu nvidia-smi:

[root@localhost:~] nvidia-smi
Failed to initialize NVML: Unknown Error


SLN308065_en_US__1PSE2940error


V protokolu nvidia-bug-report.log se v části /var/log/vmkernel.log zobrazí události podobné následujícím:

2017-11-02T18:28:19.707Z cpu45:66263)NVRM: loading NVIDIA UNIX x86_64 Kernel Module  384.73  Mon Aug 21 15:16:25 PDT 2017
2017-11-02T18:28:19.710Z cpu3:66145)NVRM: This is a 64-bit BAR mapped above 16 TB by the system
NVRM: BIOS or the VMware ESXi kernel. This PCI I/O region assigned
NVRM: to your NVIDIA device is not supported by the kernel.
NVRM: BAR1 is 256M @ 0x382fe00$



 


Řešení

Hardware pracuje správně. Chcete-li tento problém vyřešit, nastavte možnost Memory Mapped I/O Base na hodnotu 512GB (výchozí hodnota je 56TB) nebo 12TB (pokud má server více než 512 GB RAM):

SLN308065_en_US__2PSE2940biossetting


Tento problém je zdokumentován v uživatelské příručce k hardwaru R740:

Memory Mapped I/O above 4 GB – Povolí nebo zakáže podporu zařízení PCIe, která potřebují velké množství paměti. Tuto možnost povolte pouze pro 64bitové operační systémy. Tato možnost je ve výchozím nastavení nastavena na hodnotu Enabled.

Memory Mapped I/O above Base – Při nastavení na 12 TB systém namapuje základnu MMIO na 12 TB. Tuto možnost povolte u operačního systému, který vyžaduje 44bitové adresování PCIe.
Při nastavení na 512 GB systém namapuje základnu MMIO na 512 GB a sníží maximální podporu paměti na méně než 512 GB. Tuto možnost povolte pouze při problému DGMA se 4 grafickými kartami. Tato možnost je ve výchozím nastavení nastavena na hodnotu 56 TB.

http://topics-cdn.dell.com/pdf/poweredge-r740_owner's%20manual_en-us.pdf (strana 52)

 

SLN308065_en_US__3icon Upozorňujeme, že tím se omezí velikost systémové paměti na 512 GB (je-li nastavena na 512 GB).

 

Po změně tohoto nastavení a restartování systému by měl příkaz nvidia-smi vygenerovat podobný výstup:

SLN308065_en_US__4PSE2940noerror

原因

-

解决方案

-

文章属性


受影响的产品

PowerEdge R740, PowerEdge R740XD, PowerEdge T640

上次发布日期

07 10月 2021

版本

4

文章类型

Solution