跳转至主要内容
  • 快速、轻松地下订单
  • 查看订单并跟踪您的发货状态
  • 创建并访问您的产品列表
  • 使用“Company Administration”(公司管理),管理Dell EMC站点、产品和产品级联系人。

Dell PowerEdge 14G: ESXi geeft de foutmelding "Failed to initialize NVML: Unknown Error" met NVIDIA GPU

摘要: Om dit probleem op te lossen, moet u de instelling Memory Mapped I/O Base instellen op 512GB

本文可能已自动翻译。如果您对其质量有任何反馈,请使用此页面底部的表单告知我们。

文章内容


症状

Beschrijving

Bij het installeren van een NVIDIA GPU (bijv. M10) in een ondersteunde 14G-server (R740 en R740XD), kan na het installeren van de VIB-driver de volgende foutmelding verschijnen bij de poging om de nvidia-smi opdracht uit te voeren:

[root@localhost:~] nvidia-smi
Kan NVML niet initialiseren: Onbekende fout


SLN308065_en_US__1PSE2940error


In nvidia-bug-report.log worden gebeurtenissen van de volgende strekking weergegeven in het gedeelte /var/log/vmkernel.log:

2017-11-02T18:28:19.707Z cpu45:66263)NVRM: laden van NVIDIA UNIX x86_64 Kernel Module 384.73 ma 1 augustus 21 15:16:25 PDT 2017
2017-11-02T18:28:19.710Z cpu3:66145)NVRM: Dit is een 64-bits BALK die boven 16 TB door het systeem NVRM is
toegewezen: BIOS of de VMware ESXi-kernel. Deze PCI I/O-regio waaraan
NVRM is toegewezen: aan uw NVIDIA-apparaat wordt niet ondersteund door de kernel.
NVRM: BAR1 is 256 miljoen bij 0x382fe00$



 


Oplossing

Hardware werkt prima. U kunt dit probleem oplossen door de Memory Mapped I/O Base-instelling in te stellen op 512 GB (standaard is 56 TB) of 12 TB (als de server >512 GB RAM heeft): Dit probleem wordt beschreven in de gebruikershandleiding van de

SLN308065_en_US__2PSE2940biossetting


R740 hardware:

Memory Mapped I/O above 4 GB - Hiermee kunt u de ondersteuning voor de PCIe-apparaten die grote hoeveelheden geheugen nodig hebben in- of uitschakelen. Schakel deze optie alleen in voor 64-bits besturingssystemen. Deze optie is standaard ingeschakeld.

Memory Mapped I/O above Base - Indien ingesteld op 12 TB, zal het systeem MMIO-base toewijzen aan 12 TB. Schakel deze optie in voor een besturingssysteem waarvoor 44-bits PCIe-adressering vereist is.
Wanneer het systeem is ingesteld op 512 GB, zal het MMIO-basis toewijzen aan 512 GB en de maximale ondersteuning voor geheugen verminderen tot minder dan 512 GB. Schakel deze optie alleen in voor het 4 GPU DGMA-probleem . Deze optie is standaard ingesteld op 56 TB.

http://topics-cdn.dell.com/pdf/poweredge-r740_owner's%20manual_en-us.pdf (pagina 52)

 

SLN308065_en_US__3icon Houd er rekening mee dat hiermee het systeemgeheugen wordt beperkt tot 512GB (indien ingesteld op 512GB).

 

Nadat deze instelling is gewijzigd en het systeem opnieuw is opgestart, moet nvidia-smi iets doen wat lijkt op:

SLN308065_en_US__4PSE2940noerror

原因

-

解决方案

-

文章属性


受影响的产品

PowerEdge R740, PowerEdge R740XD, PowerEdge T640

上次发布日期

07 10月 2021

版本

4

文章类型

Solution