跳转至主要内容
  • 快速、轻松地下订单
  • 查看订单并跟踪您的发货状态
  • 创建并访问您的产品列表
  • 使用“Company Administration”(公司管理),管理Dell EMC站点、产品和产品级联系人。

Dell PowerEdge 14G: ESXi returnerer "Kan ikke initialisere NVML: Ukendt fejl" med NVidia GPU

摘要: For at løse dette problem skal du angive indstillingen for hukommelsestilknyttet I/O-basis til 512 GB

本文可能已自动翻译。如果您对其质量有任何反馈,请使用此页面底部的表单告知我们。

文章内容


症状

Beskrivelse

Når du forsøger at installere en NVidia GPU (f.eks. M10) i en understøttet 14G-server (R740 og R740XD), efter at du har installeret VIB-driveren, kan følgende fejl opstå, når du forsøger at udføre kommandoen nvidia-smi:

[root@localhost:~] nvidia-smi
kunne ikke initialisere NVML: Ukendt fejl


SLN308065_en_US__1PSE2940error


I nvidia-bug-report.log vises hændelserne i stil med følgende i sektionen /var/log/vmkernel.log:

2017-11-02T18:28:19.707Z cpu45:66263)NVRM: indlæsning af NVIDIA UNIX x86_64 Kernel Module 384.73 Mon Aug 21 15:16:25 PDT 2017
2017-11-02T18:28:19.710Z cpu3:66145)NVRM: Dette er en 64-bit bar tilknyttet over 16 TB af systemets
NVRM: BIOS eller VMware ESXi-kernen. Dette PCI I/O-område er tildelt
NVRM: til din NVIDIA-enhed understøttes ikke af kernen.
NVRM: BAR1 er 256M ved 0x382fe00 USD



 


Løsning

Hardwaren fungerer fint. For at løse dette problem skal du indstille indstillingen for hukommelsestilknyttet I/O-basis til 512 GB (standard er 56 TB) eller 12 TB (hvis serveren har >512 GB RAM):

SLN308065_en_US__2PSE2940biossetting


Dette problem er dokumenteret i brugervejledningen til R740-hardwaren:

Hukommelsestilknyttet I/O over 4 GB - Aktiverer eller deaktiverer understøttelsen af PCIe-enheder, der har brug for store mængder hukommelse. Aktiver kun denne indstilling på 64-bit operativsystemer. Denne indstilling er som standard aktiveret.

Hukommelsestilknyttet I/O over basis – Når den er indstillet til 12 TB, angiver systemet MMIO-basen til 12 TB. Aktiver denne indstilling for et operativsystem, der kræver 44-bit PCIe-adressering.
Når den er indstillet til 512 GB, angiver systemet MMIO-basen til 512 GB og reducerer den maksimale understøttelse af hukommelsen til mindre end 512 GB. Aktiver kun denne indstilling for 4 GPU DGMA-problemet. Denne indstilling er som standard angivet til 56 TB.

http://topics-cdn.dell.com/pdf/poweredge-r740_owner's%20manual_en-us.pdf (side 52)

 

SLN308065_en_US__3icon Bemærk , at dette begrænser systemhukommelsen til 512 GB (hvis den er indstillet til 512 GB).

 

Når denne indstilling ændres, og systemet er genstartes, bør nvidia-smi generere noget i stil med:

SLN308065_en_US__4PSE2940noerror

原因

解决方案

文章属性


受影响的产品

PowerEdge R740, PowerEdge R740XD, PowerEdge T640

上次发布日期

07 10月 2021

版本

4

文章类型

Solution