跳转至主要内容
  • 快速、轻松地下订单
  • 查看订单并跟踪您的发货状态
  • 创建并访问您的产品列表
  • 使用“Company Administration”(公司管理),管理Dell EMC站点、产品和产品级联系人。

Dell PowerEdge 14G: ESXi näyttää Failed to initialize NVML: Unknown Error -virheilmoituksen NVidia-näytönohjaimella

摘要: Ongelman voi ratkaista asettamalla Memory Mapped I/O Base -asetukseksi 512GB

本文可能已自动翻译。如果您对其质量有任何反馈,请使用此页面底部的表单告知我们。

文章内容


症状

Kuvaus

Kun tuettuun 14. sukupolven palvelimeen (R740 ja R740XD) yritetään asentaa NVidia-näytönohjainta (esim. M10), vib-ohjaintiedoston asentamisen jälkeen saattaa näkyä seuraava virheilmoitus, kun nvidia-smi-komentoa yritetään suorittaa:

[root@localhost:~] nvidia-smi
Failed to initialize NVML: Unknown Error


SLN308065_en_US__1PSE2940error


nvidia-bug-report.log-tiedoston /var/log/vmkernel.log-osiossa saattaa näkyä seuraavankaltaisia tapahtumia:

2017-11-02T18:28:19.707Z cpu45:66263)NVRM: loading NVIDIA UNIX x86_64 Kernel Module  384.73  Mon Aug 21 15:16:25 PDT 2017
2017-11-02T18:28:19.710Z cpu3:66145)NVRM: This is a 64-bit BAR mapped above 16 TB by the system
NVRM: BIOS or the VMware ESXi kernel. This PCI I/O region assigned
NVRM: to your NVIDIA device is not supported by the kernel.
NVRM: BAR1 is 256M @ 0x382fe00$



 


Ratkaisu

Laitteisto toimii oikein. Ratkaise ongelma asettamalla Memory Mapped I/O Base -asetuksen arvoksi 512GB (oletus on 56TB) tai 12TB (jos palvelimessa on yli 512 Gt RAM-muistia):

SLN308065_en_US__2PSE2940biossetting


Ongelma on kuvattu R740-laitteiston käyttöoppaassa:

Memory Mapped I/O above 4 GB – Ottaa käyttöön tai poistaa käytöstä tuen PCIe-laitteille, jotka tarvitsevat paljon muistia. Ota asetus käyttöön vain 64-bittisissä käyttöjärjestelmissä. Tämä vaihtoehto on oletusarvoisesti käytössä.

Memory Mapped I/O above Base – Kun asetuksena 12TB, järjestelmä määrittää MMIO-perusarvoksi 12 Tt. Ota asetus käyttöön käyttöjärjestelmässä, joka edellyttää 44-bittistä PCIe-osoitteenmääritystä.
Kun asetuksena on 512GB, järjestelmä määrittää MMIO-perusarvoksi 512 Gt ja vähentää muistin tuen enimmäisarvon alle 512 gigatavuun. Ota asetus käyttöön vain neljän näytönohjaimen DGMA-ongelmatapauksessa. Tämä vaihtoehdon oletusarvona on 56TB.

http://topics-cdn.dell.com/pdf/poweredge-r740_owner's%20manual_en-us.pdf (sivu 52, englanninkielinen)

 

SLN308065_en_US__3icon Huomaa, että tämä rajoittaa järjestelmämuistin määrän 512 gigatavuun (jos asetus on 512GB).

 

Kun asetusta on muutettu ja järjestelmä on käynnistetty uudelleen, nvidia-smi-komennon tuloksen tulisi olla jokseenkin seuraavanlainen:

SLN308065_en_US__4PSE2940noerror

原因

-

解决方案

-

文章属性


受影响的产品

PowerEdge R740, PowerEdge R740XD, PowerEdge T640

上次发布日期

07 10月 2021

版本

4

文章类型

Solution