Zu den Hauptinhalten
  • Bestellungen schnell und einfach aufgeben
  • Bestellungen anzeigen und den Versandstatus verfolgen
  • Profitieren Sie von exklusiven Prämien und Rabatten für Mitglieder
  • Erstellen Sie eine Liste Ihrer Produkte, auf die Sie jederzeit zugreifen können.
  • Verwalten Sie mit der Unternehmensverwaltung Ihre Dell EMC Seiten, Produkte und produktspezifischen Kontakte.

Dell PowerEdge 14G: ESXi geeft de foutmelding "Failed to initialize NVML: Unknown Error" met NVIDIA GPU

Zusammenfassung: Om dit probleem op te lossen, moet u de instelling Memory Mapped I/O Base instellen op 512GB

Dieser Artikel wurde möglicherweise automatisch übersetzt. Wenn Sie eine Rückmeldung bezüglich dessen Qualität geben möchten, teilen Sie uns diese über das Formular unten auf dieser Seite mit.

Artikelinhalt


Symptome

Beschrijving

Bij het installeren van een NVIDIA GPU (bijv. M10) in een ondersteunde 14G-server (R740 en R740XD), kan na het installeren van de VIB-driver de volgende foutmelding verschijnen bij de poging om de nvidia-smi opdracht uit te voeren:

[root@localhost:~] nvidia-smi
Kan NVML niet initialiseren: Onbekende fout


SLN308065_en_US__1PSE2940error


In nvidia-bug-report.log worden gebeurtenissen van de volgende strekking weergegeven in het gedeelte /var/log/vmkernel.log:

2017-11-02T18:28:19.707Z cpu45:66263)NVRM: laden van NVIDIA UNIX x86_64 Kernel Module 384.73 ma 1 augustus 21 15:16:25 PDT 2017
2017-11-02T18:28:19.710Z cpu3:66145)NVRM: Dit is een 64-bits BALK die boven 16 TB door het systeem NVRM is
toegewezen: BIOS of de VMware ESXi-kernel. Deze PCI I/O-regio waaraan
NVRM is toegewezen: aan uw NVIDIA-apparaat wordt niet ondersteund door de kernel.
NVRM: BAR1 is 256 miljoen bij 0x382fe00$



 


Oplossing

Hardware werkt prima. U kunt dit probleem oplossen door de Memory Mapped I/O Base-instelling in te stellen op 512 GB (standaard is 56 TB) of 12 TB (als de server >512 GB RAM heeft): Dit probleem wordt beschreven in de gebruikershandleiding van de

SLN308065_en_US__2PSE2940biossetting


R740 hardware:

Memory Mapped I/O above 4 GB - Hiermee kunt u de ondersteuning voor de PCIe-apparaten die grote hoeveelheden geheugen nodig hebben in- of uitschakelen. Schakel deze optie alleen in voor 64-bits besturingssystemen. Deze optie is standaard ingeschakeld.

Memory Mapped I/O above Base - Indien ingesteld op 12 TB, zal het systeem MMIO-base toewijzen aan 12 TB. Schakel deze optie in voor een besturingssysteem waarvoor 44-bits PCIe-adressering vereist is.
Wanneer het systeem is ingesteld op 512 GB, zal het MMIO-basis toewijzen aan 512 GB en de maximale ondersteuning voor geheugen verminderen tot minder dan 512 GB. Schakel deze optie alleen in voor het 4 GPU DGMA-probleem . Deze optie is standaard ingesteld op 56 TB.

http://topics-cdn.dell.com/pdf/poweredge-r740_owner's%20manual_en-us.pdf (pagina 52)

 

SLN308065_en_US__3icon Houd er rekening mee dat hiermee het systeemgeheugen wordt beperkt tot 512GB (indien ingesteld op 512GB).

 

Nadat deze instelling is gewijzigd en het systeem opnieuw is opgestart, moet nvidia-smi iets doen wat lijkt op:

SLN308065_en_US__4PSE2940noerror

Ursache

-

Lösung

-

Artikeleigenschaften


Betroffenes Produkt

PowerEdge R740, PowerEdge R740XD, PowerEdge T640

Letztes Veröffentlichungsdatum

07 Okt. 2021

Version

4

Artikeltyp

Solution