Zu den Hauptinhalten
  • Bestellungen schnell und einfach aufgeben
  • Bestellungen anzeigen und den Versandstatus verfolgen
  • Profitieren Sie von exklusiven Prämien und Rabatten für Mitglieder
  • Erstellen Sie eine Liste Ihrer Produkte, auf die Sie jederzeit zugreifen können.
  • Verwalten Sie mit der Unternehmensverwaltung Ihre Dell EMC Seiten, Produkte und produktspezifischen Kontakte.

Dell PowerEdge 14G : ESXi renvoie le message d’erreur « Failed to Initialize NVML: Unknown Error » avec un processeur graphique Nvidia

Zusammenfassung: Pour résoudre ce problème, définissez le paramètre Memory Mapped I/O Base sur une valeur de 512 Go

Dieser Artikel wurde möglicherweise automatisch übersetzt. Wenn Sie eine Rückmeldung bezüglich dessen Qualität geben möchten, teilen Sie uns diese über das Formular unten auf dieser Seite mit.

Artikelinhalt


Symptome

Description

Lors de la tentative d’installation d’un processeur graphique Nvidia (p. ex. M10) sur un serveur 14G (R740 et R740XD) pris en charge, il est possible que l’erreur suivante s’affiche lorsque vous tentez d’exécuter la commande nvidia-smi après l’installation du pilote vib :

[root@localhost:~] nvidia-smi
Failed to initialize NVML: Unknown Error


SLN308065_en_US__1PSE2940error


La section /var/log/vmkernel.log du fichier nvidia-bug-report.log indique des événements semblables à ce qui suit :

2017-11-02T18:28:19.707Z cpu45:66263)NVRM: loading NVIDIA UNIX x86_64 Kernel Module  384.73  Mon Aug 21 15:16:25 PDT 2017
2017-11-02T18:28:19.710Z cpu3:66145)NVRM: This is a 64-bit BAR mapped above 16 TB by the system
NVRM: BIOS or the VMware ESXi kernel. This PCI I/O region assigned
NVRM: to your NVIDIA device is not supported by the kernel.
NVRM: BAR1 is 256M @ 0x382fe00$



 


Solution

Le matériel fonctionne correctement. Pour résoudre ce problème, définissez le paramètre Memory Mapped I/O Base sur 512 Go (la valeur par défaut est 56 To) ou 12 To (si le serveur dispose de plus de 512 Go de RAM) :

SLN308065_en_US__2PSE2940biossetting


Ce problème est détaillé dans le manuel d’utilisation du matériel R740 :

Memory Mapped I/O above 4 GB : permet d’activer ou de désactiver la prise en charge des périphériques PCIe qui nécessitent de grandes quantités de mémoire. Activez cette option uniquement pour les systèmes d’exploitation 64 bits. Cette option est activée par défaut.

Memory Mapped I/O above Base : lorsque ce paramètre est défini sur une valeur de 12 To, le système mappe la base MMIO à 12 To. Activez cette option pour un système d’exploitation qui nécessite un adressage PCIe de 44 bits.
Lorsqu’il est défini sur 512 Go, le système mappe la base MMIO à 512 Go et réduit la prise en charge maximale de la mémoire à moins de 512 Go. Activez cette option uniquement pour la version DGMA à 4 processeurs graphiques. Par défaut, cette option est définie sur 56 To.

http://topics-cdn.dell.com/pdf/poweredge-r740_owner's%20manual_en-us.pdf (page 52)

 

SLN308065_en_US__3icon Notez que cela limite la mémoire système à 512 Go (si ce paramètre est défini sur 512 Go).

 

Une fois que ce paramètre a été modifié et que le système a redémarré, la commande nvidia-smi doit retourner un résultat semblable à celui-ci :

SLN308065_en_US__4PSE2940noerror

Ursache

-

Lösung

-

Artikeleigenschaften


Betroffenes Produkt

PowerEdge R740, PowerEdge R740XD, PowerEdge T640

Letztes Veröffentlichungsdatum

07 Okt. 2021

Version

4

Artikeltyp

Solution