Zu den Hauptinhalten
  • Bestellungen schnell und einfach aufgeben
  • Bestellungen anzeigen und den Versandstatus verfolgen
  • Profitieren Sie von exklusiven Prämien und Rabatten für Mitglieder
  • Erstellen Sie eine Liste Ihrer Produkte, auf die Sie jederzeit zugreifen können.
  • Verwalten Sie mit der Unternehmensverwaltung Ihre Dell EMC Seiten, Produkte und produktspezifischen Kontakte.

Dell PowerEdge 14G: ESXi restituisce "Failed to initialize NVML: Unknown Error" con GPU NVIDIA

Zusammenfassung: Per risolvere questo problema, impostare Memory Mapped I/O Base su 512GB

Dieser Artikel wurde möglicherweise automatisch übersetzt. Wenn Sie eine Rückmeldung bezüglich dessen Qualität geben möchten, teilen Sie uns diese über das Formular unten auf dieser Seite mit.

Artikelinhalt


Symptome

Descrizione

Quando si tenta di installare una GPU NVIDIA (ad es. M10) in un server 14G supportato (R740 e R740XD), dopo l'installazione del file VIB del driver, è possibile che venga visualizzato il seguente messaggio di errore quando si tenta di eseguire il comando nvidia-smi:

[root@localhost:~] nvidia-smi
Failed to initialize NVML: Errore sconosciuto


SLN308065_en_US__1PSE2940error


Nel file nvidia-bug-report.log, eventi simili ai seguenti vengono visualizzati nella sezione /var/log/vmkernel.log:

2017-11-02T18:28:19.707Z cpu45:66263)NVRM: caricamento NVIDIA UNIX x86_64 Kernel Module 384.73 lun ago 21 15:16:25 PDT 2017
2017-11-02T18:28:19.710Z cpu3:66145)NVRM: Si tratta di una BARRA a 64 bit mappata sopra 16 TB dal sistema
NVRM: BIOS o kernel VMware ESXi. Questa area PCI I/O assegnata
NVRM: al dispositivo NVIDIA non è supportata dal kernel.
NVRM ( NVRM) BAR1 equivale a 256 milioni a 0x382fe00$



 


Soluzione

L'hardware funziona correttamente. Per risolvere questo problema, impostare Memory Mapped I/O Base su 512 GB (l'impostazione predefinita è 56 TB) o 12 TB (se il server dispone di >512 GB di RAM):

SLN308065_en_US__2PSE2940biossetting


questo problema è documentato nel manuale del proprietario dell'hardware R740:

Memory Mapped I/O above 4 GB: abilita o disabilita il supporto per i dispositivi PCIe che richiedono grandi quantità di memoria. Abilitare questa opzione solo per i sistemi operativi a 64 bit. Questa opzione è impostata su Enabled per impostazione predefinita.

Memory Mapped I/O above Base: se è impostata su 12TB, il sistema eseguirà il mapping dell'I/O mappato alla memoria di base a 12 TB. Abilitare questa opzione per un sistema operativo che richiede l'indirizzamento PCIe a 44 bit.
Quando è impostata su 512 GB, il sistema eseguirà il mapping della base MMIO a 512 GB e ridurrà il supporto massimo per la memoria a meno di 512 GB. Abilitare questa opzione solo per il problema 4 GPU DGMA. Questa opzione è impostata su 56TB per impostazione predefinita.

http://topics-cdn.dell.com/pdf/poweredge-r740_owner's%20manual_en-us.pdf (pagina 52)

 

SLN308065_en_US__3icon Nota: la memoria di sistema sarà limitata a 512 GB (se impostata su 512GB).

 

Una volta modificata questa impostazione e riavviato il sistema, nvidia-smi dovrebbe generare un output simile a:

SLN308065_en_US__4PSE2940noerror

Ursache

-

Lösung

-

Artikeleigenschaften


Betroffenes Produkt

PowerEdge R740, PowerEdge R740XD, PowerEdge T640

Letztes Veröffentlichungsdatum

07 Okt. 2021

Version

4

Artikeltyp

Solution