Zu den Hauptinhalten
  • Bestellungen schnell und einfach aufgeben
  • Bestellungen anzeigen und den Versandstatus verfolgen
  • Profitieren Sie von exklusiven Prämien und Rabatten für Mitglieder
  • Erstellen Sie eine Liste Ihrer Produkte, auf die Sie jederzeit zugreifen können.
  • Verwalten Sie mit der Unternehmensverwaltung Ihre Dell EMC Seiten, Produkte und produktspezifischen Kontakte.

Dell PowerEdge 14G: ESXi muestra el mensaje “Failed to initialize NVML: Unknown Error” con GPU NVidia

Zusammenfassung: Para resolver este problema, establezca el ajuste de Memory Mapped I/O Base en 512GB.

Dieser Artikel wurde möglicherweise automatisch übersetzt. Wenn Sie eine Rückmeldung bezüglich dessen Qualität geben möchten, teilen Sie uns diese über das Formular unten auf dieser Seite mit.

Artikelinhalt


Symptome

Descripción

Cuando se intenta instalar una GPU NVIDIA (por ejemplo, M10) en un servidor 14G compatible (R740 y R740XD), después de instalar el VIB del controlador, puede aparecer el siguiente error al intentar ejecutar el comando nvidia-smi:

[root@localhost:~] nvidia-smi
No se pudo inicializar NVML: Error desconocido


SLN308065_en_US__1PSE2940error


En el archivo nvidia-bug-report.log, los eventos similares al siguiente se muestran en la sección /var/log/vmkernel.log:

2017-11-02T18:28:19.707Z cpu45:66263)NVRM: loading NVIDIA UNIX x86_64 Kernel Module  384.73  Mon Aug 21 15:16:25 PDT 2017
2017-11-02T18:28:19.710Z cpu3:66145)NVRM: Esta es una BARRA de 64 bits asignada por encima de los 16 TB por el sistema
NVRM: BIOS o el VMware ESXi kernel. NVRM asignada a esta región de I/O de
PCI: al dispositivo NVIDIA no soporta el kernel.
NVRM: BAR1 es 256M @ 0x382fe00$



 


Solución

El hardware funciona correctamente. Para resolver este problema, establezca el ajuste Memory Mapped I/O Base en 512 GB (el valor predeterminado es 56 TB) o 12 TB (si el servidor tiene >512 GB de RAM):

SLN308065_en_US__2PSE2940biossetting


Este problema está documentado en el manual del propietario del hardware de R740:

Memory Mapped I/O above 4GB: activa o desactiva la compatibilidad con los dispositivos PCIe que necesitan grandes cantidades de memoria. Active esta opción solo para los sistemas operativos de 64 bits. Esta opción está establecida en Enabled de manera predeterminada.

Memory Mapped I/O Base: cuando esta opción está establecida en 12TB, el sistema asigna la base de MMIO en 12 TB. Active esta opción en un sistema operativo que requiera el direccionamiento de PCIe de 44 bits.
Cuando se establece en 512 GB, el sistema asigna la base de MMIO en 512 GB y reduce el soporte máximo de la memoria a menos de 512 GB. Active esta opción solo para el problema de 4 GPU de DGMA. Esta opción está establecida en 56TB de manera predeterminada.

http://topics-cdn.dell.com/pdf/poweredge-r740_owner's%20manual_en-us.pdf (página 52)

 

SLN308065_en_US__3icon Tenga en cuenta que esto limitará la memoria del sistema a 512 GB (si se establece en 512 GB).

 

Una vez que se cambie este ajuste y se reinicie el sistema, el comando nvidia-smi debería generar un resultado similar al siguiente:

SLN308065_en_US__4PSE2940noerror

Ursache

-

Lösung

-

Artikeleigenschaften


Betroffenes Produkt

PowerEdge R740, PowerEdge R740XD, PowerEdge T640

Letztes Veröffentlichungsdatum

07 Okt. 2021

Version

4

Artikeltyp

Solution