Zu den Hauptinhalten
  • Bestellungen schnell und einfach aufgeben
  • Bestellungen anzeigen und den Versandstatus verfolgen
  • Profitieren Sie von exklusiven Prämien und Rabatten für Mitglieder
  • Erstellen Sie eine Liste Ihrer Produkte, auf die Sie jederzeit zugreifen können.
  • Verwalten Sie mit der Unternehmensverwaltung Ihre Dell EMC Seiten, Produkte und produktspezifischen Kontakte.

Dell PowerEdge 14G: ESXi, NVidia GPU ile ilgili "Failed to initialize NVML: Unknown Error" (NVML başlatılamadı: Bilinmeyen Hata) mesajını gösteriyor

Zusammenfassung: Bu sorunu çözmek için Memory Mapped I/O Base (Belleğe Eşlenmiş G/Ç Taban Değeri) ayarını 512GB olarak belirleyin

Dieser Artikel wurde möglicherweise automatisch übersetzt. Wenn Sie eine Rückmeldung bezüglich dessen Qualität geben möchten, teilen Sie uns diese über das Formular unten auf dieser Seite mit.

Artikelinhalt


Symptome

Açıklama

Desteklenen bir 14G sunucuya (R740 ve R740XD)NVidia GPU (ör. M10) yüklemeye çalışırken, sürücü vib dosyasını yükledikten sonra nvidia-smi komutunu yürütmek istediğinizde aşağıdaki hata görüntülenebilir:

[root@localhost:~] nvidia-smi
NVML başlatılamadı: Bilinmeyen Hata


SLN308065_en_US__1PSE2940error


nvidia-bug-report.log dosyasının /var/log/vmkernel.log bölümünde aşağıdakilere benzer etkinlikler görülür:

2017-11-02T18:28:19.707Z cpu45:66263)NVRM: loading NVIDIA UNIX x86_64 Kernel Module 384.73 Mon Aug 21 15:16:25 PDT 2017
2017-11-02T18:28:19.710Z cpu3:66145)NVRM: This is a 64-bit BAR mapped above 16 TB by the system
NVRM: BIOS or the VMware ESXi kernel. This PCI I/O region assigned
NVRM: to your NVIDIA device is not supported by the kernel.
NVRM: BAR1 is 256M @ 0x382fe00$



 


Çözüm

Donanım düzgün çalışıyor. Bu sorunu çözmek için lütfen Memory Mapped I/O Base (Belleğe Eşlenmiş G/Ç Taban Değeri) ayarını 512GB (varsayılan 56TB'dir) veya 12TB (sunucunun RAM'i 512GB'den fazlaysa) olarak belirleyin:

SLN308065_en_US__2PSE2940biossetting


Bu sorun, R740 donanım kullanım kılavuzunda açıklanmıştır:

Memory Mapped I/O above 4 GB (4 GB'den yüksek Belleğe Eşlenmiş G/Ç) - Büyük miktarda belleğe ihtiyaç duyan PCle aygıtları için desteği etkinleştirir veya devre dışı bırakır. Bu seçeneği yalnızca 64 bit işletim sistemleri için etkinleştirin. Bu seçenek varsayılan olarak "Enabled" (Etkin) olarak ayarlanmıştır.

Memory Mapped I/O above Base (Taban Değerinin üzerinde Belleğe Eşlenmiş G/Ç) - 12 TB olarak ayarlandığında sistem, MMIO taban değerini 12 TB'ye eşler. 44 bit PCle adresi gerektiren bir işletim sistemi için bu seçeneği etkinleştirin.
512 GB olarak ayarlandığında sistem, MMIO taban değerini 512 GB olarak ayarlar ve maksimum bellek desteğini 512 GB altında bir değere düşürür. Bu seçeneği yalnızca 4 GPU DGMA sorunu için etkinleştirin. Bu seçenek varsayılan olarak 56 TB'ye ayarlıdır.

http://topics-cdn.dell.com/pdf/poweredge-r740_owner's%20manual_en-us.pdf (sayfa 52)

 

SLN308065_en_US__3icon Not: Bu işlem sistem belleğini 512 GB'ye sınırlar (512GB olarak ayarlandığında).

 

Bu ayar değiştirildiğinde ve sistem yeniden başlatıldığında nvidia-smi, aşağıdakine benzer bir ekran görüntülemelidir:

SLN308065_en_US__4PSE2940noerror

Ursache

-

Lösung

-

Artikeleigenschaften


Betroffenes Produkt

PowerEdge R740, PowerEdge R740XD, PowerEdge T640

Letztes Veröffentlichungsdatum

07 Okt. 2021

Version

4

Artikeltyp

Solution