跳转至主要内容
  • 快速、轻松地下订单
  • 查看订单并跟踪您的发货状态
  • 创建并访问您的产品列表
  • 使用“Company Administration”(公司管理),管理Dell EMC站点、产品和产品级联系人。

Dell PowerEdge 14G: ESXi, NVidia GPU ile ilgili "Failed to initialize NVML: Unknown Error" (NVML başlatılamadı: Bilinmeyen Hata) mesajını gösteriyor

摘要: Bu sorunu çözmek için Memory Mapped I/O Base (Belleğe Eşlenmiş G/Ç Taban Değeri) ayarını 512GB olarak belirleyin

本文可能已自动翻译。如果您对其质量有任何反馈,请使用此页面底部的表单告知我们。

文章内容


症状

Açıklama

Desteklenen bir 14G sunucuya (R740 ve R740XD)NVidia GPU (ör. M10) yüklemeye çalışırken, sürücü vib dosyasını yükledikten sonra nvidia-smi komutunu yürütmek istediğinizde aşağıdaki hata görüntülenebilir:

[root@localhost:~] nvidia-smi
NVML başlatılamadı: Bilinmeyen Hata


SLN308065_en_US__1PSE2940error


nvidia-bug-report.log dosyasının /var/log/vmkernel.log bölümünde aşağıdakilere benzer etkinlikler görülür:

2017-11-02T18:28:19.707Z cpu45:66263)NVRM: loading NVIDIA UNIX x86_64 Kernel Module 384.73 Mon Aug 21 15:16:25 PDT 2017
2017-11-02T18:28:19.710Z cpu3:66145)NVRM: This is a 64-bit BAR mapped above 16 TB by the system
NVRM: BIOS or the VMware ESXi kernel. This PCI I/O region assigned
NVRM: to your NVIDIA device is not supported by the kernel.
NVRM: BAR1 is 256M @ 0x382fe00$



 


Çözüm

Donanım düzgün çalışıyor. Bu sorunu çözmek için lütfen Memory Mapped I/O Base (Belleğe Eşlenmiş G/Ç Taban Değeri) ayarını 512GB (varsayılan 56TB'dir) veya 12TB (sunucunun RAM'i 512GB'den fazlaysa) olarak belirleyin:

SLN308065_en_US__2PSE2940biossetting


Bu sorun, R740 donanım kullanım kılavuzunda açıklanmıştır:

Memory Mapped I/O above 4 GB (4 GB'den yüksek Belleğe Eşlenmiş G/Ç) - Büyük miktarda belleğe ihtiyaç duyan PCle aygıtları için desteği etkinleştirir veya devre dışı bırakır. Bu seçeneği yalnızca 64 bit işletim sistemleri için etkinleştirin. Bu seçenek varsayılan olarak "Enabled" (Etkin) olarak ayarlanmıştır.

Memory Mapped I/O above Base (Taban Değerinin üzerinde Belleğe Eşlenmiş G/Ç) - 12 TB olarak ayarlandığında sistem, MMIO taban değerini 12 TB'ye eşler. 44 bit PCle adresi gerektiren bir işletim sistemi için bu seçeneği etkinleştirin.
512 GB olarak ayarlandığında sistem, MMIO taban değerini 512 GB olarak ayarlar ve maksimum bellek desteğini 512 GB altında bir değere düşürür. Bu seçeneği yalnızca 4 GPU DGMA sorunu için etkinleştirin. Bu seçenek varsayılan olarak 56 TB'ye ayarlıdır.

http://topics-cdn.dell.com/pdf/poweredge-r740_owner's%20manual_en-us.pdf (sayfa 52)

 

SLN308065_en_US__3icon Not: Bu işlem sistem belleğini 512 GB'ye sınırlar (512GB olarak ayarlandığında).

 

Bu ayar değiştirildiğinde ve sistem yeniden başlatıldığında nvidia-smi, aşağıdakine benzer bir ekran görüntülemelidir:

SLN308065_en_US__4PSE2940noerror

原因

-

解决方案

-

文章属性


受影响的产品

PowerEdge R740, PowerEdge R740XD, PowerEdge T640

上次发布日期

07 10月 2021

版本

4

文章类型

Solution