Zu den Hauptinhalten
  • Bestellungen schnell und einfach aufgeben
  • Bestellungen anzeigen und den Versandstatus verfolgen
  • Profitieren Sie von exklusiven Prämien und Rabatten für Mitglieder
  • Erstellen Sie eine Liste Ihrer Produkte, auf die Sie jederzeit zugreifen können.
  • Verwalten Sie mit der Unternehmensverwaltung Ihre Dell EMC Seiten, Produkte und produktspezifischen Kontakte.

Dell PowerEdge 14G: ESXiが「Failed to initialize NVML: Unknown Error」をNVidia GPUで返す

Zusammenfassung: この問題を解決するには、[Memory Mapped I/O Base]を512GBに設定してください。

Dieser Artikel wurde möglicherweise automatisch übersetzt. Wenn Sie eine Rückmeldung bezüglich dessen Qualität geben möchten, teilen Sie uns diese über das Formular unten auf dieser Seite mit.

Artikelinhalt


Symptome

説明

サポートされている14Gサーバー(R740およびR740XD)NVidia GPU(例:M10)をインストールしようとすると、ドライバーVIBのインストール後にnvidia-smiコマンドを実行しようとしたときに次のエラーが表示されることがあります。

[root@localhost:~] nvidia-smi
Failed to initialize NVML: Unknown Error


SLN308065_en_US__1PSE2940error


nvidia-bug-report.logの「/var/log/vmkernel.log」セクションには、次のようなイベントが表示されます。

2017-11-02T18:28:19.707Z cpu45:66263)NVRM: loading NVIDIA UNIX x86_64 Kernel Module  384.73  Mon Aug 21 15:16:25 PDT 2017
2017-11-02T18:28:19.710Z cpu3:66145)NVRM: This is a 64-bit BAR mapped above 16 TB by the system
NVRM: BIOS or the VMware ESXi kernel. This PCI I/O region assigned
NVRM: to your NVIDIA device is not supported by the kernel.
NVRM: BAR1 is 256M @ 0x382fe00$



 


対処方法

ハードウェアは正常に動作しています。この問題を解決するには、Memory Mapped I/O Base設定を512 GB(デフォルトは56TB)または12 TB(サーバーに > 512 GB RAMがある場合)に設定してください。

SLN308065_en_US__2PSE2940biossetting


この問題は、R740ハードウェア オーナーズ マニュアルに記載されています。

Memory Mapped I/O above 4 GB] - 大量のメモリーを必要とするPCIeデバイスのサポートを有効または無効にします。このオプションは、64ビットのオペレーティング システムでのみ有効にします。このオプションは、デフォルトで[Enabled]に設定されています。

Memory Mapped I/O above Base] - 12TBに設定すると、システムはMMIOベースを12TBにマップします。44ビットPCIeアドレス指定が必要なOSの場合は、このオプションを有効にします。
512 GBに設定すると、システムはMMIOベースを512 GBにマップし、メモリーの最大サポートを512 GB未満に減らします。このオプションは、4 GPU DGMA問題に対してのみ有効にします。このオプションは、デフォルトで56TBに設定されています。

http://topics-cdn.dell.com/pdf/poweredge-r740_owner's%20manual_en-us.pdf(ページ52)

 

SLN308065_en_US__3icon :これにより、システム メモリーが512GBに制限されます(512GBに設定した場合)。

 

この設定を変更してシステムを再起動すると、nvidia-smiは次のような内容を出力します。

SLN308065_en_US__4PSE2940noerror

Ursache

-

Lösung

-

Artikeleigenschaften


Betroffenes Produkt

PowerEdge R740, PowerEdge R740XD, PowerEdge T640

Letztes Veröffentlichungsdatum

07 Okt. 2021

Version

4

Artikeltyp

Solution