Zu den Hauptinhalten
  • Bestellungen schnell und einfach aufgeben
  • Bestellungen anzeigen und den Versandstatus verfolgen
  • Profitieren Sie von exklusiven Prämien und Rabatten für Mitglieder
  • Erstellen Sie eine Liste Ihrer Produkte, auf die Sie jederzeit zugreifen können.
  • Verwalten Sie mit der Unternehmensverwaltung Ihre Dell EMC Seiten, Produkte und produktspezifischen Kontakte.

Dell PowerEdge 14G: ESXi возвращает сообщение «Failed to initialize NVML: Unknown Error» при запуске с видеокартой NVidia

Zusammenfassung: Чтобы устранить эту проблему, установите для параметра «Memory Mapped I/O Base» значение 512 ГБ

Dieser Artikel wurde möglicherweise automatisch übersetzt. Wenn Sie eine Rückmeldung bezüglich dessen Qualität geben möchten, teilen Sie uns diese über das Formular unten auf dieser Seite mit.

Artikelinhalt


Symptome

Описание

В ходе установки видеокарты NVidia (например M10) на поддерживаемый сервер 14G (R740 и R740XD) после установки пакета драйверов VIB при попытке выполнения команды nvidia-smi может появиться следующая ошибка:

[root@localhost:~] nvidia-smi
Failed to initialize NVML: Unknown Error


SLN308065_en_US__1PSE2940error


В файле nvidia-bug-report.log в разделе /var/log/vmkernel.log отображаются события, похожие на представленные ниже.

2017-11-02T18:28:19.707Z cpu45:66263)NVRM: loading NVIDIA UNIX x86_64 Kernel Module  384.73  Mon Aug 21 15:16:25 PDT 2017
2017-11-02T18:28:19.710Z cpu3:66145)NVRM: This is a 64-bit BAR mapped above 16 TB by the system
NVRM: BIOS or the VMware ESXi kernel. This PCI I/O region assigned
NVRM: to your NVIDIA device is not supported by the kernel.
NVRM: BAR1 is 256M @ 0x382fe00$



 


Решение

Оборудование работает исправно. Чтобы устранить эту проблему, установите для параметра Memory Mapped I/O Base значение 512 Гбайт (по умолчанию 56 Тбайт) или 12 Тбайт (если на сервере > 512 Гбайт ОЗУ).

SLN308065_en_US__2PSE2940biossetting


Эта проблема описана в руководстве пользователя оборудования для R740.

Memory Mapped I/O above 4 GB. Включение или отключение поддержки устройств PCIe, которым требуется большой объем памяти. Этот параметр включается только для 64-разрядных операционных систем. По умолчанию для этого параметра установлено значение «Включено».

Memory Mapped I/O above Base. Если установлено значение 12 ТБ, система сопоставит базу MMIO с 12 ТБ. Включите этот параметр для ОС, которой требуется 44-разрядная адресация PCIe.
Если установлено значение 512 Гбайт, система сопоставит базу MMIO с 512 Гбайт и снизит максимальную поддержку памяти до менее 512 Гбайт. Включите этот параметр только для проблемы 4 GPU DGMA. По умолчанию для этого параметра установлено значение 56 ТБ.

http://topics-cdn.dell.com/pdf/poweredge-r740_owner's%20manual_en-us.pdf (страница 52)

 

SLN308065_en_US__3icon Обратите внимание, что объем системной памяти будет ограничен до 512 ГБ (если установлено значение 512 ГБ).

 

После изменения этого параметра и перезагрузки системы команда nvidia-smi должна выводить что-то похожее на следующее:

SLN308065_en_US__4PSE2940noerror

Ursache

-

Lösung

-

Artikeleigenschaften


Betroffenes Produkt

PowerEdge R740, PowerEdge R740XD, PowerEdge T640

Letztes Veröffentlichungsdatum

07 Okt. 2021

Version

4

Artikeltyp

Solution