跳转至主要内容
  • 快速、轻松地下订单
  • 查看订单并跟踪您的发货状态
  • 创建并访问您的产品列表
  • 使用“Company Administration”(公司管理),管理Dell EMC站点、产品和产品级联系人。

Dell PowerEdge 14G: NVidia GPU를 탑재한 ESXi에서 "Failed to initialize NVML: Unknown Error"를 반환함

摘要: 이 문제를 해결하려면 Memory Mapped I/O Base 설정을 512GB로 설정하십시오.

本文可能已自动翻译。如果您对其质量有任何反馈,请使用此页面底部的表单告知我们。

文章内容


症状

설명

드라이버 vib를 설치한 후 지원되는 14G 서버(R740 및 R740XD)NVidia GPU(예: M10)를 설치하려고 할 때 nvidia-smi command: 명령을 실행하려고 하면 다음 오류가 나타날 수 있습니다.

[root@localhost:~] nvidia-smi
Failed to initialize NVML: Unknown Error


SLN308065_en_US__1PSE2940error


nvidia-bug-report.log에서 다음과 유사한 이벤트가 /var/log/vmkernel.log 섹션에 표시됩니다.

2017-11-02T18:28:19.707Z cpu45:66263)NVRM: loading NVIDIA UNIX x86_64 Kernel Module 384.73 Mon Aug 21 15:16:25 PDT 2017
2017-11-02T18:28:19.710Z cpu3:66145)NVRM: This is a 64-bit BAR mapped above 16 TB by the system
NVRM: BIOS or the VMware ESXi kernel. This PCI I/O region assigned
NVRM: to your NVIDIA device is not supported by the kernel.
NVRM: BAR1 is 256M @ 0x382fe00$



 


해결책

하드웨어가 제대로 작동합니다. 이 문제를 해결하려면 Memory Mapped I/O Base 설정을 512GB(기본값은 56TB) 또는 12TB(서버에 512GB 이상의 RAM이 있는 경우)로 설정하십시오.

SLN308065_en_US__2PSE2940biossetting


이 문제는 R740 하드웨어 사용자 설명서에 설명되어 있습니다.

Memory Mapped I/O above 4 GB - 대용량 메모리가 필요한 PCIe 디바이스에 대한 지원을 활성화하거나 비활성화합니다. 이 옵션은 64비트 운영 체제에서만 활성화합니다. 이 옵션은 기본적으로 활성화되어 있습니다.

Memory Mapped I/O above Base - 12TB로 설정하면 시스템이 MMIO 베이스를 12TB로 매핑합니다. 44비트 PCIe 주소 지정이 필요한 OS에서 이 옵션을 활성화합니다.
512GB로 설정하면 MMIO 베이스를 512GB로 매핑하고 최대 메모리 지원 용량을 512GB 미만으로 줄입니다. 이 옵션은 4 GPU DGMA 문제인 경우에만 활성화합니다. 이 옵션은 기본적으로 56TB로 설정됩니다.

http://topics-cdn.dell.com/pdf/poweredge-r740_owner's%20manual_en-us.pdf(52페이지)

 

SLN308065_en_US__3icon 참고: 이렇게 하면 시스템 메모리가 512GB로 제한됩니다(512GB로 설정된 경우).

 

이 설정이 변경되고 시스템이 재부팅되면 nvidia-smi는 다음과 유사한 결과를 출력합니다.

SLN308065_en_US__4PSE2940noerror

原因

-

解决方案

-

文章属性


受影响的产品

PowerEdge R740, PowerEdge R740XD, PowerEdge T640

上次发布日期

07 10月 2021

版本

4

文章类型

Solution