跳转至主要内容
  • 快速、轻松地下订单
  • 查看订单并跟踪您的发货状态
  • 创建并访问您的产品列表
  • 使用“Company Administration”(公司管理),管理Dell EMC站点、产品和产品级联系人。

Dell PowerEdge 14G: ESXi ส่งกลับ "ไม่สามารถเตรียมใช้งาน NVML: ข้อผิดพลาดที่ไม่รู้จัก" กับ GPU ของ NVidia

摘要: เมื่อต้องการแก้ไขปัญหานี้ โปรดตั้งค่าฐาน I/O ที่แมปหน่วยความจําเป็น 512GB

本文可能已自动翻译。如果您对其质量有任何反馈,请使用此页面底部的表单告知我们。

文章内容


症状

คำอธิบาย

เมื่อพยายามติดตั้ง GPU NVidia (เช่น M10)ลงใน เซิร์ฟเวอร์ 14G (R740 และ R740XD)ที่รองรับ หลังจากติดตั้ง vib ไดรเวอร์ข้อผิดพลาดต่อไปนี้อาจปรากฏขึ้นเมื่อพยายามดําเนินการ คําสั่ง nvidia-smi:

[root@localhost:~] nvidia-smi
ไม่สามารถเตรียมใช้งาน NVML: ข้อผิดพลาดที่ไม่รู้จัก


SLN308065_en_US__1PSE2940error


ในรายงานข้อผิดพลาดของ nvidia.log เหตุการณ์ที่คล้ายกับเหตุการณ์ต่อไปนี้จะเห็นได้ในส่วน /var/log/vmkernel.log:

2017-11-02T18:28:19.707Z cpu45:66263)NVRM: การโหลดโมดูลเคอร์เนลx86_64 NVIDIA UNIX 384.73 จันทร์ 21 ส.ค. 15:16:25 PDT 2017
2017-11-02T18:28:19.710Z CPU3:66145)NVRM: นี่คือ BAR 64 บิตที่แมปสูงกว่า 16 TB โดยระบบ
NVRM: BIOS หรือเคอร์เนล VMware ESXi ภูมิภาค PCI I/O ที่กําหนด
NVRM นี้: สําหรับอุปกรณ์ NVIDIA ของคุณไม่ได้รับการสนับสนุนโดยเคอร์เนล
เอ็นวีเอ็ม: BAR1 คือ 256M @ 0x382fe00 $



 


วิธีแก้ไข

ฮาร์ดแวร์ทํางานได้ดี เมื่อต้องการแก้ไขปัญหานี้ โปรดตั้งค่าฐาน I/O ที่แมปหน่วยความจําเป็น512GB (ค่าเริ่มต้นคือ 56TB) หรือ12TB (ถ้าเซิร์ฟเวอร์มี RAM >512GB):

SLN308065_en_US__2PSE2940biossetting


ปัญหานี้ได้รับการบันทึกไว้ในคู่มือของเจ้าของฮาร์ดแวร์ R740:

หน่วยความจําที่แมป I/O สูงกว่า 4 GB - เปิดหรือปิดการสนับสนุนสําหรับอุปกรณ์ PCIe ที่ต้องการหน่วยความจําจํานวนมาก เปิดใช้งานตัวเลือกนี้สําหรับระบบปฏิบัติการ 64 บิตเท่านั้น ตัวเลือกนี้จะถูกตั้งค่าเป็น เปิดใช้งาน ตามค่าเริ่มต้น

หน่วยความจําแมป I/O เหนือฐาน - เมื่อตั้งค่าเป็น 12 TB ระบบจะแมปฐาน MMIO ไว้ที่ 12 TB เปิดใช้งานตัวเลือกนี้สําหรับระบบปฏิบัติการที่ต้องการการกําหนดที่อยู่
PCIe แบบ 44 บิต เมื่อตั้งค่าเป็น 512 GB ระบบจะแมปฐาน MMIO เป็น 512 GB และลดการสนับสนุนสูงสุดสําหรับหน่วยความจําให้น้อยกว่า 512 GB เปิดใช้งานตัวเลือกนี้สําหรับปัญหา DGMA 4 เท่านั้น ตัวเลือกนี้ถูกตั้งค่าเป็น 56 TB ตามค่าเริ่มต้น

http://topics-cdn.dell.com/pdf/poweredge-r740_owner%20manual_en-เรา.pdf (หน้า 52)

 

SLN308065_en_US__3icon โปรดทราบว่า จะจํากัดหน่วยความจําระบบไว้ที่ 512GB (หากตั้งค่าเป็น 512GB)

 

เมื่อการตั้งค่านี้มีการเปลี่ยนแปลงและระบบรีบูต nvidia-smi ควรส่งออกสิ่งที่คล้ายกับ:

SLN308065_en_US__4PSE2940noerror

原因

-

解决方案

-

文章属性


受影响的产品

PowerEdge R740, PowerEdge R740XD, PowerEdge T640

上次发布日期

07 10月 2021

版本

4

文章类型

Solution