PowerEdge: Як встановити драйвер NVIDIA в Red Hat Enterprise Linux

Summary: У цій статті обговорюється компіляція та встановлення драйвера NVIDIA з підтримкою динамічного модуля ядра (DKMS) у Red Hat Enterprise Linux, який має вимкнене «Безпечне завантаження».

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

У цій статті обговорюється, як скомпілювати та встановити драйвер NVIDIA з DKMS у Red Hat Enterprise Linux, який має вимкнене «Безпечне завантаження».

Перш ніж почати, переконайтеся, що в BIOS відключена опція Secure Boot . Це пов'язано з тим, що цей варіант встановлення використовує DKMS для компіляції драйвера NVIDIA з вихідного коду для будь-якого поточного запущеного ядра. Підпис постачальника для скомпільованого драйвера відсутній. Якщо ввімкнено функцію Secure Boot, самостійно скомпільований драйвер не завантажується з помилкою Required key not available. Перевірка поточного статусу за допомогою команди mokutil --sb-state в Red Hat Enterprise Linux, і змінити його в BIOS, натиснувши F2 під час сервера POST.

Якщо потрібне безпечне завантаження або якщо ви віддаєте перевагу попередньо скомпільованому драйверу, зверніться до наступної статті для встановлення.  Як встановити драйвер NVIDIA онлайн у Red Hat Enterprise Linux з увімкненим безпечним завантаженням.

  1. Завантажте необхідний драйвер із сайту NVIDIA .Це гіперпосилання веде вас на веб-сайт за межами Dell Technologies.
    1. Виберіть правильну версію Red Hat Enterprise Linux, наприклад Red Hat Enterprise Linux 8.
    2. Виберіть правильну версію архітектури обчислюваного уніфікованого пристрою (CUDA), необхідну для набору інструментів CUDA, який ви збираєтеся встановити, наприклад 12.2.
    3. Пакет завантаження є RPM, наприклад nvidia-driver-local-repo-rhel8-535.54.03-1.0-1.x86_64.rpm
  2. Встановіть RPM. Це створює локальний репозиторій.
[root@rhel87 ~]# ls
anaconda-ks.cfg  nvidia-driver-local-repo-rhel8-535.54.03-1.0-1.x86_64.rpm
[root@rhel87 ~]# yum localinstall ./nvidia-driver-local-repo-rhel8-535.54.03-1.0-1.x86_64.rpm
...output skipped...
[root@rhel87 ~]# yum repolist
Updating Subscription Management repositories.
Unable to read consumer identity

This system is not registered with an entitlement server. You can use subscription-manager to register.

repo id                              repo name
my-rhel-87-AppStream-iso             my RHEL 87 AppStream iso
my-rhel-87-BaseOS-iso                my RHEL 87 BaseOS iso
my-rhel-extra-rpms                   my RHEL extra rpms
nvidia-driver-local-rhel8-535.54.03  nvidia-driver-local-rhel8-535.54.03
[root@rhel87 ~]#
  1. Інсталювати ДКМС. DKMS немає в Red Hat Enterprise Linux. Він доступний у додаткових пакетах для Enterprise Linux (EPEL).Це гіперпосилання веде вас на веб-сайт за межами Dell Technologies.  Для отримання більш детальної інформації про DKMS дивіться статтю Red Hat Чи надається DKMS в Red Hat Enterprise Linux Це гіперпосилання веде вас на веб-сайт за межами Dell Technologies.
[root@rhel87 ~]# yum install https://dl.fedoraproject.org/pub/epel/epel-release-latest-8.noarch.rpm
[root@rhel87 ~]# yum install dkms
  1. Ви можете вимкнути або видалити EPEL, якщо це необхідно.
# to disable epel, edit the following configuration and change to "enabled=0" 
[root@rhel87 ~]# vi /etc/yum.repos.d/epel.repo 

# to remove the epel 
[root@rhel87 ~]# yum remove epel-release
  1. Встановіть інструменти компіляції та заголовок ядра. Переконайтеся, що підписка Red Hat прикріплена.
[root@rhel87 ~]# yum groupinstall "Development Tools"
[root@rhel87 ~]# yum install kernel-devel-$(uname -r)
  1. Встановіть cuda-драйвер
[root@rhel87 ~]# yum install cuda-driver
  1. Переконайтеся, що драйвер інстальовано успішно.
[root@rhel87 ~]# dkms status
nvidia/535.54.03, 4.18.0-425.3.1.el8.x86_64, x86_64: installed
[root@rhel87 ~]#
  1. Якщо вказаний вище статус не встановлено, а замість цього він доданий, ви можете його зібрати.
[root@rhel87 ~]# dkms build nvidia/535.54.03
  1. Якщо визначений статус побудовано, ви можете встановити його.
[root@rhel87 ~]# dkms install nvidia/535.54.03
  1. Якщо не вдалося виконати статус у збірці або встановленні, перегляньте журнали за наступним шляхом:
[root@rhel87 ~]# ls /var/lib/dkms/nvidia/535.54.03/4.18.0-425.3.1.el8.x86_64/x86_64/log/make.log
[root@rhel87 ~]#
  1. Перезавантажте сервер після встановлення драйвера NVIDIA.
[root@rhel87 ~]# systemctl reboot
  1. Переконайтеся , що драйвер увімкнено та працює.
[root@rhel87 ~]# lsmod | grep nvidia
nvidia_drm             73728  0
nvidia_modeset       1306624  1 nvidia_drm
nvidia_uvm           1523712  0
nvidia              56426496  2 nvidia_uvm,nvidia_modeset
drm_kms_helper        176128  4 qxl,nvidia_drm
drm                   565248  7 drm_kms_helper,qxl,nvidia,drm_ttm_helper,nvidia_drm,ttm
[root@rhel87 ~]# nvidia-smi
Tue Jul 25 12:00:29 2023
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 535.54.03              Driver Version: 535.54.03    CUDA Version: 12.2     |
|-----------------------------------------+----------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
|=========================================+======================+======================|
|   0  Tesla P100-PCIE-12GB           Off | 00000000:07:00.0 Off |                    0 |
| N/A   33C    P0              29W / 250W |      0MiB / 12288MiB |      2%      Default |
|                                         |                      |                  N/A |
+-----------------------------------------+----------------------+----------------------+

+---------------------------------------------------------------------------------------+
| Processes:                                                                            |
|  GPU   GI   CI        PID   Type   Process name                            GPU Memory |
|        ID   ID                                                             Usage      |
|=======================================================================================|
|  No running processes found                                                           |
+---------------------------------------------------------------------------------------+
[root@rhel87 ~]# modinfo nvidia
filename:       /lib/modules/4.18.0-425.3.1.el8.x86_64/extra/nvidia.ko.xz
firmware:       nvidia/535.54.03/gsp_tu10x.bin
firmware:       nvidia/535.54.03/gsp_ga10x.bin
alias:          char-major-195-*
version:        535.54.03
supported:      external
license:        NVIDIA
rhelversion:    8.7
srcversion:     EA9C7EF32617E104C8240C4



Якщо виникне будь-яка проблема, зберіть дані в наступних журналах і зверніться до служби підтримки Dell:

  • sosreport
  • Файли журналів, згадані вище в build, або make, якщо збірка драйвера не вдалася
  • Будь-які /var/log/nvidia-installer.logабо будь-які журнали, згадані у виводі під час встановлення

Інша інформація, яку варто знати:

  • Якщо Red Hat Enterprise Linux встановився та завантажився за допомогою graphical.target, ви можете побачити чорний екран після перезавантаження. Рішення полягає в тому, щоб перемістити /etc/X11/xorg.conf.d/10-nvidia.conf з папки X11 і перезавантажити сервер.
  • Якщо ви хочете передати відеокарту на віртуальну машину в KVM за допомогою graphical.target, це не вдається. Рішення полягає в тому, щоб завантажити гіпервізор Red Hat Enterprise Linux у multi-user.target, оскільки тоді graphical.target запобігає вивантаженню драйвера NVIDIA перед проходженням до віртуальної машини.

Affected Products

Red Hat Enterprise Linux Version 7, Red Hat Enterprise Linux Version 9, Red Hat Enterprise Linux Version 8

Products

DSS 8440, Poweredge C4140, PowerEdge C6525, PowerEdge R640, PowerEdge R650, PowerEdge R6515, PowerEdge R6525, PowerEdge R740, PowerEdge R740XD, PowerEdge R7425, PowerEdge R750, PowerEdge R750XA, PowerEdge R7515, PowerEdge R7525, PowerEdge R840 , PowerEdge R940xa, PowerEdge T550, PowerEdge T640, PowerEdge XE2420, PowerEdge XE7420, PowerEdge XE9680 ...
Article Properties
Article Number: 000216077
Article Type: How To
Last Modified: 06 Dec 2024
Version:  5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.