PowerEdge. Установка драйвера NVIDIA в Red Hat Enterprise Linux

Summary: В этой статье рассматривается компиляция и установка драйвера NVIDIA с поддержкой динамического модуля ядра (DKMS) в Red Hat Enterprise Linux с отключенной функцией безопасной загрузки. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

В этой статье описывается компиляция и установка драйвера NVIDIA с DKMS в Red Hat Enterprise Linux с отключенной функцией «Secure Boot».

Перед началом работы убедитесь, что в BIOS отключен параметр Безопасная загрузка . Это связано с тем, что этот вариант установки использует DKMS для компиляции драйвера NVIDIA из исходного кода для любого работающего ядра. Для скомпилированного драйвера отсутствует подпись производителя. Если безопасная загрузка включена, самокомпилированный драйвер не загружается с ошибкой Required key not available. Проверьте текущее состояние с помощью команды mokutil --sb-state в Red Hat Enterprise Linux и измените ее в BIOS, нажав клавишу F2 во время проверки POST сервера.

Если требуется безопасная загрузка или вы предпочитаете предварительно скомпилированный драйвер, см. следующую статью об установке.  Как установить драйвер NVIDIA онлайн в Red Hat Enterprise Linux с включенной безопасной загрузкой.

  1. Скачайте необходимый драйвер с сайта NVIDIA .Эта гиперссылка позволяет перейти на сайт за пределами Dell Technologies.
    1. Выберите правильную версию Red Hat Enterprise Linux, например Red Hat Enterprise Linux 8.
    2. Выберите правильную версию Compute Unified Device Architecture (CUDA), необходимую для набора инструментов CUDA, который вы собираетесь установить, например 12.2.
    3. Пакет загрузки представляет собой RPM, например, nvidia-driver-local-repo-rhel8-535.54.03-1.0-1.x86_64.rpm
  2. Установите RPM. Таким образом создается локальный репозиторий.
[root@rhel87 ~]# ls
anaconda-ks.cfg  nvidia-driver-local-repo-rhel8-535.54.03-1.0-1.x86_64.rpm
[root@rhel87 ~]# yum localinstall ./nvidia-driver-local-repo-rhel8-535.54.03-1.0-1.x86_64.rpm
...output skipped...
[root@rhel87 ~]# yum repolist
Updating Subscription Management repositories.
Unable to read consumer identity

This system is not registered with an entitlement server. You can use subscription-manager to register.

repo id                              repo name
my-rhel-87-AppStream-iso             my RHEL 87 AppStream iso
my-rhel-87-BaseOS-iso                my RHEL 87 BaseOS iso
my-rhel-extra-rpms                   my RHEL extra rpms
nvidia-driver-local-rhel8-535.54.03  nvidia-driver-local-rhel8-535.54.03
[root@rhel87 ~]#
  1. Устанавливать ДКМС. DKMS отсутствует в Red Hat Enterprise Linux. Он доступен в дополнительных пакетах для Enterprise Linux (EPEL).Эта гиперссылка позволяет перейти на сайт за пределами Dell Technologies.  Дополнительные сведения о DKMS см. в статье Предоставляется ли Red Hat DKMS в Red Hat Enterprise LinuxЭта гиперссылка позволяет перейти на сайт за пределами Dell Technologies.
[root@rhel87 ~]# yum install https://dl.fedoraproject.org/pub/epel/epel-release-latest-8.noarch.rpm
[root@rhel87 ~]# yum install dkms
  1. При необходимости можно отключить или удалить EPEL.
# to disable epel, edit the following configuration and change to "enabled=0" 
[root@rhel87 ~]# vi /etc/yum.repos.d/epel.repo 

# to remove the epel 
[root@rhel87 ~]# yum remove epel-release
  1. Установка инструментов компиляции и заголовка ядра. Убедитесь, что подписка Red Hat прилагается.
[root@rhel87 ~]# yum groupinstall "Development Tools"
[root@rhel87 ~]# yum install kernel-devel-$(uname -r)
  1. Установка драйвера cuda
[root@rhel87 ~]# yum install cuda-driver
  1. Убедитесь, что драйвер установлен успешно.
[root@rhel87 ~]# dkms status
nvidia/535.54.03, 4.18.0-425.3.1.el8.x86_64, x86_64: installed
[root@rhel87 ~]#
  1. Если указанное выше состояние не установлено, а вместо этого Добавлено, вы можете выполнить сборку.
[root@rhel87 ~]# dkms build nvidia/535.54.03
  1. Если указанное состояние создано, его можно установить.
[root@rhel87 ~]# dkms install nvidia/535.54.03
  1. Если состояние «failed» при сборке или установке, просмотрите журналы по следующему пути:
[root@rhel87 ~]# ls /var/lib/dkms/nvidia/535.54.03/4.18.0-425.3.1.el8.x86_64/x86_64/log/make.log
[root@rhel87 ~]#
  1. Перезагрузите сервер после установки драйвера NVIDIA.
[root@rhel87 ~]# systemctl reboot
  1. Убедитесь , что драйвер включен и работает.
[root@rhel87 ~]# lsmod | grep nvidia
nvidia_drm             73728  0
nvidia_modeset       1306624  1 nvidia_drm
nvidia_uvm           1523712  0
nvidia              56426496  2 nvidia_uvm,nvidia_modeset
drm_kms_helper        176128  4 qxl,nvidia_drm
drm                   565248  7 drm_kms_helper,qxl,nvidia,drm_ttm_helper,nvidia_drm,ttm
[root@rhel87 ~]# nvidia-smi
Tue Jul 25 12:00:29 2023
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 535.54.03              Driver Version: 535.54.03    CUDA Version: 12.2     |
|-----------------------------------------+----------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
|=========================================+======================+======================|
|   0  Tesla P100-PCIE-12GB           Off | 00000000:07:00.0 Off |                    0 |
| N/A   33C    P0              29W / 250W |      0MiB / 12288MiB |      2%      Default |
|                                         |                      |                  N/A |
+-----------------------------------------+----------------------+----------------------+

+---------------------------------------------------------------------------------------+
| Processes:                                                                            |
|  GPU   GI   CI        PID   Type   Process name                            GPU Memory |
|        ID   ID                                                             Usage      |
|=======================================================================================|
|  No running processes found                                                           |
+---------------------------------------------------------------------------------------+
[root@rhel87 ~]# modinfo nvidia
filename:       /lib/modules/4.18.0-425.3.1.el8.x86_64/extra/nvidia.ko.xz
firmware:       nvidia/535.54.03/gsp_tu10x.bin
firmware:       nvidia/535.54.03/gsp_ga10x.bin
alias:          char-major-195-*
version:        535.54.03
supported:      external
license:        NVIDIA
rhelversion:    8.7
srcversion:     EA9C7EF32617E104C8240C4



При возникновении каких-либо проблем соберите данные в следующих журналах и обратитесь в службу поддержки Dell:

  • sosreport
  • Файлы журналов, упомянутые выше, в сборке или make в случае сбоя сборки драйвера
  • Any /var/log/nvidia-installer.logили любые журналы, указанные в выходных данных при установке

Дополнительная информация, которую необходимо знать:

  • Если на Red Hat Enterprise Linux установлен и загружен файл graphical.target, после перезагрузки может появиться черный экран. Решение состоит в том, чтобы переместить /etc/X11/xorg.conf.d/10-nvidia.conf из папки X11 и перезагрузить сервер.
  • Если вы попытаетесь передать графический процессор на виртуальную машину в KVM с помощью graphical.target, это не удастся. Решение заключается в загрузке гипервизора Red Hat Enterprise Linux в multi-user.target, так как тогда graphical.target предотвратит выгрузку драйвера NVIDIA перед его передачей на виртуальную машину.

Affected Products

Red Hat Enterprise Linux Version 7, Red Hat Enterprise Linux Version 9, Red Hat Enterprise Linux Version 8

Products

DSS 8440, Poweredge C4140, PowerEdge C6525, PowerEdge R640, PowerEdge R650, PowerEdge R6515, PowerEdge R6525, PowerEdge R740, PowerEdge R740XD, PowerEdge R7425, PowerEdge R750, PowerEdge R750XA, PowerEdge R7515, PowerEdge R7525, PowerEdge R840 , PowerEdge R940xa, PowerEdge T550, PowerEdge T640, PowerEdge XE2420, PowerEdge XE7420, PowerEdge XE9680 ...
Article Properties
Article Number: 000216077
Article Type: How To
Last Modified: 06 Dec 2024
Version:  5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.