PowerEdge: Як встановити драйвер NVIDIA в Red Hat Enterprise Linux
Summary: У цій статті обговорюється компіляція та встановлення драйвера NVIDIA з підтримкою динамічного модуля ядра (DKMS) у Red Hat Enterprise Linux, який має вимкнене «Безпечне завантаження».
Instructions
У цій статті обговорюється, як скомпілювати та встановити драйвер NVIDIA з DKMS у Red Hat Enterprise Linux, який має вимкнене «Безпечне завантаження».
Перш ніж почати, переконайтеся, що в BIOS відключена опція Secure Boot . Це пов'язано з тим, що цей варіант встановлення використовує DKMS для компіляції драйвера NVIDIA з вихідного коду для будь-якого поточного запущеного ядра. Підпис постачальника для скомпільованого драйвера відсутній. Якщо ввімкнено функцію Secure Boot, самостійно скомпільований драйвер не завантажується з помилкою Required key not available. Перевірка поточного статусу за допомогою команди mokutil --sb-state в Red Hat Enterprise Linux, і змінити його в BIOS, натиснувши F2 під час сервера POST.
Якщо потрібне безпечне завантаження або якщо ви віддаєте перевагу попередньо скомпільованому драйверу, зверніться до наступної статті для встановлення. Як встановити драйвер NVIDIA онлайн у Red Hat Enterprise Linux з увімкненим безпечним завантаженням.
- Завантажте необхідний драйвер із сайту NVIDIA .
- Виберіть правильну версію Red Hat Enterprise Linux, наприклад Red Hat Enterprise Linux 8.
- Виберіть правильну версію архітектури обчислюваного уніфікованого пристрою (CUDA), необхідну для набору інструментів CUDA, який ви збираєтеся встановити, наприклад 12.2.
- Пакет завантаження є RPM, наприклад nvidia-driver-local-repo-rhel8-535.54.03-1.0-1.x86_64.rpm
- Встановіть RPM. Це створює локальний репозиторій.
[root@rhel87 ~]# ls anaconda-ks.cfg nvidia-driver-local-repo-rhel8-535.54.03-1.0-1.x86_64.rpm [root@rhel87 ~]# yum localinstall ./nvidia-driver-local-repo-rhel8-535.54.03-1.0-1.x86_64.rpm ...output skipped... [root@rhel87 ~]# yum repolist Updating Subscription Management repositories. Unable to read consumer identity This system is not registered with an entitlement server. You can use subscription-manager to register. repo id repo name my-rhel-87-AppStream-iso my RHEL 87 AppStream iso my-rhel-87-BaseOS-iso my RHEL 87 BaseOS iso my-rhel-extra-rpms my RHEL extra rpms nvidia-driver-local-rhel8-535.54.03 nvidia-driver-local-rhel8-535.54.03 [root@rhel87 ~]#
- Інсталювати ДКМС. DKMS немає в Red Hat Enterprise Linux. Він доступний у додаткових пакетах для Enterprise Linux (EPEL).
Для отримання більш детальної інформації про DKMS дивіться статтю Red Hat Чи надається DKMS в Red Hat Enterprise Linux
[root@rhel87 ~]# yum install https://dl.fedoraproject.org/pub/epel/epel-release-latest-8.noarch.rpm [root@rhel87 ~]# yum install dkms
- Ви можете вимкнути або видалити EPEL, якщо це необхідно.
# to disable epel, edit the following configuration and change to "enabled=0" [root@rhel87 ~]# vi /etc/yum.repos.d/epel.repo # to remove the epel [root@rhel87 ~]# yum remove epel-release
- Встановіть інструменти компіляції та заголовок ядра. Переконайтеся, що підписка Red Hat прикріплена.
[root@rhel87 ~]# yum groupinstall "Development Tools" [root@rhel87 ~]# yum install kernel-devel-$(uname -r)
- Встановіть cuda-драйвер
[root@rhel87 ~]# yum install cuda-driver
- Переконайтеся, що драйвер інстальовано успішно.
[root@rhel87 ~]# dkms status
nvidia/535.54.03, 4.18.0-425.3.1.el8.x86_64, x86_64: installed
[root@rhel87 ~]#
- Якщо вказаний вище статус не встановлено, а замість цього він доданий, ви можете його зібрати.
[root@rhel87 ~]# dkms build nvidia/535.54.03
- Якщо визначений статус побудовано, ви можете встановити його.
[root@rhel87 ~]# dkms install nvidia/535.54.03
- Якщо не вдалося виконати статус у збірці або встановленні, перегляньте журнали за наступним шляхом:
[root@rhel87 ~]# ls /var/lib/dkms/nvidia/535.54.03/4.18.0-425.3.1.el8.x86_64/x86_64/log/make.log [root@rhel87 ~]#
- Перезавантажте сервер після встановлення драйвера NVIDIA.
[root@rhel87 ~]# systemctl reboot
- Переконайтеся , що драйвер увімкнено та працює.
[root@rhel87 ~]# lsmod | grep nvidia nvidia_drm 73728 0 nvidia_modeset 1306624 1 nvidia_drm nvidia_uvm 1523712 0 nvidia 56426496 2 nvidia_uvm,nvidia_modeset drm_kms_helper 176128 4 qxl,nvidia_drm drm 565248 7 drm_kms_helper,qxl,nvidia,drm_ttm_helper,nvidia_drm,ttm [root@rhel87 ~]# nvidia-smi Tue Jul 25 12:00:29 2023 +---------------------------------------------------------------------------------------+ | NVIDIA-SMI 535.54.03 Driver Version: 535.54.03 CUDA Version: 12.2 | |-----------------------------------------+----------------------+----------------------+ | GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. | | | | MIG M. | |=========================================+======================+======================| | 0 Tesla P100-PCIE-12GB Off | 00000000:07:00.0 Off | 0 | | N/A 33C P0 29W / 250W | 0MiB / 12288MiB | 2% Default | | | | N/A | +-----------------------------------------+----------------------+----------------------+ +---------------------------------------------------------------------------------------+ | Processes: | | GPU GI CI PID Type Process name GPU Memory | | ID ID Usage | |=======================================================================================| | No running processes found | +---------------------------------------------------------------------------------------+ [root@rhel87 ~]# modinfo nvidia filename: /lib/modules/4.18.0-425.3.1.el8.x86_64/extra/nvidia.ko.xz firmware: nvidia/535.54.03/gsp_tu10x.bin firmware: nvidia/535.54.03/gsp_ga10x.bin alias: char-major-195-* version: 535.54.03 supported: external license: NVIDIA rhelversion: 8.7 srcversion: EA9C7EF32617E104C8240C4
Якщо виникне будь-яка проблема, зберіть дані в наступних журналах і зверніться до служби підтримки Dell:
sosreport- Файли журналів, згадані вище в build, або make, якщо збірка драйвера не вдалася
- Будь-які
/var/log/nvidia-installer.logабо будь-які журнали, згадані у виводі під час встановлення
Інша інформація, яку варто знати:
- Якщо Red Hat Enterprise Linux встановився та завантажився за допомогою graphical.target, ви можете побачити чорний екран після перезавантаження. Рішення полягає в тому, щоб перемістити /etc/X11/xorg.conf.d/10-nvidia.conf з папки X11 і перезавантажити сервер.
- Якщо ви хочете передати відеокарту на віртуальну машину в KVM за допомогою graphical.target, це не вдається. Рішення полягає в тому, щоб завантажити гіпервізор Red Hat Enterprise Linux у multi-user.target, оскільки тоді graphical.target запобігає вивантаженню драйвера NVIDIA перед проходженням до віртуальної машини.