PowerEdge: Jak zainstalować sterownik NVIDIA w systemie Red Hat Enterprise Linux?
Summary: W tym artykule omówiono kompilowanie i instalowanie sterownika NVIDIA z obsługą dynamicznego modułu jądra (DKMS) w systemie Red Hat Enterprise Linux z wyłączoną opcją "Secure Boot".
Instructions
W tym artykule opisano sposób kompilowania i instalowania sterownika NVIDIA z systemem DKMS w systemie Red Hat Enterprise Linux z wyłączoną
opcją "Secure Boot".Przed rozpoczęciem upewnij się, że opcja Secure Boot jest wyłączona w systemie BIOS. Dzieje się tak, ponieważ ta opcja instalacji używa DKMS do kompilacji sterownika NVIDIA z kodu źródłowego dowolnego aktualnie uruchomionego jądra. Skompilowany sterownik nie zawiera podpisu dostawcy. Jeśli funkcja Secure Boot jest włączona, nie można załadować samodzielnie skompilowanego sterownika z błędem Required key not available. Sprawdź bieżący stan za pomocą polecenia mokutil --sb-state w systemie Red Hat Enterprise Linux i zmień ją w systemie BIOS, naciskając F2 podczas testu POST serwera.
Jeśli wymagany jest bezpieczny rozruch lub jeśli wolisz wstępnie skompilowany sterownik, zapoznaj się z następującym artykułem w celu zainstalowania. Jak zainstalować sterownik NVIDIA online w systemie Red Hat Enterprise Linux z włączonym bezpiecznym rozruchem.
- Pobierz wymagany sterownik z witryny firmy NVIDIA .
- Wybierz odpowiednią wersję systemu Red Hat Enterprise Linux, na przykład Red Hat Enterprise Linux 8.
- Wybierz odpowiednią wersję rozwiązania Compute Unified Device Architecture (CUDA) wymaganą z zestawem narzędzi CUDA, który zamierzasz zainstalować, na przykład 12.2.
- Pobrany pakiet to plik RPM, na przykład nvidia-driver-local-repo-rhel8-535.54.03-1.0-1.x86_64.rpm
- Zainstaluj pakiet RPM. Spowoduje to utworzenie lokalnego repozytorium.
[root@rhel87 ~]# ls anaconda-ks.cfg nvidia-driver-local-repo-rhel8-535.54.03-1.0-1.x86_64.rpm [root@rhel87 ~]# yum localinstall ./nvidia-driver-local-repo-rhel8-535.54.03-1.0-1.x86_64.rpm ...output skipped... [root@rhel87 ~]# yum repolist Updating Subscription Management repositories. Unable to read consumer identity This system is not registered with an entitlement server. You can use subscription-manager to register. repo id repo name my-rhel-87-AppStream-iso my RHEL 87 AppStream iso my-rhel-87-BaseOS-iso my RHEL 87 BaseOS iso my-rhel-extra-rpms my RHEL extra rpms nvidia-driver-local-rhel8-535.54.03 nvidia-driver-local-rhel8-535.54.03 [root@rhel87 ~]#
- Instalować DKMS. DKMS nie działa w systemie Red Hat Enterprise Linux. Jest on dostępny w dodatkowych pakietach dla systemu Enterprise Linux (EPEL).
Aby uzyskać więcej informacji na temat DKMS, zapoznaj się z artykułem Red Hat Czy protokół DKMS jest dostępny w systemie Red Hat Enterprise Linux.
[root@rhel87 ~]# yum install https://dl.fedoraproject.org/pub/epel/epel-release-latest-8.noarch.rpm [root@rhel87 ~]# yum install dkms
- W razie potrzeby EPEL można wyłączyć lub usunąć.
# to disable epel, edit the following configuration and change to "enabled=0" [root@rhel87 ~]# vi /etc/yum.repos.d/epel.repo # to remove the epel [root@rhel87 ~]# yum remove epel-release
- Zainstaluj narzędzia kompilacji i nagłówek jądra. Upewnij się, że dołączono subskrypcję Red Hat.
[root@rhel87 ~]# yum groupinstall "Development Tools" [root@rhel87 ~]# yum install kernel-devel-$(uname -r)
- Zainstaluj sterownik cuda
[root@rhel87 ~]# yum install cuda-driver
- Upewnij się, że sterownik został pomyślnie zainstalowany.
[root@rhel87 ~]# dkms status
nvidia/535.54.03, 4.18.0-425.3.1.el8.x86_64, x86_64: installed
[root@rhel87 ~]#
- Jeśli stan wskazany powyżej nie jest zainstalowany, ale zamiast tego jest Dodano, można go zbudować.
[root@rhel87 ~]# dkms build nvidia/535.54.03
- Jeśli wyznaczony stan jest zbudowany, możesz go zainstalować.
[root@rhel87 ~]# dkms install nvidia/535.54.03
- Jeśli stan nie powiódł się podczas kompilowania lub instalowania, przejrzyj dzienniki w następującej ścieżce:
[root@rhel87 ~]# ls /var/lib/dkms/nvidia/535.54.03/4.18.0-425.3.1.el8.x86_64/x86_64/log/make.log [root@rhel87 ~]#
- Uruchom ponownie serwer po zainstalowaniu sterownika NVIDIA.
[root@rhel87 ~]# systemctl reboot
- Sprawdź , czy sterownik jest włączony i uruchomiony.
[root@rhel87 ~]# lsmod | grep nvidia nvidia_drm 73728 0 nvidia_modeset 1306624 1 nvidia_drm nvidia_uvm 1523712 0 nvidia 56426496 2 nvidia_uvm,nvidia_modeset drm_kms_helper 176128 4 qxl,nvidia_drm drm 565248 7 drm_kms_helper,qxl,nvidia,drm_ttm_helper,nvidia_drm,ttm [root@rhel87 ~]# nvidia-smi Tue Jul 25 12:00:29 2023 +---------------------------------------------------------------------------------------+ | NVIDIA-SMI 535.54.03 Driver Version: 535.54.03 CUDA Version: 12.2 | |-----------------------------------------+----------------------+----------------------+ | GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. | | | | MIG M. | |=========================================+======================+======================| | 0 Tesla P100-PCIE-12GB Off | 00000000:07:00.0 Off | 0 | | N/A 33C P0 29W / 250W | 0MiB / 12288MiB | 2% Default | | | | N/A | +-----------------------------------------+----------------------+----------------------+ +---------------------------------------------------------------------------------------+ | Processes: | | GPU GI CI PID Type Process name GPU Memory | | ID ID Usage | |=======================================================================================| | No running processes found | +---------------------------------------------------------------------------------------+ [root@rhel87 ~]# modinfo nvidia filename: /lib/modules/4.18.0-425.3.1.el8.x86_64/extra/nvidia.ko.xz firmware: nvidia/535.54.03/gsp_tu10x.bin firmware: nvidia/535.54.03/gsp_ga10x.bin alias: char-major-195-* version: 535.54.03 supported: external license: NVIDIA rhelversion: 8.7 srcversion: EA9C7EF32617E104C8240C4
W przypadku wystąpienia jakiegokolwiek problemu należy zebrać następujące dzienniki i skontaktować się z działem pomocy technicznej firmy Dell:
sosreport- Pliki dzienników wymienione powyżej w kompilacji lub w przypadku, gdy kompilacja sterownika nie powiodła się
- Dowolny
/var/log/nvidia-installer.loglub dowolne dzienniki wymienione w danych wyjściowych podczas instalacji
Inne informacje, które warto znać:
- Jeśli system Red Hat Enterprise Linux został zainstalowany i uruchomiony z graphical.target, po ponownym uruchomieniu może zostać wyświetlony ekran. Rozwiązaniem jest przeniesienie pliku /etc/X11/xorg.conf.d/10-nvidia.conf z folderu X11 i ponowne uruchomienie serwera.
- Jeśli chcesz przekazać procesor graficzny do maszyny wirtualnej w KVM za pomocą pliku graphical.target, kończy się to niepowodzeniem. Rozwiązaniem jest uruchomienie monitora maszyny wirtualnej Red Hat Enterprise Linux w trybie multi-user.target, ponieważ wtedy graphical.target uniemożliwia wyładowanie sterownika NVIDIA przed przekazaniem do maszyny wirtualnej.