PowerEdge: Jak zainstalować sterownik NVIDIA w systemie Red Hat Enterprise Linux?

Summary: W tym artykule omówiono kompilowanie i instalowanie sterownika NVIDIA z obsługą dynamicznego modułu jądra (DKMS) w systemie Red Hat Enterprise Linux z wyłączoną opcją "Secure Boot".

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

W tym artykule opisano sposób kompilowania i instalowania sterownika NVIDIA z systemem DKMS w systemie Red Hat Enterprise Linux z wyłączoną

opcją "Secure Boot".Przed rozpoczęciem upewnij się, że opcja Secure Boot jest wyłączona w systemie BIOS. Dzieje się tak, ponieważ ta opcja instalacji używa DKMS do kompilacji sterownika NVIDIA z kodu źródłowego dowolnego aktualnie uruchomionego jądra. Skompilowany sterownik nie zawiera podpisu dostawcy. Jeśli funkcja Secure Boot jest włączona, nie można załadować samodzielnie skompilowanego sterownika z błędem Required key not available. Sprawdź bieżący stan za pomocą polecenia mokutil --sb-state w systemie Red Hat Enterprise Linux i zmień ją w systemie BIOS, naciskając F2 podczas testu POST serwera.

Jeśli wymagany jest bezpieczny rozruch lub jeśli wolisz wstępnie skompilowany sterownik, zapoznaj się z następującym artykułem w celu zainstalowania.  Jak zainstalować sterownik NVIDIA online w systemie Red Hat Enterprise Linux z włączonym bezpiecznym rozruchem.

  1. Pobierz wymagany sterownik z witryny firmy NVIDIA .Kliknięcie tego hiperłącza powoduje wyświetlenie strony spoza witryny Dell Technologies.
    1. Wybierz odpowiednią wersję systemu Red Hat Enterprise Linux, na przykład Red Hat Enterprise Linux 8.
    2. Wybierz odpowiednią wersję rozwiązania Compute Unified Device Architecture (CUDA) wymaganą z zestawem narzędzi CUDA, który zamierzasz zainstalować, na przykład 12.2.
    3. Pobrany pakiet to plik RPM, na przykład nvidia-driver-local-repo-rhel8-535.54.03-1.0-1.x86_64.rpm
  2. Zainstaluj pakiet RPM. Spowoduje to utworzenie lokalnego repozytorium.
[root@rhel87 ~]# ls
anaconda-ks.cfg  nvidia-driver-local-repo-rhel8-535.54.03-1.0-1.x86_64.rpm
[root@rhel87 ~]# yum localinstall ./nvidia-driver-local-repo-rhel8-535.54.03-1.0-1.x86_64.rpm
...output skipped...
[root@rhel87 ~]# yum repolist
Updating Subscription Management repositories.
Unable to read consumer identity

This system is not registered with an entitlement server. You can use subscription-manager to register.

repo id                              repo name
my-rhel-87-AppStream-iso             my RHEL 87 AppStream iso
my-rhel-87-BaseOS-iso                my RHEL 87 BaseOS iso
my-rhel-extra-rpms                   my RHEL extra rpms
nvidia-driver-local-rhel8-535.54.03  nvidia-driver-local-rhel8-535.54.03
[root@rhel87 ~]#
  1. Instalować DKMS. DKMS nie działa w systemie Red Hat Enterprise Linux. Jest on dostępny w dodatkowych pakietach dla systemu Enterprise Linux (EPEL).Kliknięcie tego hiperłącza powoduje wyświetlenie strony spoza witryny Dell Technologies.  Aby uzyskać więcej informacji na temat DKMS, zapoznaj się z artykułem Red Hat Czy protokół DKMS jest dostępny w systemie Red Hat Enterprise LinuxKliknięcie tego hiperłącza powoduje wyświetlenie strony spoza witryny Dell Technologies.
[root@rhel87 ~]# yum install https://dl.fedoraproject.org/pub/epel/epel-release-latest-8.noarch.rpm
[root@rhel87 ~]# yum install dkms
  1. W razie potrzeby EPEL można wyłączyć lub usunąć.
# to disable epel, edit the following configuration and change to "enabled=0" 
[root@rhel87 ~]# vi /etc/yum.repos.d/epel.repo 

# to remove the epel 
[root@rhel87 ~]# yum remove epel-release
  1. Zainstaluj narzędzia kompilacji i nagłówek jądra. Upewnij się, że dołączono subskrypcję Red Hat.
[root@rhel87 ~]# yum groupinstall "Development Tools"
[root@rhel87 ~]# yum install kernel-devel-$(uname -r)
  1. Zainstaluj sterownik cuda
[root@rhel87 ~]# yum install cuda-driver
  1. Upewnij się, że sterownik został pomyślnie zainstalowany.
[root@rhel87 ~]# dkms status
nvidia/535.54.03, 4.18.0-425.3.1.el8.x86_64, x86_64: installed
[root@rhel87 ~]#
  1. Jeśli stan wskazany powyżej nie jest zainstalowany, ale zamiast tego jest Dodano, można go zbudować.
[root@rhel87 ~]# dkms build nvidia/535.54.03
  1. Jeśli wyznaczony stan jest zbudowany, możesz go zainstalować.
[root@rhel87 ~]# dkms install nvidia/535.54.03
  1. Jeśli stan nie powiódł się podczas kompilowania lub instalowania, przejrzyj dzienniki w następującej ścieżce:
[root@rhel87 ~]# ls /var/lib/dkms/nvidia/535.54.03/4.18.0-425.3.1.el8.x86_64/x86_64/log/make.log
[root@rhel87 ~]#
  1. Uruchom ponownie serwer po zainstalowaniu sterownika NVIDIA.
[root@rhel87 ~]# systemctl reboot
  1. Sprawdź , czy sterownik jest włączony i uruchomiony.
[root@rhel87 ~]# lsmod | grep nvidia
nvidia_drm             73728  0
nvidia_modeset       1306624  1 nvidia_drm
nvidia_uvm           1523712  0
nvidia              56426496  2 nvidia_uvm,nvidia_modeset
drm_kms_helper        176128  4 qxl,nvidia_drm
drm                   565248  7 drm_kms_helper,qxl,nvidia,drm_ttm_helper,nvidia_drm,ttm
[root@rhel87 ~]# nvidia-smi
Tue Jul 25 12:00:29 2023
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 535.54.03              Driver Version: 535.54.03    CUDA Version: 12.2     |
|-----------------------------------------+----------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
|=========================================+======================+======================|
|   0  Tesla P100-PCIE-12GB           Off | 00000000:07:00.0 Off |                    0 |
| N/A   33C    P0              29W / 250W |      0MiB / 12288MiB |      2%      Default |
|                                         |                      |                  N/A |
+-----------------------------------------+----------------------+----------------------+

+---------------------------------------------------------------------------------------+
| Processes:                                                                            |
|  GPU   GI   CI        PID   Type   Process name                            GPU Memory |
|        ID   ID                                                             Usage      |
|=======================================================================================|
|  No running processes found                                                           |
+---------------------------------------------------------------------------------------+
[root@rhel87 ~]# modinfo nvidia
filename:       /lib/modules/4.18.0-425.3.1.el8.x86_64/extra/nvidia.ko.xz
firmware:       nvidia/535.54.03/gsp_tu10x.bin
firmware:       nvidia/535.54.03/gsp_ga10x.bin
alias:          char-major-195-*
version:        535.54.03
supported:      external
license:        NVIDIA
rhelversion:    8.7
srcversion:     EA9C7EF32617E104C8240C4



W przypadku wystąpienia jakiegokolwiek problemu należy zebrać następujące dzienniki i skontaktować się z działem pomocy technicznej firmy Dell:

  • sosreport
  • Pliki dzienników wymienione powyżej w kompilacji lub w przypadku, gdy kompilacja sterownika nie powiodła się
  • Dowolny /var/log/nvidia-installer.loglub dowolne dzienniki wymienione w danych wyjściowych podczas instalacji

Inne informacje, które warto znać:

  • Jeśli system Red Hat Enterprise Linux został zainstalowany i uruchomiony z graphical.target, po ponownym uruchomieniu może zostać wyświetlony ekran. Rozwiązaniem jest przeniesienie pliku /etc/X11/xorg.conf.d/10-nvidia.conf z folderu X11 i ponowne uruchomienie serwera.
  • Jeśli chcesz przekazać procesor graficzny do maszyny wirtualnej w KVM za pomocą pliku graphical.target, kończy się to niepowodzeniem. Rozwiązaniem jest uruchomienie monitora maszyny wirtualnej Red Hat Enterprise Linux w trybie multi-user.target, ponieważ wtedy graphical.target uniemożliwia wyładowanie sterownika NVIDIA przed przekazaniem do maszyny wirtualnej.

Affected Products

Red Hat Enterprise Linux Version 7, Red Hat Enterprise Linux Version 9, Red Hat Enterprise Linux Version 8

Products

DSS 8440, Poweredge C4140, PowerEdge C6525, PowerEdge R640, PowerEdge R650, PowerEdge R6515, PowerEdge R6525, PowerEdge R740, PowerEdge R740XD, PowerEdge R7425, PowerEdge R750, PowerEdge R750XA, PowerEdge R7515, PowerEdge R7525, PowerEdge R840 , PowerEdge R940xa, PowerEdge T550, PowerEdge T640, PowerEdge XE2420, PowerEdge XE7420, PowerEdge XE9680 ...
Article Properties
Article Number: 000216077
Article Type: How To
Last Modified: 06 Dec 2024
Version:  5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.