PowerEdge: Sådan installeres NVIDIA-driver i Red Hat Enterprise Linux

Summary: Denne artikel omhandler kompilering og installation af en NVIDIA-driver med understøttelse af Dynamic Kernel Module (DKMS) i Red Hat Enterprise Linux, hvor "Sikker start" er deaktiveret. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

Denne artikel beskriver, hvordan du kompilerer og installerer en NVIDIA-driver med DKMS i Red Hat Enterprise Linux, hvor "Sikker start" er deaktiveret.

Før du går i gang, skal du sikre dig, at indstillingen Sikker opstart er deaktiveret i BIOS. Dette skyldes, at denne installationsindstilling bruger DKMS til at kompilere NVIDIA-driveren fra kildekoden for enhver aktuelt kørende kerne. Der er ingen leverandørsignatur for den kompilerede driver. Hvis Sikker opstart er aktiveret, kan den selvkompilerede driver ikke indlæses med fejlen Required key not available. Kontroller den aktuelle status ved hjælp af kommando mokutil --sb-state i Red Hat Enterprise Linux, og skift det i BIOS ved at trykke på F2 under serverens POST.

Hvis sikker start er påkrævet, eller hvis du foretrækker en forudkompileret driver, skal du se følgende artikel for at installere.  Sådan installeres NVIDIA-driver online i Red Hat Enterprise Linux med Secure Boot aktiveret.

  1. Download den nødvendige driver fra NVIDIA-webstedet .Dette hyperlink fører dig til et websted uden for Dell Technologies.
    1. Vælg den korrekte version af Red Hat Enterprise Linux, for eksempel Red Hat Enterprise Linux 8.
    2. Vælg den korrekte CUDA-version (Compute Unified Device Architecture), der kræves med det CUDA-værktøjssæt, du vil installere, f.eks. 12.2.
    3. Downloadpakken er en RPM, for eksempel nvidia-driver-local-repo-rhel8-535.54.03-1.0-1.x86_64.rpm
  2. Monter RPM. Det opretter et lokalt lager.
[root@rhel87 ~]# ls
anaconda-ks.cfg  nvidia-driver-local-repo-rhel8-535.54.03-1.0-1.x86_64.rpm
[root@rhel87 ~]# yum localinstall ./nvidia-driver-local-repo-rhel8-535.54.03-1.0-1.x86_64.rpm
...output skipped...
[root@rhel87 ~]# yum repolist
Updating Subscription Management repositories.
Unable to read consumer identity

This system is not registered with an entitlement server. You can use subscription-manager to register.

repo id                              repo name
my-rhel-87-AppStream-iso             my RHEL 87 AppStream iso
my-rhel-87-BaseOS-iso                my RHEL 87 BaseOS iso
my-rhel-extra-rpms                   my RHEL extra rpms
nvidia-driver-local-rhel8-535.54.03  nvidia-driver-local-rhel8-535.54.03
[root@rhel87 ~]#
  1. Installere DKMS. DKMS findes ikke i Red Hat Enterprise Linux. Den er tilgængelig i ekstra pakker til Enterprise Linux (EPEL).Dette hyperlink fører dig til et websted uden for Dell Technologies.  For flere detaljer om DKMS, se Red Hat-artiklen Er DKMS leveret i Red Hat Enterprise Linux Dette hyperlink fører dig til et websted uden for Dell Technologies.
[root@rhel87 ~]# yum install https://dl.fedoraproject.org/pub/epel/epel-release-latest-8.noarch.rpm
[root@rhel87 ~]# yum install dkms
  1. Du kan deaktivere eller fjerne EPEL, hvis det kræves.
# to disable epel, edit the following configuration and change to "enabled=0" 
[root@rhel87 ~]# vi /etc/yum.repos.d/epel.repo 

# to remove the epel 
[root@rhel87 ~]# yum remove epel-release
  1. Installer kompileringsværktøjer og kerneoverskrift. Sørg for, at Red Hat-abonnementet er vedhæftet.
[root@rhel87 ~]# yum groupinstall "Development Tools"
[root@rhel87 ~]# yum install kernel-devel-$(uname -r)
  1. Monter cuda-driveren
[root@rhel87 ~]# yum install cuda-driver
  1. Bekræft, at driveren blev installeret korrekt.
[root@rhel87 ~]# dkms status
nvidia/535.54.03, 4.18.0-425.3.1.el8.x86_64, x86_64: installed
[root@rhel87 ~]#
  1. Hvis den status, der er angivet ovenfor, ikke er installeret, men i stedet er tilføjet, kan du bygge den.
[root@rhel87 ~]# dkms build nvidia/535.54.03
  1. Hvis den angivne status er oprettet, kan du installere den.
[root@rhel87 ~]# dkms install nvidia/535.54.03
  1. Hvis status mislykkedes under opbygning eller installation, skal du gennemse logfilerne på følgende sti:
[root@rhel87 ~]# ls /var/lib/dkms/nvidia/535.54.03/4.18.0-425.3.1.el8.x86_64/x86_64/log/make.log
[root@rhel87 ~]#
  1. Genstart serveren, når NVIDIA-driveren er installeret.
[root@rhel87 ~]# systemctl reboot
  1. Kontroller , at driveren kører.
[root@rhel87 ~]# lsmod | grep nvidia
nvidia_drm             73728  0
nvidia_modeset       1306624  1 nvidia_drm
nvidia_uvm           1523712  0
nvidia              56426496  2 nvidia_uvm,nvidia_modeset
drm_kms_helper        176128  4 qxl,nvidia_drm
drm                   565248  7 drm_kms_helper,qxl,nvidia,drm_ttm_helper,nvidia_drm,ttm
[root@rhel87 ~]# nvidia-smi
Tue Jul 25 12:00:29 2023
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 535.54.03              Driver Version: 535.54.03    CUDA Version: 12.2     |
|-----------------------------------------+----------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
|=========================================+======================+======================|
|   0  Tesla P100-PCIE-12GB           Off | 00000000:07:00.0 Off |                    0 |
| N/A   33C    P0              29W / 250W |      0MiB / 12288MiB |      2%      Default |
|                                         |                      |                  N/A |
+-----------------------------------------+----------------------+----------------------+

+---------------------------------------------------------------------------------------+
| Processes:                                                                            |
|  GPU   GI   CI        PID   Type   Process name                            GPU Memory |
|        ID   ID                                                             Usage      |
|=======================================================================================|
|  No running processes found                                                           |
+---------------------------------------------------------------------------------------+
[root@rhel87 ~]# modinfo nvidia
filename:       /lib/modules/4.18.0-425.3.1.el8.x86_64/extra/nvidia.ko.xz
firmware:       nvidia/535.54.03/gsp_tu10x.bin
firmware:       nvidia/535.54.03/gsp_ga10x.bin
alias:          char-major-195-*
version:        535.54.03
supported:      external
license:        NVIDIA
rhelversion:    8.7
srcversion:     EA9C7EF32617E104C8240C4



Hvis der er problemer, skal du indsamle følgende logfiler til og kontakte Dell Support:

  • sosreport
  • Logfilerne nævnt ovenfor i den byggede eller lave, hvis driverbygningen mislykkedes
  • Enhver /var/log/nvidia-installer.logeller logfiler, der er nævnt i outputtet under installationen

Andre oplysninger at vide:

  • Hvis Red Hat Enterprise Linux er installeret og startet med graphical.target, kan du muligvis se en sort skærm efter genstart. Løsningen er at flytte /etc/X11/xorg.conf.d/10-nvidia.conf ud af mappen X11 og genstarte serveren.
  • Hvis du vil overføre GPU'en til en VM i KVM med graphical.target, mislykkes det. Løsningen er at starte hypervisor Red Hat Enterprise Linux i multi-user.target, fordi graphical.target forhindrer NVIDIA-driveren i at losse, før den går igennem til VM.

Affected Products

Red Hat Enterprise Linux Version 7, Red Hat Enterprise Linux Version 9, Red Hat Enterprise Linux Version 8

Products

DSS 8440, Poweredge C4140, PowerEdge C6525, PowerEdge R640, PowerEdge R650, PowerEdge R6515, PowerEdge R6525, PowerEdge R740, PowerEdge R740XD, PowerEdge R7425, PowerEdge R750, PowerEdge R750XA, PowerEdge R7515, PowerEdge R7525, PowerEdge R840 , PowerEdge R940xa, PowerEdge T550, PowerEdge T640, PowerEdge XE2420, PowerEdge XE7420, PowerEdge XE9680 ...
Article Properties
Article Number: 000216077
Article Type: How To
Last Modified: 06 Dec 2024
Version:  5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.