PowerEdge: Slik installerer du NVIDIA-driveren i Red Hat Enterprise Linux

Summary: Denne artikkelen omhandler kompilering og installasjon av en NVIDIA-driver med støtte for dynamisk kjernemodul (DKMS) i Red Hat Enterprise Linux som har "sikker oppstart" deaktivert.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

Denne artikkelen beskriver hvordan du kompilerer og installerer en NVIDIA-driver med DKMS i Red Hat Enterprise Linux som har "sikker oppstart" deaktivert.

Før du begynner, må du kontrollere at alternativet Sikker oppstart er deaktivert i BIOS. Dette er fordi dette installasjonsalternativet bruker DKMS til å kompilere NVIDIA-driveren fra kildekoden for alle gjeldende kjørende kjerner. Det er ingen leverandørsignatur for den kompilerte driveren. Hvis sikker oppstart er aktivert, lastes ikke den selvkompilerte driveren med feilen Required key not available. Bekreft gjeldende status med kommando mokutil --sb-state i Red Hat Enterprise Linux, og endre den i BIOS ved å trykke på F2 under server POST.

Hvis sikker oppstart kreves, eller hvis du foretrekker en forhåndskompilert driver, kan du se følgende artikkel for å installere. Slik installerer du NVIDIA-driveren online i Red Hat Enterprise Linux med sikker oppstart aktivert.

  1. Last ned den nødvendige driveren fra NVIDIA-nettstedet .Denne hyperkoblingen tar deg til et nettsted utenfor Dell Technologies.
    1. Velg riktig versjon av Red Hat Enterprise Linux, for eksempel Red Hat Enterprise Linux 8.
    2. Velg riktig CUDA-versjon (Compute Unified Device Architecture) som kreves med CUDA-verktøysettet du skal installere, for eksempel 12.2.
    3. Nedlastingspakken er et RPM, for eksempel nvidia-driver-local-repo-rhel8-535.54.03-1.0-1.x86_64.rpm
  2. Sett inn RPM. Det skaper et lokalt depot.
[root@rhel87 ~]# ls
anaconda-ks.cfg  nvidia-driver-local-repo-rhel8-535.54.03-1.0-1.x86_64.rpm
[root@rhel87 ~]# yum localinstall ./nvidia-driver-local-repo-rhel8-535.54.03-1.0-1.x86_64.rpm
...output skipped...
[root@rhel87 ~]# yum repolist
Updating Subscription Management repositories.
Unable to read consumer identity

This system is not registered with an entitlement server. You can use subscription-manager to register.

repo id                              repo name
my-rhel-87-AppStream-iso             my RHEL 87 AppStream iso
my-rhel-87-BaseOS-iso                my RHEL 87 BaseOS iso
my-rhel-extra-rpms                   my RHEL extra rpms
nvidia-driver-local-rhel8-535.54.03  nvidia-driver-local-rhel8-535.54.03
[root@rhel87 ~]#
  1. Installere DKMS. DKMS er ikke i Red Hat Enterprise Linux. Den er tilgjengelig i Ekstra pakker for Enterprise Linux (EPEL).Denne hyperkoblingen tar deg til et nettsted utenfor Dell Technologies.  For mer informasjon om DKMS, se Red Hat-artikkelen Is DKMS provided in Red Hat Enterprise Linux Denne hyperkoblingen tar deg til et nettsted utenfor Dell Technologies.
[root@rhel87 ~]# yum install https://dl.fedoraproject.org/pub/epel/epel-release-latest-8.noarch.rpm
[root@rhel87 ~]# yum install dkms
  1. Du kan deaktivere eller fjerne EPEL hvis det er nødvendig.
# to disable epel, edit the following configuration and change to "enabled=0" 
[root@rhel87 ~]# vi /etc/yum.repos.d/epel.repo 

# to remove the epel 
[root@rhel87 ~]# yum remove epel-release
  1. Installer kompileringsverktøy og kjernehode. Kontroller at Red Hat-abonnementet er vedlagt.
[root@rhel87 ~]# yum groupinstall "Development Tools"
[root@rhel87 ~]# yum install kernel-devel-$(uname -r)
  1. Installer cuda-driveren
[root@rhel87 ~]# yum install cuda-driver
  1. Bekreft at driveren ble installert.
[root@rhel87 ~]# dkms status
nvidia/535.54.03, 4.18.0-425.3.1.el8.x86_64, x86_64: installed
[root@rhel87 ~]#
  1. Hvis statusen angitt ovenfor ikke er installert, men i stedet er lagt til, kan du bygge den.
[root@rhel87 ~]# dkms build nvidia/535.54.03
  1. Hvis den angitte statusen er bygget, kan du installere den.
[root@rhel87 ~]# dkms install nvidia/535.54.03
  1. Hvis statusen mislyktes under bygging eller installasjon, ser du gjennom loggene i følgende bane:
[root@rhel87 ~]# ls /var/lib/dkms/nvidia/535.54.03/4.18.0-425.3.1.el8.x86_64/x86_64/log/make.log
[root@rhel87 ~]#
  1. Start serveren på nytt etter at NVIDIA-driveren er installert.
[root@rhel87 ~]# systemctl reboot
  1. Kontroller at driveren er oppe og går.
[root@rhel87 ~]# lsmod | grep nvidia
nvidia_drm             73728  0
nvidia_modeset       1306624  1 nvidia_drm
nvidia_uvm           1523712  0
nvidia              56426496  2 nvidia_uvm,nvidia_modeset
drm_kms_helper        176128  4 qxl,nvidia_drm
drm                   565248  7 drm_kms_helper,qxl,nvidia,drm_ttm_helper,nvidia_drm,ttm
[root@rhel87 ~]# nvidia-smi
Tue Jul 25 12:00:29 2023
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 535.54.03              Driver Version: 535.54.03    CUDA Version: 12.2     |
|-----------------------------------------+----------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
|=========================================+======================+======================|
|   0  Tesla P100-PCIE-12GB           Off | 00000000:07:00.0 Off |                    0 |
| N/A   33C    P0              29W / 250W |      0MiB / 12288MiB |      2%      Default |
|                                         |                      |                  N/A |
+-----------------------------------------+----------------------+----------------------+

+---------------------------------------------------------------------------------------+
| Processes:                                                                            |
|  GPU   GI   CI        PID   Type   Process name                            GPU Memory |
|        ID   ID                                                             Usage      |
|=======================================================================================|
|  No running processes found                                                           |
+---------------------------------------------------------------------------------------+
[root@rhel87 ~]# modinfo nvidia
filename:       /lib/modules/4.18.0-425.3.1.el8.x86_64/extra/nvidia.ko.xz
firmware:       nvidia/535.54.03/gsp_tu10x.bin
firmware:       nvidia/535.54.03/gsp_ga10x.bin
alias:          char-major-195-*
version:        535.54.03
supported:      external
license:        NVIDIA
rhelversion:    8.7
srcversion:     EA9C7EF32617E104C8240C4



Hvis det oppstår problemer, kan du samle inn følgende logger for å finne og kontakte Dell Support:

  • sosreport
  • Loggfilene nevnt ovenfor i den bygde eller gjør hvis driveren bygge mislyktes
  • Enhver /var/log/nvidia-installer.log, eller eventuelle logger som ble nevnt i utdataene under installasjonen

Annen informasjon å vite:

  • Hvis Red Hat Enterprise Linux installert og startet opp med graphical.target, kan du se en svart skjerm etter omstart. Løsningen er å flytte /etc/X11/xorg.conf.d/10-nvidia.conf ut av X11-mappen og starte serveren på nytt.
  • Hvis du vil overføre GPU-en til en virtuell maskin i KVM med graphical.target, mislykkes den. Løsningen er å starte hypervisor Red Hat Enterprise Linux i multi-user.target fordi da graphical.target forhindrer at NVIDIA-driveren lastes ut før den går gjennom til VM.

Affected Products

Red Hat Enterprise Linux Version 7, Red Hat Enterprise Linux Version 9, Red Hat Enterprise Linux Version 8

Products

DSS 8440, Poweredge C4140, PowerEdge C6525, PowerEdge R640, PowerEdge R650, PowerEdge R6515, PowerEdge R6525, PowerEdge R740, PowerEdge R740XD, PowerEdge R7425, PowerEdge R750, PowerEdge R750XA, PowerEdge R7515, PowerEdge R7525, PowerEdge R840 , PowerEdge R940xa, PowerEdge T550, PowerEdge T640, PowerEdge XE2420, PowerEdge XE7420, PowerEdge XE9680 ...
Article Properties
Article Number: 000216077
Article Type: How To
Last Modified: 06 Dec 2024
Version:  5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.