PowerEdge: Så här installerar du NVIDIA-drivrutin i Red Hat Enterprise Linux

Summary: I den här artikeln beskrivs hur du kompilerar och installerar en NVIDIA-drivrutin med stöd för dynamisk kernelmodul (DKMS) i Red Hat Enterprise Linux där säker start är inaktiverat.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

I den här artikeln beskrivs hur du kompilerar och installerar en NVIDIA-drivrutin med DKMS i Red Hat Enterprise Linux där säker start är inaktiverat.

Innan du börjar kontrollerar du att alternativet Säker start är inaktiverat i BIOS. Det beror på att det här installationsalternativet använder DKMS för att kompilera NVIDIA-drivrutinen från källkoden för alla kernel som körs aktuellt. Det finns ingen leverantörssignatur för den kompilerade drivrutinen. Om säker start är aktiverat kan den självkompilerade drivrutinen inte läsas in med felet Required key not available. Kontrollera aktuell status med kommandot mokutil --sb-state i Red Hat Enterprise Linux och ändra det i BIOS genom att trycka på F2 under serverns POST.

Om säker start krävs, eller om du föredrar en förkompilerad drivrutin, se följande artikel för att installera. Så här installerar du NVIDIA-drivrutin online i Red Hat Enterprise Linux med säker start aktiverad.

  1. Ladda ner den drivrutin som krävs från NVIDIA-webbplatsen .Den här hyperlänken tar dig till en webbplats utanför Dell Technologies.
    1. Välj rätt version av Red Hat Enterprise Linux, till exempel Red Hat Enterprise Linux 8.
    2. Välj rätt CUDA-version (Compute Unified Device Architecture) som krävs med den CUDA-verktygslåda som du ska installera, till exempel 12.2.
    3. Det nerladdade paketet är ett RPM, till exempel nvidia-driver-local-repo-rhel8-535.54.03-1.0-1.x86_64.rpm
  2. Installera RPM. Då skapas en lokal lagringsplats.
[root@rhel87 ~]# ls
anaconda-ks.cfg  nvidia-driver-local-repo-rhel8-535.54.03-1.0-1.x86_64.rpm
[root@rhel87 ~]# yum localinstall ./nvidia-driver-local-repo-rhel8-535.54.03-1.0-1.x86_64.rpm
...output skipped...
[root@rhel87 ~]# yum repolist
Updating Subscription Management repositories.
Unable to read consumer identity

This system is not registered with an entitlement server. You can use subscription-manager to register.

repo id                              repo name
my-rhel-87-AppStream-iso             my RHEL 87 AppStream iso
my-rhel-87-BaseOS-iso                my RHEL 87 BaseOS iso
my-rhel-extra-rpms                   my RHEL extra rpms
nvidia-driver-local-rhel8-535.54.03  nvidia-driver-local-rhel8-535.54.03
[root@rhel87 ~]#
  1. Installera DKMS. DKMS finns inte i Red Hat Enterprise Linux. Den är tillgänglig i Extra Packages for Enterprise Linux (EPEL).Den här hyperlänken tar dig till en webbplats utanför Dell Technologies.  Mer information om DKMS finns i Red Hat-artikeln Tillhandahålls DKMS i Red Hat Enterprise Linux Den här hyperlänken tar dig till en webbplats utanför Dell Technologies.
[root@rhel87 ~]# yum install https://dl.fedoraproject.org/pub/epel/epel-release-latest-8.noarch.rpm
[root@rhel87 ~]# yum install dkms
  1. Du kan inaktivera eller ta bort EPEL om det behövs.
# to disable epel, edit the following configuration and change to "enabled=0" 
[root@rhel87 ~]# vi /etc/yum.repos.d/epel.repo 

# to remove the epel 
[root@rhel87 ~]# yum remove epel-release
  1. Installera kompileringsverktyg och kernelrubrik. Kontrollera att Red Hat-prenumerationen är ansluten.
[root@rhel87 ~]# yum groupinstall "Development Tools"
[root@rhel87 ~]# yum install kernel-devel-$(uname -r)
  1. Installera cuda-drivrutinen
[root@rhel87 ~]# yum install cuda-driver
  1. Bekräfta att drivrutinen har installerats.
[root@rhel87 ~]# dkms status
nvidia/535.54.03, 4.18.0-425.3.1.el8.x86_64, x86_64: installed
[root@rhel87 ~]#
  1. Om statusen som anges ovan inte är installerad, utan i stället har lagts till, kan du skapa den.
[root@rhel87 ~]# dkms build nvidia/535.54.03
  1. Om den angivna statusen är byggd kan du installera den.
[root@rhel87 ~]# dkms install nvidia/535.54.03
  1. Om statusen misslyckades med att skapa eller installera granskar du loggarna på följande sökväg:
[root@rhel87 ~]# ls /var/lib/dkms/nvidia/535.54.03/4.18.0-425.3.1.el8.x86_64/x86_64/log/make.log
[root@rhel87 ~]#
  1. Starta om servern när NVIDIA-drivrutinen har installerats.
[root@rhel87 ~]# systemctl reboot
  1. Kontrollera att drivrutinen fungerar.
[root@rhel87 ~]# lsmod | grep nvidia
nvidia_drm             73728  0
nvidia_modeset       1306624  1 nvidia_drm
nvidia_uvm           1523712  0
nvidia              56426496  2 nvidia_uvm,nvidia_modeset
drm_kms_helper        176128  4 qxl,nvidia_drm
drm                   565248  7 drm_kms_helper,qxl,nvidia,drm_ttm_helper,nvidia_drm,ttm
[root@rhel87 ~]# nvidia-smi
Tue Jul 25 12:00:29 2023
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 535.54.03              Driver Version: 535.54.03    CUDA Version: 12.2     |
|-----------------------------------------+----------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
|=========================================+======================+======================|
|   0  Tesla P100-PCIE-12GB           Off | 00000000:07:00.0 Off |                    0 |
| N/A   33C    P0              29W / 250W |      0MiB / 12288MiB |      2%      Default |
|                                         |                      |                  N/A |
+-----------------------------------------+----------------------+----------------------+

+---------------------------------------------------------------------------------------+
| Processes:                                                                            |
|  GPU   GI   CI        PID   Type   Process name                            GPU Memory |
|        ID   ID                                                             Usage      |
|=======================================================================================|
|  No running processes found                                                           |
+---------------------------------------------------------------------------------------+
[root@rhel87 ~]# modinfo nvidia
filename:       /lib/modules/4.18.0-425.3.1.el8.x86_64/extra/nvidia.ko.xz
firmware:       nvidia/535.54.03/gsp_tu10x.bin
firmware:       nvidia/535.54.03/gsp_ga10x.bin
alias:          char-major-195-*
version:        535.54.03
supported:      external
license:        NVIDIA
rhelversion:    8.7
srcversion:     EA9C7EF32617E104C8240C4



Om det skulle uppstå något problem samlar du in följande loggar för och kontaktar Dells support:

  • sosreport
  • Loggfilerna som nämns ovan i den skapade eller gör om drivrutinsversionen misslyckades
  • Någon /var/log/nvidia-installer.logeller några loggar som nämns i utdata under installationen

Övrig information som är bra att känna till:

  • Om Red Hat Enterprise Linux har installerats och startat med graphical.target kan du se en svart skärm efter omstart. Lösningen är att flytta /etc/X11/xorg.conf.d/10-nvidia.conf från X11-mappen och starta om servern.
  • Om du vill skicka GPU:n till en virtuell dator i KVM med graphical.target misslyckas det. Lösningen är att starta hypervisorn Red Hat Enterprise Linux i multi-user.target eftersom graphical.target förhindrar att NVIDIA-drivrutinen tas bort innan den skickas till den virtuella datorn.

Affected Products

Red Hat Enterprise Linux Version 7, Red Hat Enterprise Linux Version 9, Red Hat Enterprise Linux Version 8

Products

DSS 8440, Poweredge C4140, PowerEdge C6525, PowerEdge R640, PowerEdge R650, PowerEdge R6515, PowerEdge R6525, PowerEdge R740, PowerEdge R740XD, PowerEdge R7425, PowerEdge R750, PowerEdge R750XA, PowerEdge R7515, PowerEdge R7525, PowerEdge R840 , PowerEdge R940xa, PowerEdge T550, PowerEdge T640, PowerEdge XE2420, PowerEdge XE7420, PowerEdge XE9680 ...
Article Properties
Article Number: 000216077
Article Type: How To
Last Modified: 06 Dec 2024
Version:  5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.