PowerEdge: NVIDIA-driver installeren in Red Hat Enterprise Linux

Summary: In dit artikel wordt het compileren en installeren van een NVIDIA-driver met Dynamic Kernel Module Support (DKMS) in Red Hat Enterprise Linux beschreven waarop Secure Boot is uitgeschakeld. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

In dit artikel wordt beschreven hoe u een NVIDIA-driver met DKMS compileert en installeert in Red Hat Enterprise Linux waarop Secure Boot is uitgeschakeld.

Voordat u begint, moet u ervoor zorgen dat de optie Veilig opstarten is uitgeschakeld in het BIOS. Dit komt doordat deze installatieoptie DKMS gebruikt om het NVIDIA-stuurprogramma te compileren vanuit de broncode voor elke momenteel actieve kernel. Er is geen handtekening van de leverancier voor de gecompileerde driver. Als Secure Boot is ingeschakeld, wordt de zelfgecompileerde driver niet geladen met de fout Required key not available. Controleer de huidige status via een opdracht mokutil --sb-state in Red Hat Enterprise Linux en wijzig dit in het BIOS door op F2 te drukken tijdens server POST.

Als Secure Boot vereist is of als u de voorkeur geeft aan een vooraf gecompileerd stuurprogramma, raadpleegt u het volgende artikel voor het installeren ervan.  NVIDIA driver online installeren in Red Hat Enterprise Linux met Secure Boot ingeschakeld.

  1. Download de vereiste driver van de NVIDIA-site .Deze hyperlink leidt u naar een website buiten Dell Technologies.
    1. Selecteer de juiste versie van Red Hat Enterprise Linux, bijvoorbeeld Red Hat Enterprise Linux 8.
    2. Selecteer de juiste CUDA-versie (Compute Unified Device Architecture) die vereist is voor de CUDA-toolkit die u gaat installeren, bijvoorbeeld 12.2.
    3. Het downloadpakket is een RPM, bijvoorbeeld nvidia-driver-local-repo-rhel8-535.54.03-1.0-1.x86_64.rpm
  2. Installeer de RPM. Dat creëert een lokale repository.
[root@rhel87 ~]# ls
anaconda-ks.cfg  nvidia-driver-local-repo-rhel8-535.54.03-1.0-1.x86_64.rpm
[root@rhel87 ~]# yum localinstall ./nvidia-driver-local-repo-rhel8-535.54.03-1.0-1.x86_64.rpm
...output skipped...
[root@rhel87 ~]# yum repolist
Updating Subscription Management repositories.
Unable to read consumer identity

This system is not registered with an entitlement server. You can use subscription-manager to register.

repo id                              repo name
my-rhel-87-AppStream-iso             my RHEL 87 AppStream iso
my-rhel-87-BaseOS-iso                my RHEL 87 BaseOS iso
my-rhel-extra-rpms                   my RHEL extra rpms
nvidia-driver-local-rhel8-535.54.03  nvidia-driver-local-rhel8-535.54.03
[root@rhel87 ~]#
  1. Installeren DKMS. DKMS is niet in Red Hat Enterprise Linux. Het is beschikbaar in extra pakketten voor Enterprise Linux (EPEL).Deze hyperlink leidt u naar een website buiten Dell Technologies.  Zie het Red Hat-artikel Wordt DKMS geleverd in Red Hat Enterprise Linux voor meer informatie over DKMS. Deze hyperlink leidt u naar een website buiten Dell Technologies.
[root@rhel87 ~]# yum install https://dl.fedoraproject.org/pub/epel/epel-release-latest-8.noarch.rpm
[root@rhel87 ~]# yum install dkms
  1. U kunt de EPEL indien nodig uitschakelen of verwijderen.
# to disable epel, edit the following configuration and change to "enabled=0" 
[root@rhel87 ~]# vi /etc/yum.repos.d/epel.repo 

# to remove the epel 
[root@rhel87 ~]# yum remove epel-release
  1. Installeer compilatietools en kernelheader. Controleer of het Red Hat-abonnement is gekoppeld.
[root@rhel87 ~]# yum groupinstall "Development Tools"
[root@rhel87 ~]# yum install kernel-devel-$(uname -r)
  1. Installeer de cuda-driver
[root@rhel87 ~]# yum install cuda-driver
  1. Controleer of de driver correct is geïnstalleerd.
[root@rhel87 ~]# dkms status
nvidia/535.54.03, 4.18.0-425.3.1.el8.x86_64, x86_64: installed
[root@rhel87 ~]#
  1. Als de hierboven aangegeven status niet is geïnstalleerd, maar in plaats daarvan is toegevoegd, kunt u deze bouwen.
[root@rhel87 ~]# dkms build nvidia/535.54.03
  1. Als de aangewezen status is gebouwd, kunt u deze installeren.
[root@rhel87 ~]# dkms install nvidia/535.54.03
  1. Als de status tijdens het bouwen of installeren is mislukt, controleert u de logboeken op het volgende pad:
[root@rhel87 ~]# ls /var/lib/dkms/nvidia/535.54.03/4.18.0-425.3.1.el8.x86_64/x86_64/log/make.log
[root@rhel87 ~]#
  1. Start de server opnieuw op nadat de NVIDIA-driver is geïnstalleerd.
[root@rhel87 ~]# systemctl reboot
  1. Controleer of de driver werkt.
[root@rhel87 ~]# lsmod | grep nvidia
nvidia_drm             73728  0
nvidia_modeset       1306624  1 nvidia_drm
nvidia_uvm           1523712  0
nvidia              56426496  2 nvidia_uvm,nvidia_modeset
drm_kms_helper        176128  4 qxl,nvidia_drm
drm                   565248  7 drm_kms_helper,qxl,nvidia,drm_ttm_helper,nvidia_drm,ttm
[root@rhel87 ~]# nvidia-smi
Tue Jul 25 12:00:29 2023
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 535.54.03              Driver Version: 535.54.03    CUDA Version: 12.2     |
|-----------------------------------------+----------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
|=========================================+======================+======================|
|   0  Tesla P100-PCIE-12GB           Off | 00000000:07:00.0 Off |                    0 |
| N/A   33C    P0              29W / 250W |      0MiB / 12288MiB |      2%      Default |
|                                         |                      |                  N/A |
+-----------------------------------------+----------------------+----------------------+

+---------------------------------------------------------------------------------------+
| Processes:                                                                            |
|  GPU   GI   CI        PID   Type   Process name                            GPU Memory |
|        ID   ID                                                             Usage      |
|=======================================================================================|
|  No running processes found                                                           |
+---------------------------------------------------------------------------------------+
[root@rhel87 ~]# modinfo nvidia
filename:       /lib/modules/4.18.0-425.3.1.el8.x86_64/extra/nvidia.ko.xz
firmware:       nvidia/535.54.03/gsp_tu10x.bin
firmware:       nvidia/535.54.03/gsp_ga10x.bin
alias:          char-major-195-*
version:        535.54.03
supported:      external
license:        NVIDIA
rhelversion:    8.7
srcversion:     EA9C7EF32617E104C8240C4



Als er een probleem is, verzamelt u de volgende logboeken voor en neemt u contact op met Dell Support:

  • sosreport
  • De logbestanden die hierboven worden genoemd in de gemaakte versie of maken als de driverbuild is mislukt
  • Enig /var/log/nvidia-installer.log, of logbestanden die in de uitvoer worden genoemd tijdens het installeren van

Overige informatie die u moet weten:

  • Als Red Hat Enterprise Linux is geïnstalleerd en opgestart met graphical.target, ziet u mogelijk een zwart scherm na het opnieuw opstarten. De oplossing is om /etc/X11/xorg.conf.d/10-nvidia.conf uit de X11 map te halen en de server opnieuw op te starten.
  • Als u de GPU wilt doorgeven naar een VM in KVM met graphical.target, mislukt dit. De oplossing is om hypervisor Red Hat Enterprise Linux op te starten in multi-user.target, omdat graphical.target dan voorkomt dat de NVIDIA-driver wordt verwijderd voordat deze naar de VM wordt doorgegeven.

Affected Products

Red Hat Enterprise Linux Version 7, Red Hat Enterprise Linux Version 9, Red Hat Enterprise Linux Version 8

Products

DSS 8440, Poweredge C4140, PowerEdge C6525, PowerEdge R640, PowerEdge R650, PowerEdge R6515, PowerEdge R6525, PowerEdge R740, PowerEdge R740XD, PowerEdge R7425, PowerEdge R750, PowerEdge R750XA, PowerEdge R7515, PowerEdge R7525, PowerEdge R840 , PowerEdge R940xa, PowerEdge T550, PowerEdge T640, PowerEdge XE2420, PowerEdge XE7420, PowerEdge XE9680 ...
Article Properties
Article Number: 000216077
Article Type: How To
Last Modified: 06 Dec 2024
Version:  5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.