PowerEdge : Installation du pilote NVIDIA dans Red Hat Enterprise Linux

Summary: Cet article traite de la compilation et de l’installation d’un pilote NVIDIA avec prise en charge du module de noyau dynamique (DKMS) dans Red Hat Enterprise Linux pour lequel « Secure Boot » est désactivé. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

Cet article explique comment compiler et installer un pilote NVIDIA avec DKMS dans Red Hat Enterprise Linux pour lequel « Secure Boot » est désactivé.

Avant de commencer, assurez-vous que l’option Secure Boot est désactivée dans le BIOS. En effet, cette option d’installation utilise DKMS pour compiler le pilote NVIDIA à partir du code source de n’importe quel noyau en cours d’exécution. Il n’y a pas de signature du fournisseur pour le pilote compilé. Si Secure Boot est activé, le pilote autocompilé ne parvient pas à se charger et affiche l’erreur suivante : Required key not available. Vérifier l’état actuel à l’aide de la commande mokutil --sb-state sous Red Hat Enterprise Linux, et modifiez-le dans le BIOS en appuyant sur F2 pendant le POST du serveur.

Si Secure Boot est requis ou si vous préférez un pilote précompilé, consultez l’article suivant pour l’installer.  Installation du pilote NVIDIA en ligne dans Red Hat Enterprise Linux avec Secure Boot activé.

  1. Téléchargez le pilote requis à partir du site NVIDIA .Ce lien hypertexte renvoie à un site Web extérieur à Dell Technologies.
    1. Sélectionnez la version correcte de Red Hat Enterprise Linux, par exemple Red Hat Enterprise Linux 8.
    2. Sélectionnez la version CUDA (Compute Unified Device Architecture) appropriée avec le kit d’outils CUDA que vous allez installer, par exemple 12.2.
    3. Le package de téléchargement est un RPM, par exemple nvidia-driver-local-repo-rhel8-535.54.03-1.0-1.x86_64.rpm
  2. Installez le RPM. Cela crée un référentiel local.
[root@rhel87 ~]# ls
anaconda-ks.cfg  nvidia-driver-local-repo-rhel8-535.54.03-1.0-1.x86_64.rpm
[root@rhel87 ~]# yum localinstall ./nvidia-driver-local-repo-rhel8-535.54.03-1.0-1.x86_64.rpm
...output skipped...
[root@rhel87 ~]# yum repolist
Updating Subscription Management repositories.
Unable to read consumer identity

This system is not registered with an entitlement server. You can use subscription-manager to register.

repo id                              repo name
my-rhel-87-AppStream-iso             my RHEL 87 AppStream iso
my-rhel-87-BaseOS-iso                my RHEL 87 BaseOS iso
my-rhel-extra-rpms                   my RHEL extra rpms
nvidia-driver-local-rhel8-535.54.03  nvidia-driver-local-rhel8-535.54.03
[root@rhel87 ~]#
  1. Installer DKMS. DKMS n’est pas dans Red Hat Enterprise Linux. Il est disponible dans des packages supplémentaires pour Enterprise Linux (EPEL).Ce lien hypertexte renvoie à un site Web extérieur à Dell Technologies.  Pour plus d’informations sur DKMS, voir l’article Red Hat DKMS est-il fourni dans Red Hat Enterprise LinuxCe lien hypertexte renvoie à un site Web extérieur à Dell Technologies.
[root@rhel87 ~]# yum install https://dl.fedoraproject.org/pub/epel/epel-release-latest-8.noarch.rpm
[root@rhel87 ~]# yum install dkms
  1. Vous pouvez désactiver ou supprimer l’EPEL si nécessaire.
# to disable epel, edit the following configuration and change to "enabled=0" 
[root@rhel87 ~]# vi /etc/yum.repos.d/epel.repo 

# to remove the epel 
[root@rhel87 ~]# yum remove epel-release
  1. Installez les outils de compilation et l’en-tête du noyau. Assurez-vous que l’abonnement Red Hat est rattaché.
[root@rhel87 ~]# yum groupinstall "Development Tools"
[root@rhel87 ~]# yum install kernel-devel-$(uname -r)
  1. Installer le pilote cuda
[root@rhel87 ~]# yum install cuda-driver
  1. Vérifiez que le pilote a bien été installé.
[root@rhel87 ~]# dkms status
nvidia/535.54.03, 4.18.0-425.3.1.el8.x86_64, x86_64: installed
[root@rhel87 ~]#
  1. Si l’état désigné ci-dessus n’est pas installé, mais qu’il est Ajouté, vous pouvez le créer.
[root@rhel87 ~]# dkms build nvidia/535.54.03
  1. Si l’état désigné est construit, vous pouvez l’installer.
[root@rhel87 ~]# dkms install nvidia/535.54.03
  1. Si l’état a échoué lors de la création ou de l’installation, vérifiez les journaux dans le chemin suivant :
[root@rhel87 ~]# ls /var/lib/dkms/nvidia/535.54.03/4.18.0-425.3.1.el8.x86_64/x86_64/log/make.log
[root@rhel87 ~]#
  1. Redémarrez le serveur après l’installation du pilote NVIDIA.
[root@rhel87 ~]# systemctl reboot
  1. Vérifiez que le pilote est opérationnel.
[root@rhel87 ~]# lsmod | grep nvidia
nvidia_drm             73728  0
nvidia_modeset       1306624  1 nvidia_drm
nvidia_uvm           1523712  0
nvidia              56426496  2 nvidia_uvm,nvidia_modeset
drm_kms_helper        176128  4 qxl,nvidia_drm
drm                   565248  7 drm_kms_helper,qxl,nvidia,drm_ttm_helper,nvidia_drm,ttm
[root@rhel87 ~]# nvidia-smi
Tue Jul 25 12:00:29 2023
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 535.54.03              Driver Version: 535.54.03    CUDA Version: 12.2     |
|-----------------------------------------+----------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
|=========================================+======================+======================|
|   0  Tesla P100-PCIE-12GB           Off | 00000000:07:00.0 Off |                    0 |
| N/A   33C    P0              29W / 250W |      0MiB / 12288MiB |      2%      Default |
|                                         |                      |                  N/A |
+-----------------------------------------+----------------------+----------------------+

+---------------------------------------------------------------------------------------+
| Processes:                                                                            |
|  GPU   GI   CI        PID   Type   Process name                            GPU Memory |
|        ID   ID                                                             Usage      |
|=======================================================================================|
|  No running processes found                                                           |
+---------------------------------------------------------------------------------------+
[root@rhel87 ~]# modinfo nvidia
filename:       /lib/modules/4.18.0-425.3.1.el8.x86_64/extra/nvidia.ko.xz
firmware:       nvidia/535.54.03/gsp_tu10x.bin
firmware:       nvidia/535.54.03/gsp_ga10x.bin
alias:          char-major-195-*
version:        535.54.03
supported:      external
license:        NVIDIA
rhelversion:    8.7
srcversion:     EA9C7EF32617E104C8240C4



En cas de problème, collectez dans les journaux suivants et contactez le support Dell :

  • sosreport
  • Les fichiers journaux mentionnés ci-dessus dans la section Créé ou Créer en cas d’échec de la version du pilote
  • Tout /var/log/nvidia-installer.logou tous les journaux mentionnés dans le résultat lors de l’installation

Autres informations à connaître :

  • Si Red Hat Enterprise Linux est installé et démarré avec graphical.target, vous pouvez voir un écran noir après le redémarrage. La solution consiste à déplacer /etc/X11/xorg.conf.d/10-nvidia.conf hors du dossier X11 et à redémarrer le serveur.
  • Si vous souhaitez transférer le processeur graphique à une machine virtuelle dans KVM avec graphical.target, cela échoue. La solution consiste à démarrer l’hyperviseur Red Hat Enterprise Linux dans multi-user.target, car graphical.target empêche le pilote NVIDIA de se décharger avant de le transmettre à la machine virtuelle.

Affected Products

Red Hat Enterprise Linux Version 7, Red Hat Enterprise Linux Version 9, Red Hat Enterprise Linux Version 8

Products

DSS 8440, Poweredge C4140, PowerEdge C6525, PowerEdge R640, PowerEdge R650, PowerEdge R6515, PowerEdge R6525, PowerEdge R740, PowerEdge R740XD, PowerEdge R7425, PowerEdge R750, PowerEdge R750XA, PowerEdge R7515, PowerEdge R7525, PowerEdge R840 , PowerEdge R940xa, PowerEdge T550, PowerEdge T640, PowerEdge XE2420, PowerEdge XE7420, PowerEdge XE9680 ...
Article Properties
Article Number: 000216077
Article Type: How To
Last Modified: 06 Dec 2024
Version:  5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.