PowerEdge : Installation du pilote NVIDIA dans Red Hat Enterprise Linux
Summary: Cet article traite de la compilation et de l’installation d’un pilote NVIDIA avec prise en charge du module de noyau dynamique (DKMS) dans Red Hat Enterprise Linux pour lequel « Secure Boot » est désactivé. ...
Instructions
Cet article explique comment compiler et installer un pilote NVIDIA avec DKMS dans Red Hat Enterprise Linux pour lequel « Secure Boot » est désactivé.
Avant de commencer, assurez-vous que l’option Secure Boot est désactivée dans le BIOS. En effet, cette option d’installation utilise DKMS pour compiler le pilote NVIDIA à partir du code source de n’importe quel noyau en cours d’exécution. Il n’y a pas de signature du fournisseur pour le pilote compilé. Si Secure Boot est activé, le pilote autocompilé ne parvient pas à se charger et affiche l’erreur suivante : Required key not available. Vérifier l’état actuel à l’aide de la commande mokutil --sb-state sous Red Hat Enterprise Linux, et modifiez-le dans le BIOS en appuyant sur F2 pendant le POST du serveur.
Si Secure Boot est requis ou si vous préférez un pilote précompilé, consultez l’article suivant pour l’installer. Installation du pilote NVIDIA en ligne dans Red Hat Enterprise Linux avec Secure Boot activé.
- Téléchargez le pilote requis à partir du site NVIDIA .
- Sélectionnez la version correcte de Red Hat Enterprise Linux, par exemple Red Hat Enterprise Linux 8.
- Sélectionnez la version CUDA (Compute Unified Device Architecture) appropriée avec le kit d’outils CUDA que vous allez installer, par exemple 12.2.
- Le package de téléchargement est un RPM, par exemple nvidia-driver-local-repo-rhel8-535.54.03-1.0-1.x86_64.rpm
- Installez le RPM. Cela crée un référentiel local.
[root@rhel87 ~]# ls anaconda-ks.cfg nvidia-driver-local-repo-rhel8-535.54.03-1.0-1.x86_64.rpm [root@rhel87 ~]# yum localinstall ./nvidia-driver-local-repo-rhel8-535.54.03-1.0-1.x86_64.rpm ...output skipped... [root@rhel87 ~]# yum repolist Updating Subscription Management repositories. Unable to read consumer identity This system is not registered with an entitlement server. You can use subscription-manager to register. repo id repo name my-rhel-87-AppStream-iso my RHEL 87 AppStream iso my-rhel-87-BaseOS-iso my RHEL 87 BaseOS iso my-rhel-extra-rpms my RHEL extra rpms nvidia-driver-local-rhel8-535.54.03 nvidia-driver-local-rhel8-535.54.03 [root@rhel87 ~]#
- Installer DKMS. DKMS n’est pas dans Red Hat Enterprise Linux. Il est disponible dans des packages supplémentaires pour Enterprise Linux (EPEL).
Pour plus d’informations sur DKMS, voir l’article Red Hat DKMS est-il fourni dans Red Hat Enterprise Linux ?
[root@rhel87 ~]# yum install https://dl.fedoraproject.org/pub/epel/epel-release-latest-8.noarch.rpm [root@rhel87 ~]# yum install dkms
- Vous pouvez désactiver ou supprimer l’EPEL si nécessaire.
# to disable epel, edit the following configuration and change to "enabled=0" [root@rhel87 ~]# vi /etc/yum.repos.d/epel.repo # to remove the epel [root@rhel87 ~]# yum remove epel-release
- Installez les outils de compilation et l’en-tête du noyau. Assurez-vous que l’abonnement Red Hat est rattaché.
[root@rhel87 ~]# yum groupinstall "Development Tools" [root@rhel87 ~]# yum install kernel-devel-$(uname -r)
- Installer le pilote cuda
[root@rhel87 ~]# yum install cuda-driver
- Vérifiez que le pilote a bien été installé.
[root@rhel87 ~]# dkms status
nvidia/535.54.03, 4.18.0-425.3.1.el8.x86_64, x86_64: installed
[root@rhel87 ~]#
- Si l’état désigné ci-dessus n’est pas installé, mais qu’il est Ajouté, vous pouvez le créer.
[root@rhel87 ~]# dkms build nvidia/535.54.03
- Si l’état désigné est construit, vous pouvez l’installer.
[root@rhel87 ~]# dkms install nvidia/535.54.03
- Si l’état a échoué lors de la création ou de l’installation, vérifiez les journaux dans le chemin suivant :
[root@rhel87 ~]# ls /var/lib/dkms/nvidia/535.54.03/4.18.0-425.3.1.el8.x86_64/x86_64/log/make.log [root@rhel87 ~]#
- Redémarrez le serveur après l’installation du pilote NVIDIA.
[root@rhel87 ~]# systemctl reboot
- Vérifiez que le pilote est opérationnel.
[root@rhel87 ~]# lsmod | grep nvidia nvidia_drm 73728 0 nvidia_modeset 1306624 1 nvidia_drm nvidia_uvm 1523712 0 nvidia 56426496 2 nvidia_uvm,nvidia_modeset drm_kms_helper 176128 4 qxl,nvidia_drm drm 565248 7 drm_kms_helper,qxl,nvidia,drm_ttm_helper,nvidia_drm,ttm [root@rhel87 ~]# nvidia-smi Tue Jul 25 12:00:29 2023 +---------------------------------------------------------------------------------------+ | NVIDIA-SMI 535.54.03 Driver Version: 535.54.03 CUDA Version: 12.2 | |-----------------------------------------+----------------------+----------------------+ | GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. | | | | MIG M. | |=========================================+======================+======================| | 0 Tesla P100-PCIE-12GB Off | 00000000:07:00.0 Off | 0 | | N/A 33C P0 29W / 250W | 0MiB / 12288MiB | 2% Default | | | | N/A | +-----------------------------------------+----------------------+----------------------+ +---------------------------------------------------------------------------------------+ | Processes: | | GPU GI CI PID Type Process name GPU Memory | | ID ID Usage | |=======================================================================================| | No running processes found | +---------------------------------------------------------------------------------------+ [root@rhel87 ~]# modinfo nvidia filename: /lib/modules/4.18.0-425.3.1.el8.x86_64/extra/nvidia.ko.xz firmware: nvidia/535.54.03/gsp_tu10x.bin firmware: nvidia/535.54.03/gsp_ga10x.bin alias: char-major-195-* version: 535.54.03 supported: external license: NVIDIA rhelversion: 8.7 srcversion: EA9C7EF32617E104C8240C4
En cas de problème, collectez dans les journaux suivants et contactez le support Dell :
sosreport- Les fichiers journaux mentionnés ci-dessus dans la section Créé ou Créer en cas d’échec de la version du pilote
- Tout
/var/log/nvidia-installer.logou tous les journaux mentionnés dans le résultat lors de l’installation
Autres informations à connaître :
- Si Red Hat Enterprise Linux est installé et démarré avec graphical.target, vous pouvez voir un écran noir après le redémarrage. La solution consiste à déplacer /etc/X11/xorg.conf.d/10-nvidia.conf hors du dossier X11 et à redémarrer le serveur.
- Si vous souhaitez transférer le processeur graphique à une machine virtuelle dans KVM avec graphical.target, cela échoue. La solution consiste à démarrer l’hyperviseur Red Hat Enterprise Linux dans multi-user.target, car graphical.target empêche le pilote NVIDIA de se décharger avant de le transmettre à la machine virtuelle.