PowerEdge: Jak nainstalovat ovladač NVIDIA v systému Red Hat Enterprise Linux

Summary: Tento článek pojednává o kompilaci a instalaci ovladače NVIDIA s podporou DKMS (Dynamic Kernel Module Support) v systému Red Hat Enterprise Linux, který má zakázané zabezpečené spouštění. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

Tento článek popisuje, jak zkompilovat a nainstalovat ovladač NVIDIA s DKMS v systému Red Hat Enterprise Linux se zakázaným zabezpečeným spouštěním.

Než začnete, ověřte, že je v systému BIOS zakázána možnost Secure Boot . Důvodem je to, že tato možnost instalace používá DKMS ke kompilaci ovladače NVIDIA ze zdrojového kódu libovolného aktuálně spuštěného jádra. Pro zkompilovaný ovladač neexistuje žádný podpis dodavatele. Pokud je povoleno zabezpečené spouštění, samoobslužně zkompilovaný ovladač se nenačte s chybou Required key not available. Ověřte aktuální stav příkazem mokutil --sb-state v systému Red Hat Enterprise Linux a změňte jej v systému BIOS stisknutím klávesy F2 během testu POST serveru.

Pokud je vyžadováno zabezpečené spouštění nebo pokud dáváte přednost předkompilovanému ovladači, přečtěte si následující článek o instalaci. Jak nainstalovat ovladač NVIDIA online v systému Red Hat Enterprise Linux s povoleným zabezpečeným spouštěním.

  1. Stáhněte požadovaný ovladač z webu NVIDIA .Tento hypertextový odkaz vás zavede na webové stránky mimo společnost Dell Technologies.
    1. Vyberte správnou verzi systému Red Hat Enterprise Linux, například Red Hat Enterprise Linux 8.
    2. Vyberte správnou verzi architektury CUDA (Compute Unified Device Architecture) vyžadovanou sadou nástrojů CUDA, kterou se chystáte nainstalovat, například 12.2.
    3. Stažený balíček má otáčky za minutu, například nvidia-driver-local-repo-rhel8-535.54.03-1.0-1.x86_64.rpm
  2. Nainstalujte otáčky za minutu. Tím se vytvoří místní úložiště.
[root@rhel87 ~]# ls
anaconda-ks.cfg  nvidia-driver-local-repo-rhel8-535.54.03-1.0-1.x86_64.rpm
[root@rhel87 ~]# yum localinstall ./nvidia-driver-local-repo-rhel8-535.54.03-1.0-1.x86_64.rpm
...output skipped...
[root@rhel87 ~]# yum repolist
Updating Subscription Management repositories.
Unable to read consumer identity

This system is not registered with an entitlement server. You can use subscription-manager to register.

repo id                              repo name
my-rhel-87-AppStream-iso             my RHEL 87 AppStream iso
my-rhel-87-BaseOS-iso                my RHEL 87 BaseOS iso
my-rhel-extra-rpms                   my RHEL extra rpms
nvidia-driver-local-rhel8-535.54.03  nvidia-driver-local-rhel8-535.54.03
[root@rhel87 ~]#
  1. Nainstalovat DKMS. DKMS není v systému Red Hat Enterprise Linux. Je k dispozici v doplňkových balíčcích pro Enterprise Linux (EPEL).Tento hypertextový odkaz vás zavede na webové stránky mimo společnost Dell Technologies.  Další podrobnosti o DKMS najdete v článku Red Hat Je DKMS k dispozici v systému Red Hat Enterprise LinuxTento hypertextový odkaz vás zavede na webové stránky mimo společnost Dell Technologies.
[root@rhel87 ~]# yum install https://dl.fedoraproject.org/pub/epel/epel-release-latest-8.noarch.rpm
[root@rhel87 ~]# yum install dkms
  1. V případě potřeby můžete EPEL zakázat nebo odebrat.
# to disable epel, edit the following configuration and change to "enabled=0" 
[root@rhel87 ~]# vi /etc/yum.repos.d/epel.repo 

# to remove the epel 
[root@rhel87 ~]# yum remove epel-release
  1. Nainstalujte kompilační nástroje a hlavičku jádra. Ujistěte se, že je připojené předplatné Red Hat.
[root@rhel87 ~]# yum groupinstall "Development Tools"
[root@rhel87 ~]# yum install kernel-devel-$(uname -r)
  1. Nainstalujte ovladač cuda
[root@rhel87 ~]# yum install cuda-driver
  1. Ověřte, že ovladač byl úspěšně nainstalován.
[root@rhel87 ~]# dkms status
nvidia/535.54.03, 4.18.0-425.3.1.el8.x86_64, x86_64: installed
[root@rhel87 ~]#
  1. Pokud výše uvedený stav není nainstalován, ale místo toho je přidán, můžete jej sestavit.
[root@rhel87 ~]# dkms build nvidia/535.54.03
  1. Pokud je určený stav vytvořen, můžete jej nainstalovat.
[root@rhel87 ~]# dkms install nvidia/535.54.03
  1. Pokud se stav při sestavování nebo instalaci nezdařil, zkontrolujte protokoly v následující cestě:
[root@rhel87 ~]# ls /var/lib/dkms/nvidia/535.54.03/4.18.0-425.3.1.el8.x86_64/x86_64/log/make.log
[root@rhel87 ~]#
  1. Po instalaci ovladače NVIDIA restartujte server.
[root@rhel87 ~]# systemctl reboot
  1. Ověřte , zda je ovladač v provozu.
[root@rhel87 ~]# lsmod | grep nvidia
nvidia_drm             73728  0
nvidia_modeset       1306624  1 nvidia_drm
nvidia_uvm           1523712  0
nvidia              56426496  2 nvidia_uvm,nvidia_modeset
drm_kms_helper        176128  4 qxl,nvidia_drm
drm                   565248  7 drm_kms_helper,qxl,nvidia,drm_ttm_helper,nvidia_drm,ttm
[root@rhel87 ~]# nvidia-smi
Tue Jul 25 12:00:29 2023
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 535.54.03              Driver Version: 535.54.03    CUDA Version: 12.2     |
|-----------------------------------------+----------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
|=========================================+======================+======================|
|   0  Tesla P100-PCIE-12GB           Off | 00000000:07:00.0 Off |                    0 |
| N/A   33C    P0              29W / 250W |      0MiB / 12288MiB |      2%      Default |
|                                         |                      |                  N/A |
+-----------------------------------------+----------------------+----------------------+

+---------------------------------------------------------------------------------------+
| Processes:                                                                            |
|  GPU   GI   CI        PID   Type   Process name                            GPU Memory |
|        ID   ID                                                             Usage      |
|=======================================================================================|
|  No running processes found                                                           |
+---------------------------------------------------------------------------------------+
[root@rhel87 ~]# modinfo nvidia
filename:       /lib/modules/4.18.0-425.3.1.el8.x86_64/extra/nvidia.ko.xz
firmware:       nvidia/535.54.03/gsp_tu10x.bin
firmware:       nvidia/535.54.03/gsp_ga10x.bin
alias:          char-major-195-*
version:        535.54.03
supported:      external
license:        NVIDIA
rhelversion:    8.7
srcversion:     EA9C7EF32617E104C8240C4



Pokud se vyskytne nějaký problém, shromážděte následující protokoly a obraťte se na podporu společnosti Dell:

  • sosreport
  • Výše uvedené soubory protokolů jsou sestaveny nebo vytvořeny, pokud se sestavení ovladače nezdařilo.
  • Jakékoli /var/log/nvidia-installer.log, nebo jakékoli protokoly uvedené ve výstupu při instalaci

Další informace, které byste měli vědět:

  • Pokud se systém Red Hat Enterprise Linux nainstaloval a spustil pomocí příkazu graphical.target, může se po restartování zobrazit černá obrazovka. Řešením je přesunout soubor /etc/X11/xorg.conf.d/10-nvidia.conf ze složky X11 a restartovat server.
  • Pokud chcete předat GPU virtuálnímu počítači v KVM pomocí graphical.target, selže. Řešením je zavést hypervisor Red Hat Enterprise Linux do multi-user.target, protože pak graphical.target zabrání uvolnění ovladače NVIDIA před průchodem do virtuálního počítače.

Affected Products

Red Hat Enterprise Linux Version 7, Red Hat Enterprise Linux Version 9, Red Hat Enterprise Linux Version 8

Products

DSS 8440, Poweredge C4140, PowerEdge C6525, PowerEdge R640, PowerEdge R650, PowerEdge R6515, PowerEdge R6525, PowerEdge R740, PowerEdge R740XD, PowerEdge R7425, PowerEdge R750, PowerEdge R750XA, PowerEdge R7515, PowerEdge R7525, PowerEdge R840 , PowerEdge R940xa, PowerEdge T550, PowerEdge T640, PowerEdge XE2420, PowerEdge XE7420, PowerEdge XE9680 ...
Article Properties
Article Number: 000216077
Article Type: How To
Last Modified: 06 Dec 2024
Version:  5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.