PowerEdge: Jak nainstalovat ovladač NVIDIA v systému Red Hat Enterprise Linux
Summary: Tento článek pojednává o kompilaci a instalaci ovladače NVIDIA s podporou DKMS (Dynamic Kernel Module Support) v systému Red Hat Enterprise Linux, který má zakázané zabezpečené spouštění. ...
Instructions
Tento článek popisuje, jak zkompilovat a nainstalovat ovladač NVIDIA s DKMS v systému Red Hat Enterprise Linux se zakázaným zabezpečeným spouštěním.
Než začnete, ověřte, že je v systému BIOS zakázána možnost Secure Boot . Důvodem je to, že tato možnost instalace používá DKMS ke kompilaci ovladače NVIDIA ze zdrojového kódu libovolného aktuálně spuštěného jádra. Pro zkompilovaný ovladač neexistuje žádný podpis dodavatele. Pokud je povoleno zabezpečené spouštění, samoobslužně zkompilovaný ovladač se nenačte s chybou Required key not available. Ověřte aktuální stav příkazem mokutil --sb-state v systému Red Hat Enterprise Linux a změňte jej v systému BIOS stisknutím klávesy F2 během testu POST serveru.
Pokud je vyžadováno zabezpečené spouštění nebo pokud dáváte přednost předkompilovanému ovladači, přečtěte si následující článek o instalaci. Jak nainstalovat ovladač NVIDIA online v systému Red Hat Enterprise Linux s povoleným zabezpečeným spouštěním.
- Stáhněte požadovaný ovladač z webu NVIDIA .
- Vyberte správnou verzi systému Red Hat Enterprise Linux, například Red Hat Enterprise Linux 8.
- Vyberte správnou verzi architektury CUDA (Compute Unified Device Architecture) vyžadovanou sadou nástrojů CUDA, kterou se chystáte nainstalovat, například 12.2.
- Stažený balíček má otáčky za minutu, například nvidia-driver-local-repo-rhel8-535.54.03-1.0-1.x86_64.rpm
- Nainstalujte otáčky za minutu. Tím se vytvoří místní úložiště.
[root@rhel87 ~]# ls anaconda-ks.cfg nvidia-driver-local-repo-rhel8-535.54.03-1.0-1.x86_64.rpm [root@rhel87 ~]# yum localinstall ./nvidia-driver-local-repo-rhel8-535.54.03-1.0-1.x86_64.rpm ...output skipped... [root@rhel87 ~]# yum repolist Updating Subscription Management repositories. Unable to read consumer identity This system is not registered with an entitlement server. You can use subscription-manager to register. repo id repo name my-rhel-87-AppStream-iso my RHEL 87 AppStream iso my-rhel-87-BaseOS-iso my RHEL 87 BaseOS iso my-rhel-extra-rpms my RHEL extra rpms nvidia-driver-local-rhel8-535.54.03 nvidia-driver-local-rhel8-535.54.03 [root@rhel87 ~]#
- Nainstalovat DKMS. DKMS není v systému Red Hat Enterprise Linux. Je k dispozici v doplňkových balíčcích pro Enterprise Linux (EPEL).
Další podrobnosti o DKMS najdete v článku Red Hat Je DKMS k dispozici v systému Red Hat Enterprise Linux.
[root@rhel87 ~]# yum install https://dl.fedoraproject.org/pub/epel/epel-release-latest-8.noarch.rpm [root@rhel87 ~]# yum install dkms
- V případě potřeby můžete EPEL zakázat nebo odebrat.
# to disable epel, edit the following configuration and change to "enabled=0" [root@rhel87 ~]# vi /etc/yum.repos.d/epel.repo # to remove the epel [root@rhel87 ~]# yum remove epel-release
- Nainstalujte kompilační nástroje a hlavičku jádra. Ujistěte se, že je připojené předplatné Red Hat.
[root@rhel87 ~]# yum groupinstall "Development Tools" [root@rhel87 ~]# yum install kernel-devel-$(uname -r)
- Nainstalujte ovladač cuda
[root@rhel87 ~]# yum install cuda-driver
- Ověřte, že ovladač byl úspěšně nainstalován.
[root@rhel87 ~]# dkms status
nvidia/535.54.03, 4.18.0-425.3.1.el8.x86_64, x86_64: installed
[root@rhel87 ~]#
- Pokud výše uvedený stav není nainstalován, ale místo toho je přidán, můžete jej sestavit.
[root@rhel87 ~]# dkms build nvidia/535.54.03
- Pokud je určený stav vytvořen, můžete jej nainstalovat.
[root@rhel87 ~]# dkms install nvidia/535.54.03
- Pokud se stav při sestavování nebo instalaci nezdařil, zkontrolujte protokoly v následující cestě:
[root@rhel87 ~]# ls /var/lib/dkms/nvidia/535.54.03/4.18.0-425.3.1.el8.x86_64/x86_64/log/make.log [root@rhel87 ~]#
- Po instalaci ovladače NVIDIA restartujte server.
[root@rhel87 ~]# systemctl reboot
- Ověřte , zda je ovladač v provozu.
[root@rhel87 ~]# lsmod | grep nvidia nvidia_drm 73728 0 nvidia_modeset 1306624 1 nvidia_drm nvidia_uvm 1523712 0 nvidia 56426496 2 nvidia_uvm,nvidia_modeset drm_kms_helper 176128 4 qxl,nvidia_drm drm 565248 7 drm_kms_helper,qxl,nvidia,drm_ttm_helper,nvidia_drm,ttm [root@rhel87 ~]# nvidia-smi Tue Jul 25 12:00:29 2023 +---------------------------------------------------------------------------------------+ | NVIDIA-SMI 535.54.03 Driver Version: 535.54.03 CUDA Version: 12.2 | |-----------------------------------------+----------------------+----------------------+ | GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. | | | | MIG M. | |=========================================+======================+======================| | 0 Tesla P100-PCIE-12GB Off | 00000000:07:00.0 Off | 0 | | N/A 33C P0 29W / 250W | 0MiB / 12288MiB | 2% Default | | | | N/A | +-----------------------------------------+----------------------+----------------------+ +---------------------------------------------------------------------------------------+ | Processes: | | GPU GI CI PID Type Process name GPU Memory | | ID ID Usage | |=======================================================================================| | No running processes found | +---------------------------------------------------------------------------------------+ [root@rhel87 ~]# modinfo nvidia filename: /lib/modules/4.18.0-425.3.1.el8.x86_64/extra/nvidia.ko.xz firmware: nvidia/535.54.03/gsp_tu10x.bin firmware: nvidia/535.54.03/gsp_ga10x.bin alias: char-major-195-* version: 535.54.03 supported: external license: NVIDIA rhelversion: 8.7 srcversion: EA9C7EF32617E104C8240C4
Pokud se vyskytne nějaký problém, shromážděte následující protokoly a obraťte se na podporu společnosti Dell:
sosreport- Výše uvedené soubory protokolů jsou sestaveny nebo vytvořeny, pokud se sestavení ovladače nezdařilo.
- Jakékoli
/var/log/nvidia-installer.log, nebo jakékoli protokoly uvedené ve výstupu při instalaci
Další informace, které byste měli vědět:
- Pokud se systém Red Hat Enterprise Linux nainstaloval a spustil pomocí příkazu graphical.target, může se po restartování zobrazit černá obrazovka. Řešením je přesunout soubor /etc/X11/xorg.conf.d/10-nvidia.conf ze složky X11 a restartovat server.
- Pokud chcete předat GPU virtuálnímu počítači v KVM pomocí graphical.target, selže. Řešením je zavést hypervisor Red Hat Enterprise Linux do multi-user.target, protože pak graphical.target zabrání uvolnění ovladače NVIDIA před průchodem do virtuálního počítače.