PowerEdge:Red Hat Enterprise LinuxにNVIDIAドライバーをインストールする方法

Summary: この記事では、「セキュア ブート」が無効になっているRed Hat Enterprise Linuxで、動的カーネル モジュール サポート(DKMS)を使用してNVIDIAドライバーをコンパイルしてインストールする方法について説明します。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

この記事では、「セキュア ブート」が無効になっているRed Hat Enterprise Linuxで、DKMSを使用してNVIDIAドライバーをコンパイルしてインストールする方法について説明します

開始する前に、 BIOSでセキュア ブート オプションが無効になっていることを確認します。これは、このインストール オプションがDKMSを使用して、現在実行中のカーネルのソース コードからNVIDIAドライバーをコンパイルするためです。コンパイルされたドライバーのベンダー署名はありません。セキュア ブートが有効になっている場合、自己コンパイル ドライバーは次のエラーでロードに失敗します Required key not availableとなります。コマンドで現在のステータスを確認 mokutil --sb-state (Red Hat Enterprise Linux)で、サーバーのPOST中にF2を押してBIOSで変更します。

セキュア ブートが必要な場合や、コンパイル済みのドライバーを希望する場合は、次の記事を参照してインストールしてください。  セキュア ブートが有効になっているRed Hat Enterprise LinuxにNVIDIAドライバーをオンラインでインストールする方法。

  1. NVIDIAサイトから必要なドライバーをダウンロードします。このハイパーリンクをクリックすると、デル・テクノロジーズ以外のWebサイトにアクセスします。
    1. Red Hat Enterprise Linux の正しいバージョン(Red Hat Enterprise Linux 8 など)を選択します。
    2. インストールするCUDAツールキットに必要な正しいCompute Unified Device Architecture (CUDA)バージョン(12.2など)を選択します。
    3. ダウンロード パッケージがRPMである(例:nvidia-driver-local-repo-rhel8-535.54.03-1.0-1.x86_64.rpm)
  2. RPMをインストールします。これにより、ローカルリポジトリが作成されます。
[root@rhel87 ~]# ls
anaconda-ks.cfg  nvidia-driver-local-repo-rhel8-535.54.03-1.0-1.x86_64.rpm
[root@rhel87 ~]# yum localinstall ./nvidia-driver-local-repo-rhel8-535.54.03-1.0-1.x86_64.rpm
...output skipped...
[root@rhel87 ~]# yum repolist
Updating Subscription Management repositories.
Unable to read consumer identity

This system is not registered with an entitlement server. You can use subscription-manager to register.

repo id                              repo name
my-rhel-87-AppStream-iso             my RHEL 87 AppStream iso
my-rhel-87-BaseOS-iso                my RHEL 87 BaseOS iso
my-rhel-extra-rpms                   my RHEL extra rpms
nvidia-driver-local-rhel8-535.54.03  nvidia-driver-local-rhel8-535.54.03
[root@rhel87 ~]#
  1. 取り付ける DKMS です。DKMSはRed Hat Enterprise Linuxにはありません。これは、Extra Packages for Enterprise Linux (EPEL) このハイパーリンクをクリックすると、デル・テクノロジーズ以外のWebサイトにアクセスします。 で入手できます。  DKMS に関する詳細は、Red Hat の記事 Red Hat Enterprise Linux で提供される DKMS を参照してください。 このハイパーリンクをクリックすると、デル・テクノロジーズ以外のWebサイトにアクセスします。
[root@rhel87 ~]# yum install https://dl.fedoraproject.org/pub/epel/epel-release-latest-8.noarch.rpm
[root@rhel87 ~]# yum install dkms
  1. 必要に応じて、EPEL を無効化 または削除できます。
# to disable epel, edit the following configuration and change to "enabled=0" 
[root@rhel87 ~]# vi /etc/yum.repos.d/epel.repo 

# to remove the epel 
[root@rhel87 ~]# yum remove epel-release
  1. コンパイルツールとカーネルヘッダーをインストールします。Red Hatサブスクリプションがアタッチされていることを確認します。
[root@rhel87 ~]# yum groupinstall "Development Tools"
[root@rhel87 ~]# yum install kernel-devel-$(uname -r)
  1. cuda-driverのインストール
[root@rhel87 ~]# yum install cuda-driver
  1. ドライバーが正常にインストールされたことを確認します。
[root@rhel87 ~]# dkms status
nvidia/535.54.03, 4.18.0-425.3.1.el8.x86_64, x86_64: installed
[root@rhel87 ~]#
  1. 上記で指定したステータス がインストールされておらず、代わりに [追加済み] になっている場合は、ビルドできます。
[root@rhel87 ~]# dkms build nvidia/535.54.03
  1. 指定されたステータスが 構築されている場合は、インストールできます。
[root@rhel87 ~]# dkms install nvidia/535.54.03
  1. ステータスがビルド中またはインストール中に失敗した場合は、次のパスでログを確認します。
[root@rhel87 ~]# ls /var/lib/dkms/nvidia/535.54.03/4.18.0-425.3.1.el8.x86_64/x86_64/log/make.log
[root@rhel87 ~]#
  1. NVIDIAドライバーをインストールした後、サーバーを再起動します。
[root@rhel87 ~]# systemctl reboot
  1. ドライバーが動作していることを確認します。
[root@rhel87 ~]# lsmod | grep nvidia
nvidia_drm             73728  0
nvidia_modeset       1306624  1 nvidia_drm
nvidia_uvm           1523712  0
nvidia              56426496  2 nvidia_uvm,nvidia_modeset
drm_kms_helper        176128  4 qxl,nvidia_drm
drm                   565248  7 drm_kms_helper,qxl,nvidia,drm_ttm_helper,nvidia_drm,ttm
[root@rhel87 ~]# nvidia-smi
Tue Jul 25 12:00:29 2023
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 535.54.03              Driver Version: 535.54.03    CUDA Version: 12.2     |
|-----------------------------------------+----------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
|=========================================+======================+======================|
|   0  Tesla P100-PCIE-12GB           Off | 00000000:07:00.0 Off |                    0 |
| N/A   33C    P0              29W / 250W |      0MiB / 12288MiB |      2%      Default |
|                                         |                      |                  N/A |
+-----------------------------------------+----------------------+----------------------+

+---------------------------------------------------------------------------------------+
| Processes:                                                                            |
|  GPU   GI   CI        PID   Type   Process name                            GPU Memory |
|        ID   ID                                                             Usage      |
|=======================================================================================|
|  No running processes found                                                           |
+---------------------------------------------------------------------------------------+
[root@rhel87 ~]# modinfo nvidia
filename:       /lib/modules/4.18.0-425.3.1.el8.x86_64/extra/nvidia.ko.xz
firmware:       nvidia/535.54.03/gsp_tu10x.bin
firmware:       nvidia/535.54.03/gsp_ga10x.bin
alias:          char-major-195-*
version:        535.54.03
supported:      external
license:        NVIDIA
rhelversion:    8.7
srcversion:     EA9C7EF32617E104C8240C4



問題がある場合は、次のログを収集し、 Dellサポートにお問い合わせください。

  • sosreport
  • ドライバーのビルドに失敗した場合は、ビルドまたは作成で上記のログ ファイルを作成します
  • すべて /var/log/nvidia-installer.log、またはインストール中に出力に記載されているログ

知っておくべきその他の情報:

  • Red Hat Enterprise Linux をインストールし、graphical.target で起動した場合、再起動後に黒い画面が表示されることがあります。解決策は、/etc/X11/xorg.conf.d/10-nvidia.conf を X11 フォルダから移動し、サーバを再起動することです。
  • graphical.target を使用して KVM の VM に GPU をパススルーしようとすると、失敗します。解決策は、ハイパーバイザーRed Hat Enterprise Linuxをmulti-user.targetで起動することです。graphical.targetにより、VMに渡す前にNVIDIAドライバーがアンロードされなくなります。

Affected Products

Red Hat Enterprise Linux Version 7, Red Hat Enterprise Linux Version 9, Red Hat Enterprise Linux Version 8

Products

DSS 8440, Poweredge C4140, PowerEdge C6525, PowerEdge R640, PowerEdge R650, PowerEdge R6515, PowerEdge R6525, PowerEdge R740, PowerEdge R740XD, PowerEdge R7425, PowerEdge R750, PowerEdge R750XA, PowerEdge R7515, PowerEdge R7525, PowerEdge R840 , PowerEdge R940xa, PowerEdge T550, PowerEdge T640, PowerEdge XE2420, PowerEdge XE7420, PowerEdge XE9680 ...
Article Properties
Article Number: 000216077
Article Type: How To
Last Modified: 06 Dec 2024
Version:  5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.