Aller au contenu

NVIDIA Driver et CUDA Installation sur Ubuntu Linux

Dans cet article

Cet article didacticiel décrit la procédure d'installation des pilotes de carte graphique NVIDIA et de CUDA pour les systèmes d'exploitation suivants : Ubuntu 22.04, Ubuntu 24.04.

Attention

Pour un fonctionnement correct des cartes graphiques Tesla (par exemple, NVIDIA Tesla T4), assurez-vous que le paramètre du BIOS du serveur 'décodage au-dessus de 4G' ou 'large/64 bits BARs' ou 'Attribution MMIO au-dessus de 4G dans le BIOS' est activé.

Préparation du Système

  1. Mettez à jour le système :

    sudo apt update && sudo apt full-upgrade -y
    
  2. Pour les séries RTX 4xxx, 5xxx, A100 et H100 sur Ubuntu 22.04, vous devez mettre à jour la version du noyau. Vous pouvez également mettre à jour la version du noyau pour des cartes graphiques plus anciennes :

    sudo apt install linux-generic-hwe-22.04
    

Installation des Pilotes Nvidia et de CUDA

Si vous avez besoin de la dernière version des pilotes et de CUDA (ou d'une version spécifique), vous devez les installer à partir du dépôt Nvidia.

  1. Installez le compilateur gcc, nécessaire pour compiler CUDA :

    sudo apt install gcc-12 g++-12
    
  2. Téléchargez et installez les pilotes et CUDA. Pour Ubuntu 24.04, remplacez ubuntu2204 par ubuntu2404 dans le chemin de wget :

    wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2404/x86_64/cuda-keyring_1.1-1_all.deb
    sudo dpkg -i cuda-keyring_1.1-1_all.deb
    sudo apt update
    sudo apt install cuda -y
    sudo apt install cuda-toolkit -y
    
  3. Définissez les variables d'environnement pour que vos cadres et applications détectent CUDA dans votre .bashrc :

    echo 'export PATH="/sbin:/bin:/usr/sbin:/usr/bin:${PATH}:/usr/local/cuda/bin"' >> ~/.bashrc
    echo 'export LD_LIBRARY_PATH=/usr/local/cuda/lib64\${LD_LIBRARY_PATH:+:\${LD_LIBRARY_PATH}}' >> ~/.bashrc
    source ~/.bashrc
    

    Attention

    Vous devez exécuter ces commandes pour tous les utilisateurs qui doivent utiliser CUDA.

  4. Vérifiez l'installation des pilotes sur votre carte vidéo :

    sudo nvidia-smi
    

    Vous devriez obtenir une sortie similaire à ceci :

    user@48567:~$ nvidia-smi
    
    Fri May 10 15:58:17 2024
    
    +-----------------------------------------------------------------------------------------+
    | NVIDIA-SMI 550.54.15              Driver Version: 550.54.15      CUDA Version: 12.4     |
    |-----------------------------------------+------------------------+----------------------|
    | GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
    | Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
    |                                         |                        |               MIG M. |
    |=========================================+========================+======================|
    |   0  NVIDIA RTX A4000               Off |   00000000:07:00.0 Off |                  Off |
    | 41%   31C    P8             15W /  140W |       3MiB /  16376MiB |      0%      Default |
    |                                         |                        |                  N/A |
    +-----------------------------------------+------------------------+----------------------+
    
    +-----------------------------------------------------------------------------------------+
    | Processes:                                                                              |
    |  GPU   GI   CI        PID   Type   Process name                              GPU Memory |
    |        ID   ID                                                               Usage      |
    |=========================================================================================|
    |  No running processes found                                                             |
    +-----------------------------------------------------------------------------------------+
    

    Attention

    Si vous avez reçu un message comme modprobe: ERROR: could not insert 'nvidia': Device or resource busy lors de l'installation, vous devez supprimer le module noyau nouveau et activer l'utilisation des modules nvidia.

    sudo rmmod -f nouveau
    sudo nvidia-smi
    

    Note

    Vous pouvez trouver les instructions les plus récentes pour installer les pilotes GPU Nvidia sur Ubuntu ici.

  5. Vérifiez l'installation de CUDA :

    nvcc -V
    

    Après une installation réussie, vous devriez obtenir une sortie similaire à ceci :

    user@48567:~$ nvcc -V
    
    nvcc: NVIDIA (R) Cuda compiler driver
    
    Copyright (c) 2005-2024 NVIDIA Corporation
    
    Built on Thu_Mar_28_02:18:24_PDT_2024
    
    Cuda compilation tools, release 12.4, V12.4.131
    
    Build cuda_12.4.r12.4/compiler.34097967_0
    

Attention

Si vous rencontrez une erreur comme Échec de l'initialisation de NVML : Mauvais accord entre la version du pilote et de la bibliothèque après l'installation, vous devez réinitialiser les modules noyaux Nvidia en les supprimant et en exécutant nvidia-smi à nouveau.

sudo rmmod -f nvidia-modeset
sudo rmmod nvidia_uvm
sudo rmmod nvidia_drm
sudo rmmod nvidia-peermem
sudo rmmod nvidia
sudo nvidia-smi 

Installation des Modules Nvidia pour Docker

Si vous utilisez des conteneurs Docker, n'oubliez pas d'installer le paquet nvidia-docker2 :

sudo apt install -y nvidia-docker2
sudo systemctl restart docker

Installation en Un Clic des Pilotes et de CUDA

Vous pouvez utiliser ce script pour une installation automatique des pilotes et de CUDA :

#!/bin/bash

# Vérifiez Ubuntu 25.04 et sortez
if lsb_release -a | grep -q "25.04"; then
    echo "Détecté Ubuntu 25.04. NVIDIA ne prend pas en charge officiellement CUDA pour les versions non LTS. Utilisez plutôt Ubuntu 24.04 ou 22.04 !"
    exit
fi

# Mettez à jour et améliorez le système en utilisant apt
sudo apt update
sudo apt upgrade -y

# Vérifiez Ubuntu 22.04 et mettez à jour le noyau
lsb_release=$(lsb_release -a | grep "22.04")

if [[ -n "$lsb_release" ]]; then
    sudo apt install -y linux-generic-hwe-22.04
fi

# Installez le compilateur GCC pour l'installation de CUDA
sudo apt install gcc-12 g++-12

# Obtenez la version de sortie d'Ubuntu
RELEASE_VERSION=$(lsb_release -rs | sed 's/([0-9]+)\.([0-9]+)/\1\2/')

# Téléchargez et installez le paquet CUDA pour Ubuntu et les pilotes Nvidia
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu${RELEASE_VERSION}/x86_64/cuda-keyring_1.1-1_all.deb
sudo dpkg -i cuda-keyring_1.1-1_all.deb

# Mettez à jour et améliorez le système une deuxième fois pour vous assurer que tous les paquets sont installés correctement
sudo apt update
sudo apt install cuda -y
sudo apt install cuda-toolkit -y

# Ajoutez des variables d'environnement PATH et LD_LIBRARY_PATH pour CUDA dans le fichier .bashrc
echo 'export PATH="/sbin:/bin:/usr/sbin:/usr/bin:${PATH}:/usr/local/cuda/bin"' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda/lib64\${LD_LIBRARY_PATH:+:\${LD_LIBRARY_PATH}}' >> ~/.bashrc
source ~/.bashrc

# Initialisez les modules noyaux sans redémarrage
sudo rmmod -f nouveau
sudo nvidia-smi

nvcc -V

# Installation de l'accouplement Docker pour Nvidia

if command -v docker &> /dev/null; then

    if lsb_release -a | grep -q "22.04"; then
        echo "Détecté Ubuntu 22.04. Installation de nvidia-docker2..."
        sudo apt install -y nvidia-docker2
        sudo systemctl restart docker
    fi

    if lsb_release -a | grep -q "24.04"; then
        echo "Détecté Ubuntu 24.04. Installation de nvidia-container-toolkit..."
        sudo apt install -y nvidia-container-toolkit
        sudo systemctl restart docker
    fi

else
  echo "Docker n'est pas installé."
fi

Une partie du contenu de cette page a été créée ou traduite à l'aide d'IA.