NVIDIA Driver et CUDA Installation sur Ubuntu Linux¶
Dans cet article
Cet article didacticiel décrit la procédure d'installation des pilotes de carte graphique NVIDIA et de CUDA pour les systèmes d'exploitation suivants : Ubuntu 22.04, Ubuntu 24.04.
Attention
Pour un fonctionnement correct des cartes graphiques Tesla (par exemple, NVIDIA Tesla T4), assurez-vous que le paramètre du BIOS du serveur 'décodage au-dessus de 4G' ou 'large/64 bits BARs' ou 'Attribution MMIO au-dessus de 4G dans le BIOS' est activé.
Information
Nous ne supportons officiellement que les cartes Nvidia sur Ubuntu 22.04/24.04. Pour installer des pilotes pour d'autres distributions, suivez les instructions officielles des développeurs :
Préparation du Système¶
-
Mettez à jour le système :
-
Pour les séries RTX 4xxx, 5xxx, A100 et H100 sur Ubuntu 22.04, vous devez mettre à jour la version du noyau. Vous pouvez également mettre à jour la version du noyau pour des cartes graphiques plus anciennes :
Installation des Pilotes Nvidia et de CUDA¶
Si vous avez besoin de la dernière version des pilotes et de CUDA (ou d'une version spécifique), vous devez les installer à partir du dépôt Nvidia.
-
Installez le compilateur gcc, nécessaire pour compiler CUDA :
-
Téléchargez et installez les pilotes et CUDA. Pour Ubuntu 24.04, remplacez
ubuntu2204parubuntu2404dans le chemin dewget: -
Définissez les variables d'environnement pour que vos cadres et applications détectent CUDA dans votre
.bashrc:echo 'export PATH="/sbin:/bin:/usr/sbin:/usr/bin:${PATH}:/usr/local/cuda/bin"' >> ~/.bashrc echo 'export LD_LIBRARY_PATH=/usr/local/cuda/lib64\${LD_LIBRARY_PATH:+:\${LD_LIBRARY_PATH}}' >> ~/.bashrc source ~/.bashrcAttention
Vous devez exécuter ces commandes pour tous les utilisateurs qui doivent utiliser CUDA.
-
Vérifiez l'installation des pilotes sur votre carte vidéo :
Vous devriez obtenir une sortie similaire à ceci :
user@48567:~$ nvidia-smi Fri May 10 15:58:17 2024 +-----------------------------------------------------------------------------------------+ | NVIDIA-SMI 580.54.15 Driver Version: 580.54.15 CUDA Version: 13.0 | |-----------------------------------------+------------------------+----------------------| | GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. | | | | MIG M. | |=========================================+========================+======================| | 0 NVIDIA RTX A4000 Off | 00000000:07:00.0 Off | Off | | 41% 31C P8 15W / 140W | 3MiB / 16376MiB | 0% Default | | | | N/A | +-----------------------------------------+------------------------+----------------------+ +-----------------------------------------------------------------------------------------+ | Processes: | | GPU GI CI PID Type Process name GPU Memory | | ID ID Usage | |=========================================================================================| | No running processes found | +-----------------------------------------------------------------------------------------+Attention
Si vous avez reçu un message comme
modprobe: ERROR: could not insert 'nvidia': Device or resource busylors de l'installation, vous devez supprimer le module noyaunouveauet activer l'utilisation des modulesnvidia.Note
Vous pouvez trouver les instructions les plus récentes pour installer les pilotes GPU Nvidia sur Ubuntu ici.
-
Vérifiez l'installation de CUDA :
Après une installation réussie, vous devriez obtenir une sortie similaire à ceci :
Attention
Si vous rencontrez une erreur comme Échec de l'initialisation de NVML : Mauvais accord entre la version du pilote et de la bibliothèque après l'installation, vous devez réinitialiser les modules noyaux Nvidia en les supprimant et en exécutant nvidia-smi à nouveau.
Installation des Modules Nvidia pour Docker¶
Si vous utilisez des conteneurs Docker, n'oubliez pas d'installer le paquet nvidia-docker2 :
Installation en Un Clic des Pilotes et de CUDA¶
Vous pouvez utiliser ce script pour une installation automatique des pilotes et de CUDA :
#!/bin/bash
#Check Ubuntu 25.04 and exit
if lsb_release -a | grep -q "25.04"; then
echo "Detected Ubuntu 25.04. NVIDIA do not support official CUDA for non-LTS release. Use Ubuntu 24.04 or 22.04 instead!"
exit
fi
# Update and upgrade the system using apt
sudo apt update
sudo apt upgrade -y
#Check Ubuntu 22.04 and update kernel
lsb_release=$(lsb_release -a | grep "22.04")
if [[ -n "$lsb_release" ]]; then
sudo apt install -y linux-generic-hwe-22.04
fi
# Install GCC compiler for CUDA install
sudo apt install gcc-12 g++-12
# Get the release version of Ubuntu
RELEASE_VERSION=$(lsb_release -rs | sed 's/\([0-9]\+\)\.\([0-9]\+\)/\1\2/')
# Download and install CUDA package for Ubuntu and Nvidia drivers
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu${RELEASE_VERSION}/x86_64/cuda-keyring_1.1-1_all.deb
sudo dpkg -i cuda-keyring_1.1-1_all.deb
# Update and upgrade the system again to ensure all packages are installed correctly
sudo apt update
if lspci -nn | grep -q '10de:1b06'; then
echo "Find GTX 1080 Ti"
sudo apt purge "nvidia-*" "libnvidia-*" "cuda-*" "nvidia-driver-*" "*cudnn*" "*nsight*" -y
sudo apt remove --purge nvidia-cuda-toolkit nvidia-prime nvidia-settings -y
sudo apt autoremove -y
sudo apt --fix-broken install -y
sudo apt clean -y
sudo apt install nvidia-driver-535 -y
else
sudo apt install cuda -y
sudo apt install cuda-toolkit -y
fi
# Add PATH and LD_LIBRARY_PATH environment variables for CUDA in .bashrc file
echo 'export PATH="/sbin:/bin:/usr/sbin:/usr/bin:${PATH}:/usr/local/cuda/bin"' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda/lib64\${LD_LIBRARY_PATH:+:\${LD_LIBRARY_PATH}}' >> ~/.bashrc
source ~/.bashrc
#Initialize kernel modules without reboot
sudo rmmod -f nouveau
sudo nvidia-smi
nvcc -V
#Installing Docker binding for Nvidia
if command -v docker &> /dev/null; then
if lsb_release -a | grep -q "22.04"; then
echo "Detected Ubuntu 22.04. Installing nvidia-docker2..."
sudo apt install -y nvidia-docker2
sudo systemctl restart docker
fi
if lsb_release -a | grep -q "24.04"; then
echo "Detected Ubuntu 24.04. Installing nvidia-container-toolkit..."
sudo apt install -y nvidia-container-toolkit
sudo systemctl restart docker
fi
else
echo "Docker is not installed."
fi
Une partie du contenu de cette page a été créée ou traduite à l'aide d'IA.