Aller au contenu

Résolution des Problèmes de GPU

Dans cet article

Après avoir mis à jour les pilotes ou le logiciel sous Ubuntu, une erreur NVML survient : Mismatch de version du pilote/bibliothèque

Si vous rencontrez une erreur comme "Échec d'initialisation de NVML : Mismatch de version du pilote/bibliothèque" après l'installation, il est nécessaire de reconnecter les modules noyau Nvidia en les supprimant et en relançant nvidia-smi pour réinitialisation :

sudo rmmod -f nvidia-modeset
sudo rmmod nvidia_uvm
sudo rmmod nvidia_drm
sudo rmmod nvidia-peermem
sudo rmmod nvidia
sudo nvidia-smi

L'erreur peut également survenir en raison du remplissage de la partition /boot lors des mises à jour simultanées du noyau système et de l'impossibilité de construire de nouveaux disques RAM initiaux (initrd) avec les modules de carte vidéo. Pour corriger cela, utilisez cette instruction.

Si l'erreur persiste, il est recommandé de supprimer les paquets du pilote Nvidia

sudo apt purge -s "nvidia*" "libnvidia*"
sudo apt autoremove
sudo apt --fix-broken install

et les réinstaller (ainsi que CUDA).

Installation du pilote Nvidia : modules noyau non compilés

Si vous rencontrez une erreur lors de l'installation des pilotes Nvidia comme celle-ci :

# commande : 'make' -j128 KERNEL_UNAME=6.8.0-64-generic IGNORE_CC_MISMATCH=1 SYSSRC=/lib/modules/6.8.0-64-generic/build LD=/usr/bin/ld.bfd CONFIG_X86_KERNEL_IBT= modules
Makefile:63: Avertissement : Impossible de localiser le compilateur x86_64-linux-gnu-gcc-12 à partir de CONFIG_CC_VERSION_TEXT dans la configuration du noyau.
make[1] : Entrez dans le répertoire '/usr/src/linux-headers-6.8.0-64-generic'
avertissement: le compilateur diffère de celui utilisé pour construire le noyau
  Le noyau a été construit par: x86_64-linux-gnu-gcc-12 (Ubuntu 12.3.0-1ubuntu1~22.04) 12.3.0
  Vous utilisez : cc (Ubuntu 11.4.0-1ubuntu1~22.04) 11.4.0
  LIEN SYMBOLIQUE /var/lib/dkms/nvidia/575.57.08/build/nvidia/nv-kernel.o
  LIEN SYMBOLIQUE /var/lib/dkms/nvidia/575.57.08/build/nvidia-modeset/nv-modeset-kernel.o

cela signifie que la version GCC 12 n'est pas installée sur votre système. Installez-la avec la commande :

sudo apt install gcc-12 g++-12

et réinstallez à nouveau (ainsi que CUDA).

Erreur lors de l'installation du pilote Nvidia : impossible de signer les modules noyau

Lors de l'installation des pilotes graphiques, vous pourriez voir une erreur indiquant que le système ne peut pas trouver le paquet update-secureboot-policy et signer les modules, même si Secure Boot est désactivé dans le BIOS :

Construction du module initial nvidia/575.57.08 pour 6.8.0-64-generic
Commande de signature : /usr/bin/kmodsign
Binary update-secureboot-policy non trouvé, les modules ne seront pas signés

Pour résoudre ce problème, installez le paquet shim-signed avec la commande :

sudo apt install shim-signed

et réinstallez à nouveau (ainsi que CUDA).


Certaines parties du contenu de cette page ont été créées ou traduites à l'aide d'IA.