GPU Sorunlarını Çözme¶
Bu makalede
- Ubuntu'da sürücüleri veya yazılımı güncelledikten sonra NVML hatası oluşuyor: Sürücü/kütüphane sürüm uyumsuzluğu
- Nvidia Sürücü Kurulumu: Çekirdek Modülleri Derlenmiyor
- Nvidia Sürücü Kurulumu Hatası: Çekirdek Modülleri İmzalanamıyor
- Blackwell GPU'lar (RTX 5090 veya RTX 6000 PRO) için Ubuntu'da PyTorch ve Modüllerinin Kurulumunda Hatalar
Ubuntu'da sürücüleri veya yazılımı güncelledikten sonra NVML hatası oluşuyor: Sürücü/kütüphane sürüm uyumsuzluğu¶
Kurulumdan sonra Failed to initialize NVML: Driver/library version mismatch gibi bir hata ile karşılaşırsanız, Nvidia çekirdek modüllerini silerek ve yeniden başlatmak için nvidia-smi komutunu tekrar çalıştırarak yeniden bağlamanız gerekir:
sudo rmmod -f nvidia-modeset
sudo rmmod nvidia_uvm
sudo rmmod nvidia_drm
sudo rmmod nvidia-peermem
sudo rmmod nvidia
sudo nvidia-smi
Bu hata, eş zamanlı sistem çekirdeği güncellemeleri sırasında /boot bölümünün dolması ve video kartı modülleriyle yeni başlangıç RAM disklerinin (initrd) oluşturulamaması nedeniyle de oluşabilir. Bunu düzeltmek için bu talimatı kullanın.
Hata devam ediyorsa, Nvidia sürücü paketlerini kaldırmak önerilir:
ve bunları (ve CUDA'yı) yeniden kurun.
Nvidia Sürücü Kurulumu: Çekirdek Modülleri Derlenmiyor¶
Nvidia sürücülerinin kurulumu sırasında aşağıdaki gibi bir hata ile karşılaşırsanız:
# command: 'make' -j128 KERNEL_UNAME=6.8.0-64-generic IGNORE_CC_MISMATCH=1 SYSSRC=/lib/modules/6.8.0-64-generic/build LD=/usr/bin/ld.bfd CONFIG_X86_KERNEL_IBT= modules
Makefile:63: WARNING: Unable to locate the compiler x86_64-linux-gnu-gcc-12 from CONFIG_CC_VERSION_TEXT in the kernel configuration.
make[1]: Entering directory '/usr/src/linux-headers-6.8.0-64-generic'
warning: the compiler differs from the one used to build the kernel
The kernel was built by: x86_64-linux-gnu-gcc-12 (Ubuntu 12.3.0-1ubuntu1~22.04) 12.3.0
You are using: cc (Ubuntu 11.4.0-1ubuntu1~22.04) 11.4.0
SYMLINK /var/lib/dkms/nvidia/575.57.08/build/nvidia/nv-kernel.o
SYMLINK /var/lib/dkms/nvidia/575.57.08/build/nvidia-modeset/nv-modeset-kernel.o
bu, sisteminizde GCC sürüm 12'nin yüklü olmadığı anlamına gelir. Aşağıdaki komutu kullanarak yükleyin:
ve bunları (ve CUDA'yı) tekrar kurun.
Nvidia Sürücü Kurulumu Hatası: Çekirdek Modülleri İmzalanamıyor¶
Grafik kartı sürücülerinin kurulumu sırasında, BIOS'ta Secure Boot devre dışı bırakılmış olsa bile sistemin update-secureboot-policy paketini bulamadığı ve modülleri imzalayamadığına dair bir hata görebilirsiniz:
Building initial module nvidia/575.57.08 for 6.8.0-64-generic
Sign command: /usr/bin/kmodsign
Binary update-secureboot-policy not found, modules won't be signed
Bu sorunu çözmek için aşağıdaki komutla shim-signed paketini yükleyin:
ve bunları (ve CUDA'yı) tekrar kurun.
Blackwell GPU'lar (RTX 5090 veya RTX 6000 PRO) için Ubuntu'da PyTorch ve Modüllerinin Kurulumunda Hatalar¶
Bu aileden grafik kartlarında PyTorch'un kararlı sürümünü kurarken hatalar oluşabilir. Desteklerini içeren nightly build sürümünü aşağıdaki komutu çalıştırarak kullanın:
pip install --upgrade --force-reinstall torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cu130
Burada cu130, CUDA sürümünü (13.0) belirtir. Daha eski bir sürümünüz (12.8) varsa, https://download.pytorch.org/whl/nightly/cu128 yolunu kullanın.