Yazılım Yönetimi¶
Bu makalede
- Ubuntu'da çekirdek ve sürücülerim güncellenmiyor/yüklenmiyor
- Docker Compose ile bir hata alıyorum
- DeepSeek R1 gibi Çok Dilli Sinirsel Modeller İngilizce Yerine Çince Yanıt Veriyor
- OpenWebUI veya Ollama'daki Sinirsel Model Yanıt Vermek İçin Uzun Süre Alıyor
- Ubuntu'da Kurulu İşletim Sisteminden Docker'ı Tamamen Nasıl Kaldırılır
Ubuntu'da çekirdek ve sürücülerim güncellenmiyor/yüklenmiyor¶
Yeni bir çekirdek veya sürücülerin (çekirdek modülleri) yüklenmemesi sorunu, eş zamanlı sistem çekirdek güncellemeleri sırasında /boot bölümünün dolması ve yeni başlangıç RAM disklerinin (initrd) oluşturulmasını engellemesi nedeniyle ortaya çıkabilir. Bunu kontrol etmek için aşağıdaki komutu çalıştırın:
Çıktıda hata görürseniz, /boot bölümünün doluluk seviyesini kontrol edin. Bunun için df -h /boot komutunun çıktısına bakın:
Initrd dosyalarının başarılı bir şekilde yeniden oluşturulabilmesi için, /boot bölümünün yüzde doluluk oranından önceki sayının 200M'den fazla olması gerekir. Eğer boş alan yoksa, aşağıdaki adımları uygulayın:
-
Yanlışlıkla gerekli dosyaları silerseniz hızlıca geri yükleyebilmek için bölümün bir yedeğini alın:
-
/bootbölümünün içeriğine bakın ve tüm initrd görüntülerini bulun:Benzer bir çıktı almalısınız:
-
Fazla initrd görüntülerini silin, SON İKİSİNİ BIRAKIN. Bizim durumumuzda
initrd.img-6.8.0-57-genericveinitrd.img-6.8.0-58-genericdosyalarını silmemiz gerekiyor.Dikkat
Aşağıdaki komutlar işletim sisteminizin arızalanmasına yol açabilir, bu nedenle silinen dosyaların sürümlerine dikkat edin.
/bootbölümünde son ve sondan bir önceki çekirdek sürümleri için dosyalar bulunmalıdır! Hangi çekirdeği kullandığınızıuname -akomutuyla kontrol edebilirsiniz. Bir şeyler ters giderse,/bootbölümünün içeriğini birinci adımda yapılan yedektensudo rsync -av /boot.old/ /boot/komutuyla geri yükleyebilirsiniz.Bunu aşağıdaki komutla yapın:
Her dosya için bunu tekrarlayın.
vmlinuzveSystem.mapdosyalarıyla da aynı işlemi yapın (isteğe bağlı): -
Eski çekirdeklerle ilgili paketleri sistemden temizleyin ve sürücülerin ve çekirdek modüllerinin kurulum sonrası işlemlerini ve oluşturulmasını aşağıdaki komutlarla çalıştırın:
-
İşletim sistemini yeniden başlatın:
Docker Compose ile bir hata alıyorum¶
Docker Compose'u çalıştırırken docker: 'compose' is not a docker command veya docker-compose: command not found gibi bir hata alıyorsanız, bu durum işletim sisteminizin eski bir sürümde olduğunu ve Docker Compose'un bir eklenti olarak yüklenmediğini veya PATH'e eklenmediğini gösterebilir. Bu sorunu çözmek için aşağıdaki adımları izleyin:
-
Docker Compose'u yükleyin (eğer yüklü değilse):
mkdir -p ~/.docker/cli-plugins/ curl -SL https://github.com/docker/compose/releases/latest/download/docker-compose-linux-x86_64 -o ~/.docker/cli-plugins/docker-compose chmod +x ~/.docker/cli-plugins/docker-composeGerekirse
latestkelimesini resmi depodan geçerli sürümle değiştirin. -
Yüklemeyi kontrol edin:
Komut başarıyla çalışıyorsa, Docker Compose yüklüdür.
-
Komut hala bulunamıyorsa,
~/.docker/cli-plugins/dizinininPATHortam değişkenine eklenmiş olduğundan emin olun. Bunu~/.bashrcveya~/.zshrcdosyasına ekleyin:Ardından aşağıdaki komutu çalıştırın:
-
Yüklemeyi tekrar kontrol edin:
DeepSeek R1 gibi Çok Dilli Sinirsel Modeller İngilizce Yerine Çince Yanıt Veriyor¶
DeepSeek gibi çoğu çok dilli model, istek İngilizce yapılsa bile ara sıra ana eğitim diline (örneğin Çince) geçebilir. Bu durum, model distilasyonu, sıkıştırma veya yanıtların çoğunlukla tek bir ana dilde bulunması nedeniyle gerçekleşir.
Bu davranışı en aza indirmek için, istem sorgusunun sonuna "Sadece İngilizce yanıt ver" ifadesini ekleyerek ve bu satırı sistem istemine dahil ederek yanıt dilini açıkça belirtmeniz önerilir. Ayrıca, DeepSeek'e kıyasla daha az parametreli sürümlerde daha büyük kararlılık gösteren Qwen3 veya Gemma3 gibi modeller kullanmanız tavsiye edilir.
Ayrıca, API üzerinden çalışıyorsanız OpenWebUI gibi araçları veya sohbetinizin arka ucunu kullanarak İngilizce yanıtları manuel olarak kontrol edebilirsiniz.
OpenWebUI veya Ollama'daki Sinirsel Model Yanıt Vermek İçin Uzun Süre Alıyor¶
Model yanıt vermek için uzun süre alıyorsa, bu durum modelin boyutundan ve sunucunuzun kapasitesinden kaynaklanıyor olabilir.
Öncelikle, modelinizin GPU'nun video belleğine tamamen sığındığından emin olun. Örneğin, qwen3-next:80b modeli sıkıştırıldığında (q4) 67 GB'dır ve tamamen açıldığında 80–90 GB video belleği gerektirir. GPU'nuz 24 GB video belleğe sahip NVIDIA A5000 veya RTX 4090 ise, Ollama model katmanlarının bir kısmını sunucunun CPU'suna aktaracak, bu da sanal makine aşırı yüklenmesine, çekirdek tahsisinde azalmaya ve uzun yanıt gecikmelerine neden olacaktır.
Bu tür bir modelle çalışmak için Nvidia H100 gibi 80 GB video belleğe sahip daha güçlü GPU'lar veya dört RTX 4090'ın birleşimi gibi donanımlar gereklidir. RAM, yalnızca RAG görevleri (bilgi tabanları ve yüklenen dosyalarla çalışma) için önemlidir ve genellikle en az 32 GB gerektirir.
Modelin video bellekteki boyutunu, model q4'e sıkıştırılmışsa boyutunu 2 ile, q8'e sıkıştırılmışsa 1.5 ile çarparak tahmin edebilirsiniz. 8000'in üzerindeki her ek 1000 token bağlam penceresi için gerekli video belleğe 1 GB ekleyin.
GPU'nuzun yükünü kontrol etmek için sunucuya SSH üzerinden giriş yapın ve komut satırında ollama ps komutunu çalıştırın:
[ root ]$ ollama ps
NAME ID SIZE PROCESSOR UNTIL
yxchia/multilingual-e5-base:latest f5248cae7e12 1.1 GB 100% GPU 14 minutes from now
qwen3:14b bdbd181c33f2 14 GB 100% GPU 14 minutes from now
Çıktı, modelinizin ne kadar yer kapladığını ve GPU'ya tamamen sığıp sığmadığını gösterecektir.
Not
24 GB video belleğe sahip GPU'lar için, 14B'den büyük modeller veya q8'den öteye sıkıştırılmış modeller önerilmez. Modelin parametre sayısı (hacmi) ve bağlam penceresi boyutu ne kadar büyükse, yanıt süreci o kadar uzun sürecektir.
Bilgi
Nvidia A5000 üzerinde 14B modeller için hesaplama performansı:
- Yanıttan önce soğuk başlatma yaklaşık 30-40 saniye sürer.
- Yanıt süresi 10–15 saniyedir (mülahaza olmadan).
- Yanıt süresi 20-30 saniyedir (mülahaza ile).
Eğer RAG (Bulma-Güçlendirilmiş Üretim) veya MCP kullanılıyorsa, yanıt süresi 5–10 saniye artar (veritabanı arama ve araç istekleri için).
Token oluşturma hızı saniyede ~40–45 tokendir. Bunu OpenWebUI'da sohbet yanıt satırının altındaki simgesine tıklayarak ve response_token/s parametresini kontrol ederek doğrulayabilirsiniz.
Ubuntu'da Kurulu İşletim Sisteminden Docker'ı Tamamen Nasıl Kaldırılır¶
Ubuntu işletim sistemi görüntülerimiz, kolaylık sağlamak için önceden yüklü Docker ile birlikte gelir. Eğer buna ihtiyacınız yoksa veya farklı bir sürüm yüklemek istiyorsanız, aşağıdaki komutları kullanın:
sudo apt remove docker-ce docker-ce-cli containerd.io docker-buildx-plugin docker-compose-plugin
sudo apt autoremove
sudo rm -rf /var/lib/docker
sudo rm -rf /var/lib/containerd
Docker'ın kaldırıldığından emin olmak için docker --version komutunu çalıştırın.