Yazılım Yönetimi¶
Bu makalede
- Ubuntu'da çekirdek ve sürücülerim güncellenmiyor/yüklenmiyor
- Docker Compose ile bir hata alıyorum
- DeepSeek R1 gibi Çok Dilli Sinirsel Modeller İngilizce Yerine Çince Yanıt Veriyor
- OpenWebUI veya Ollama'daki Sinirsel Model Yanıt Vermek İçin Uzun Süre Alıyor
- Ubuntu'da Kurulu Bir İşletim Sisteminden Docker'ı Tamamen Nasıl Kaldırılır
Ubuntu'da çekirdek ve sürücülerim güncellenmiyor/yüklenmiyor¶
Yeni bir çekirdek veya sürücülerin (çekirdek modülleri) yüklenmemesi sorunu, eş zamanlı sistem çekirdek güncellemeleri sırasında /boot bölümünün dolması ve yeni başlangıç RAM disklerinin (initrd) oluşturulmasının engellenmesi nedeniyle ortaya çıkabilir. Bunu kontrol etmek için aşağıdaki komutu çalıştırın:
Çıktıda hata görürseniz, /boot bölümünün doluluk seviyesini kontrol edin. Bunun için df -h /boot komutunun çıktısına bakın:
Başarılı initrd yeniden oluşturmaları için, /boot bölümünün yüzde doluluk oranından önceki sayı 200M'den büyük olmalıdır. Eğer boş alan yoksa, aşağıdaki adımları uygulayın:
-
Yanlışlıkla gerekli dosyaları silerseniz dosyaları hızlıca geri yükleyebilmek için bölümün bir yedeğini oluşturun:
-
/bootbölümünün içeriğine bakın ve tüm initrd görüntülerini bulun:Benzer bir çıktı almalısınız:
-
Fazla initrd görüntülerini silin, SON İKİSİNİ BIRAKIN. Bizim durumumuzda
initrd.img-6.8.0-57-genericveinitrd.img-6.8.0-58-genericdosyalarını silmemiz gerekiyor.Dikkat
Aşağıdaki komutlar işletim sisteminizin arızalanmasına yol açabilir, bu nedenle silinen dosyaların sürümlerine dikkat edin.
/bootbölümünde son ve sondan bir önceki çekirdek sürümleri için dosyalar bulunmalıdır! Şu anda hangi çekirdeği kullandığınızıuname -akomutuyla kontrol edebilirsiniz. Bir şeyler ters giderse,/bootbölümünün içeriğini birinci adımda yapılan yedektensudo rsync -av /boot.old/ /boot/komutuyla geri yükleyebilirsiniz.Bunu aşağıdaki komutla yapın:
Her dosya için bunu tekrarlayın.
vmlinuzveSystem.mapdosyalarıyla da aynı şeyi yapın (isteğe bağlı): -
Eski çekirdeklerle ilgili paketleri sistemden temizleyin ve sürücülerin ve çekirdek modüllerinin kurulum sonrası işlemlerini ve oluşturulmasını aşağıdaki komutlarla çalıştırın:
-
İşletim sistemini yeniden başlatın:
Docker Compose ile bir hata alıyorum¶
Docker compose çalıştırırken docker: 'compose' is not a docker command veya docker-compose: command not found gibi bir hata alıyorsanız, bu durum işletim sisteminizin eski bir sürümde olduğunu ve Docker Compose'ın bir eklenti olarak yüklenmediğini veya PATH'e eklenmediğini gösterebilir. Bu sorunu çözmek için aşağıdaki adımları izleyin:
-
Docker Compose'ı yükleyin (yüklü değilse):
mkdir -p ~/.docker/cli-plugins/ curl -SL https://github.com/docker/compose/releases/latest/download/docker-compose-linux-x86_64 -o ~/.docker/cli-plugins/docker-compose chmod +x ~/.docker/cli-plugins/docker-composeGerekirse
latestyerine resmi depodan geçerli sürümü kullanın. -
Yüklemeyi kontrol edin:
Komut başarıyla çalıştırılırsa, Docker Compose yüklenmiş demektir.
-
Komut hala bulunamıyorsa,
~/.docker/cli-plugins/dizinininPATHortam değişkenine eklenmiş olduğundan emin olun. Bunu~/.bashrcveya~/.zshrcdosyasına ekleyin:Ardından aşağıdaki komutu çalıştırın:
-
Yüklemeyi tekrar kontrol edin:
DeepSeek R1 gibi Çok Dilli Sinirsel Modeller İngilizce Yerine Çince Yanıt Veriyor¶
DeepSeek gibi çoğu çok dilli model, istek İngilizce yapılsa bile bazen ana eğitim diline (örneğin Çince) geçebilir. Bu durum, model distilasyonu, sıkıştırma veya yanıtların büyük ölçüde tek bir ana dilde bulunması nedeniyle gerçekleşir.
Bu davranışı en aza indirmek için, istem sorgusunun sonuna "Respond only in English" ifadesini ekleyerek ve bu satırı sistem istemine dahil ederek yanıt dilini açıkça belirtmeniz önerilir. Ayrıca, DeepSeek'e kıyasla daha az parametreli sürümlerde daha fazla kararlılık gösteren Qwen3 veya Gemma3 gibi modeller kullanmanız tavsiye edilir.
Ayrıca, API üzerinden çalışıyorsanız OpenWebUI gibi araçları veya sohbetinizin arka ucunu kullanarak İngilizce yanıtları manuel olarak kontrol edebilirsiniz.
OpenWebUI veya Ollama'daki Sinirsel Model Yanıt Vermek İçin Uzun Süre Alıyor¶
Model yanıt vermek için uzun süre alıyorsa, bu durum modelin boyutundan ve sunucunuzun kapasitesinden kaynaklanıyor olabilir.
Öncelikle, modelinizin GPU'nun video belleğine tamamen sığındığından emin olun. Örneğin, qwen3-next:80b modeli sıkıştırıldığında (q4) 67 GB'tır ve tamamen açıldığında 80–90 GB video belleği gerektirir. GPU'nuz 24 GB video belleğe sahip NVIDIA A5000 veya RTX 4090 ise, Ollama model katmanlarının bir kısmını sunucunun CPU'suna aktaracak, bu da sanal makine aşırı yüklenmesine, çekirdek tahsisinde azalmaya ve uzun yanıt gecikmelerine neden olacaktır.
Bu tür bir modelle çalışmak için Nvidia H100 gibi 80 GB video belleğe sahip daha güçlü GPU'lara veya dört RTX 4090 kombinasyonuna ihtiyaç vardır. RAM, yalnızca RAG görevleri (bilgi tabanları ve yüklenen dosyalarla çalışma) için önemlidir ve genellikle en az 32 GB gerektirir.
Modelin video bellekteki boyutunu, model q4'e sıkıştırılmışsa boyutunu 2 ile, q8 olarak sıkıştırılmışsa 1.5 ile çarparak tahmin edebilirsiniz. 8000'in üzerindeki her ek 1000 token bağlam penceresi için gerekli video belleğe 1 GB ekleyin.
GPU'nuzun yükünü kontrol etmek için sunucuya SSH üzerinden giriş yapın ve komut satırında ollama ps komutunu çalıştırın:
[ root ]$ ollama ps
NAME ID SIZE PROCESSOR UNTIL
yxchia/multilingual-e5-base:latest f5248cae7e12 1.1 GB 100% GPU 14 minutes from now
qwen3:14b bdbd181c33f2 14 GB 100% GPU 14 minutes from now
Çıktı, modelinizin ne kadar yer kapladığını ve GPU'ya tamamen sığıp sığmadığını gösterecektir.
Not
24 GB video belleğe sahip GPU'lar için, 14B'den büyük modeller veya q8'den öteye sıkıştırılmış modeller önerilmez. Modelin parametre sayısı (hacmi) ve bağlam penceresi boyutu ne kadar büyükse, yanıt süreci o kadar uzun sürecektir.
Bilgi
Nvidia A5000 üzerinde 14B modeller için hesaplama performansı:
- Yanıttan önce soğuk başlatma yaklaşık 30-40 saniye sürer.
- Yanıt süresi 10–15 saniyedir (mülahaza olmadan).
- Yanıt süresi 20-30 saniyedir (mülahaza ile).
RAG (Geri Alma ile Artırılmış Üretim) veya MCP kullanılırsa, yanıt süresi 5–10 saniye artar (veritabanı araması ve araç istekleri için).
Token oluşturma hızı saniyede ~40–45 tokendir. Bunu OpenWebUI'da sohbet yanıt satırının altındaki simgesine tıklayarak ve response_token/s parametresini kontrol ederek doğrulayabilirsiniz.
Ubuntu'da Kurulu Bir İşletim Sisteminden Docker'ı Tamamen Nasıl Kaldırılır¶
Ubuntu işletim sistemi görüntülerimiz, kolaylık sağlamak için önceden yüklü Docker ile gelir. Eğer buna ihtiyacınız yoksa veya farklı bir sürüm yüklemek istiyorsanız, aşağıdaki komutları kullanın:
sudo apt remove docker-ce docker-ce-cli containerd.io docker-buildx-plugin docker-compose-plugin
sudo apt autoremove
sudo rm -rf /var/lib/docker
sudo rm -rf /var/lib/containerd
Docker'ın kaldırıldığından emin olmak için docker --version komutunu çalıştırın.