Gestion des logiciels¶
Dans cet article
- Mon noyau et mes pilotes ne se mettent pas à jour/ne s'installent pas sur Ubuntu
- J'obtiens une erreur avec Docker Compose
- Les modèles neuronaux multilingues comme DeepSeek R1 répondent en chinois au lieu de l'anglais
- Le modèle neuronal dans OpenWebUI ou Ollama met du temps à répondre
- Comment supprimer complètement Docker d'un OS Ubuntu installé
Mon noyau et mes pilotes ne se mettent pas à jour/ne s'installent pas sur Ubuntu¶
Le problème où un nouveau noyau ou des pilotes (modules du noyau) ne s'installent pas peut survenir en raison de la partition /boot pleine lors de mises à jour simultanées du noyau système, empêchant la création de nouveaux disques RAM initiaux (initrd). Pour vérifier cela, exécutez la commande :
Si vous voyez des erreurs dans la sortie, vérifiez le niveau de remplissage de la partition /boot. Pour cela, regardez la sortie de la commande df -h /boot
Pour des reconstructions réussies de initrd, le nombre avant le pourcentage de remplissage de la partition /boot doit être supérieur à 200M. S'il n'y a pas d'espace libre, effectuez les étapes suivantes :
-
Créez une sauvegarde de la partition afin de pouvoir restaurer rapidement les fichiers si vous supprimez accidentellement des fichiers nécessaires :
-
Examinez le contenu de la partition
/bootet trouvez toutes les images initrd :Vous devriez obtenir une sortie similaire à celle-ci :
-
Supprimez les images initrd supplémentaires, EN LAISSANT LES DEUX DERNIÈRES. Dans notre cas, nous devons supprimer
initrd.img-6.8.0-57-genericetinitrd.img-6.8.0-58-generic.Attention
Les commandes suivantes peuvent entraîner un dysfonctionnement de votre système d'exploitation, alors faites attention aux versions des fichiers supprimés. Il doit y avoir des fichiers pour les dernières et avant-dernières versions du noyau dans la partition
/boot! Vous pouvez vérifier quel noyau vous utilisez actuellement avec la commandeuname -a. Si quelque chose ne va pas, vous pouvez restaurer le contenu de la partition /boot à partir de la sauvegarde effectuée à l'étape un avec la commandesudo rsync -av /boot.old/ /boot/.Faites cela avec la commande :
Répétez pour chaque fichier.
Faites de même avec les fichiers
vmlinuzetSystem.map(facultatif) : -
Nettoyez le système des packages liés aux anciens noyaux et exécutez les étapes post-installation et la construction des pilotes et modules du noyau avec les commandes :
-
Redémarrez le système d'exploitation :
J'obtiens une erreur avec Docker Compose¶
Si vous recevez une erreur comme docker: 'compose' is not a docker command ou docker-compose: command not found lors de l'exécution de docker compose, cela peut signifier que votre version du système d'exploitation est ancienne et que Docker Compose n'a pas été installé en tant que plugin ou ajouté à PATH. Pour résoudre ce problème, suivez ces étapes :
-
Installez Docker Compose (s'il n'est pas installé) :
mkdir -p ~/.docker/cli-plugins/ curl -SL https://github.com/docker/compose/releases/latest/download/docker-compose-linux-x86_64 -o ~/.docker/cli-plugins/docker-compose chmod +x ~/.docker/cli-plugins/docker-composeRemplacez
latestpar la version actuelle du dépôt officiel si nécessaire. -
Vérifiez l'installation :
Si la commande s'exécute avec succès, Docker Compose est installé.
-
Si la commande n'est toujours pas trouvée, assurez-vous que
~/.docker/cli-plugins/est ajouté à la variable d'environnementPATH. Ajoutez ceci à~/.bashrcou~/.zshrc:Puis exécutez :
-
Vérifiez à nouveau l'installation :
Les modèles neuronaux multilingues comme DeepSeek R1 répondent en chinois au lieu de l'anglais¶
La plupart des modèles multilingues, tels que DeepSeek, peuvent occasionnellement passer à la langue principale d'entraînement (chinois, par exemple) même si la demande a été faite en anglais. Cela se produit en raison de la distillation du modèle, de la compression ou de la présence de réponses principalement dans une langue principale.
Pour minimiser ce comportement, il est recommandé de spécifier explicitement la langue de réponse en ajoutant "Respond only in English" à la fin de la requête du prompt et en incluant cette ligne dans le prompt système. Il est également conseillé d'utiliser des modèles comme Qwen3 ou Gemma3, qui démontrent une plus grande stabilité dans les versions avec moins de paramètres par rapport à DeepSeek.
De plus, vous pouvez vérifier manuellement les réponses en anglais à l'aide d'outils comme OpenWebUI ou sur le backend de votre chat si vous travaillez via une API.
Le modèle neuronal dans OpenWebUI ou Ollama met du temps à répondre¶
Si le modèle met du temps à répondre, cela peut être dû à sa taille et à la capacité de votre serveur.
Tout d'abord, assurez-vous que votre modèle tient entièrement dans la mémoire vidéo du GPU. Par exemple, le modèle qwen3-next:80b fait 67 Go lorsqu'il est compressé (q4) et nécessite 80–90 Go de mémoire vidéo lorsqu'il est entièrement décompressé. Si votre GPU est un NVIDIA A5000 ou RTX 4090 avec 24 Go de mémoire vidéo, Ollama transférera des parties des couches du modèle vers le CPU du serveur, provoquant une surcharge de la VM, une réduction de l'allocation des cœurs et de longs délais de réponse.
Pour travailler avec un tel modèle, des GPU plus puissants sont nécessaires, tels que le Nvidia H100 avec 80 Go de mémoire vidéo ou une combinaison de quatre RTX 4090. La RAM n'est importante que pour les tâches RAG (travail avec des bases de connaissances et des fichiers chargés) et nécessite généralement au moins 32 Go.
Vous pouvez estimer la taille du modèle en mémoire vidéo en multipliant sa taille par 2 si le modèle est compressé en q4, ou par 1,5 si le modèle est compressé en q8. Pour chaque tranche de 1000 tokens supplémentaires dans une fenêtre de contexte supérieure à 8000, ajoutez 1 Go de mémoire vidéo requise.
Pour vérifier la charge de votre GPU, connectez-vous au serveur via SSH et exécutez ollama ps dans la ligne de commande :
[ root ]$ ollama ps
NAME ID SIZE PROCESSOR UNTIL
yxchia/multilingual-e5-base:latest f5248cae7e12 1.1 GB 100% GPU 14 minutes from now
qwen3:14b bdbd181c33f2 14 GB 100% GPU 14 minutes from now
La sortie montrera combien d'espace votre modèle occupe et s'il tient entièrement dans le GPU.
!!! "Remarque" Pour les GPU avec 24 Go de mémoire vidéo, les modèles supérieurs à 14B ou compressés au-delà de q8 ne sont pas recommandés. Plus le nombre de paramètres du modèle (volume) et la taille de la fenêtre de contexte sont grands, plus le processus de réponse sera long.
Information
Performance de calcul pour les modèles 14B sur Nvidia A5000 :
- Le démarrage à froid prend environ 30-40 secondes avant une réponse.
- Le temps de réponse est de 10–15 secondes (sans raisonnement).
- Le temps de réponse est de 20-30 secondes (avec raisonnement).
Si le RAG (Retrieval-Augmented Generation) ou le MCP est utilisé, le temps de réponse augmente de 5–10 secondes (pour la recherche dans la base de données et les requêtes d'outils).
La vitesse de génération de tokens est d'environ 40–45 tokens par seconde. Vous pouvez vérifier cela en cliquant sur l'icône en bas de la ligne de réponse du chat dans OpenWebUI et en vérifiant le paramètre response_token/s.
Comment supprimer complètement Docker d'un OS Ubuntu installé¶
Nos images de système d'exploitation Ubuntu sont livrées avec Docker préinstallé pour plus de commodité. Si vous n'en avez pas besoin ou si vous souhaitez installer une version différente, utilisez les commandes suivantes :
sudo apt remove docker-ce docker-ce-cli containerd.io docker-buildx-plugin docker-compose-plugin
sudo apt autoremove
sudo rm -rf /var/lib/docker
sudo rm -rf /var/lib/containerd
Assurez-vous que Docker est supprimé en exécutant la commande docker --version.