Questions sur la gestion des logiciels¶

Dans cet article

J'ai des problèmes avec un logiciel installé sur mon serveur ; qui dois-je contacter ?

Mon noyau et mes pilotes ne se mettent pas à jour/ne s'installent pas sur Ubuntu

Je reçois une erreur avec Docker Compose

Les modèles neuronaux multilingues comme DeepSeek R1 répondent en chinois au lieu de l'anglais

Un modèle neuronal dans OpenWebUI ou Ollama met du temps à répondre

Comment supprimer complètement Docker d'un OS Ubuntu installé

L'installation de serveurs NZBGet/Torrent/Plex est-elle autorisée ?

J'ai des problèmes avec un logiciel installé sur mon serveur ; qui dois-je contacter ?¶

Nous n'administrons pas le serveur après la livraison ni aucun logiciel installé sur le serveur du client, et nous ne fournissons pas de consultations sur ces sujets. Le client est responsable de l'administration de son propre serveur.

Si une assistance de la part de nos administrateurs système est requise, nous sommes disponibles pour aider dans le cadre d'une administration payante.

Pour commander une administration payante, veuillez envoyer un cahier des charges au Sales Department — nous estimerons le temps nécessaire pour le travail et vous fournirons un devis.

Mon noyau et mes pilotes ne se mettent pas à jour/ne s'installent pas sur Ubuntu¶

Le problème où un nouveau noyau ou des pilotes (modules du noyau) ne s'installent pas peut survenir lorsque la partition /boot est pleine lors de mises à jour simultanées du noyau du système, empêchant la création de nouveaux disques RAM initiaux (initrd). Pour vérifier cela, exécutez la commande :

sudo apt --fix-broken install

Si vous voyez des erreurs dans la sortie, vérifiez le niveau de remplissage de la partition /boot. Pour ce faire, regardez la sortie de la commande df -h /boot

/dev/sda2       739M  287M  398M  42% /boot

Pour que la reconstruction des initrd réussisse, le nombre avant le pourcentage de remplissage de la partition /boot doit être supérieur à 200M. S'il n'y a plus d'espace libre, suivez les étapes suivantes :

Créez une sauvegarde de la partition afin de pouvoir restaurer rapidement les fichiers si vous en supprimez accidentellement certains qui sont nécessaires :
```
sudo rsync -av /boot/ /boot.old/
```

Regardez le contenu de la partition /boot et trouvez toutes les images initrd :

ls /boot | grep 'initrd.img-'

Vous devriez obtenir une sortie similaire à ceci :

initrd.img
initrd.img-6.8.0-57-generic
initrd.img-6.8.0-58-generic
initrd.img-6.8.0-59-generic
initrd.img-6.8.0-60-generic
initrd.img-initrd.img
initrd.img-initrd.img.old
initrd.img.old

Supprimez les images initrd en trop, en LAISSANT LES DEUX DERNIÈRES. Dans notre cas, nous devons supprimer initrd.img-6.8.0-57-generic et initrd.img-6.8.0-58-generic.

Attention

Les commandes suivantes peuvent entraîner un dysfonctionnement de votre système d'exploitation, faites donc attention aux versions des fichiers supprimés. Il doit y avoir des fichiers pour les deux dernières versions du noyau dans la partition /boot ! Vous pouvez vérifier quel noyau vous utilisez actuellement avec la commande uname -a. Si quelque chose se passe mal, vous pouvez restaurer le contenu de la partition /boot à partir de la sauvegarde effectuée à l'étape un avec la commande sudo rsync -av /boot.old/ /boot/.

Faites cela avec la commande :
```
rm -f /boot/initrd.img-6.8.0-57-generic
```
Répétez l'opération pour chaque fichier.

Faites de même avec les fichiers vmlinuz et System.map (optionnel) :
```
rm -f /boot/vmlinuz-6.8.0-57-generic 
rm -f /boot/System.map-6.8.0-57-generic
```
Nettoyez le système des paquets liés aux anciens noyaux et lancez la post-installation et la construction des pilotes et modules du noyau avec les commandes :
```
sudo apt autoremove
sudo apt --fix-broken install
```
Redémarrez l'OS :
```
reboot
```

Je reçois une erreur avec Docker Compose¶

Si vous recevez une erreur telle que docker: 'compose' is not a docker command ou docker-compose: command not found lors de l'exécution de docker compose, cela peut signifier que la version de votre système d'exploitation est ancienne et que Docker Compose n'était pas installé en tant que plugin ou ajouté au PATH. Pour résoudre ce problème, suivez ces étapes :

Installez Docker Compose (si non installé) :

mkdir -p ~/.docker/cli-plugins/
curl -SL https://github.com/docker/compose/releases/latest/download/docker-compose-linux-x86_64 -o ~/.docker/cli-plugins/docker-compose
chmod +x ~/.docker/cli-plugins/docker-compose

Remplacez latest par la version actuelle du dépôt officiel si nécessaire.

Vérifiez l'installation :
```
docker-compose --version
```
Si la commande s'exécute avec succès, Docker Compose est installé.
Si la commande n'est toujours pas trouvée, assurez-vous que ~/.docker/cli-plugins/ est ajouté à la variable d'environnement PATH. Ajoutez ceci à votre fichier ~/.bashrc ou ~/.zshrc :
```
export PATH=$PATH:~/.docker/cli-plugins/
```
Ensuite, exécutez :
```
source ~/.bashrc  # ou source ~/.zshrc
```
Vérifiez à nouveau l'installation :
```
docker-compose --version
```

Les modèles neuronaux multilingues comme DeepSeek R1 répondent en chinois au lieu de l'anglais¶

La plupart des modèles multilingues, tels que DeepSeek, peuvent occasionnellement passer à la langue principale d'entraînement (le chinois, par exemple) même si la requête a été faite en anglais. Cela se produit en raison de la distillation du modèle, de sa compression ou de la présence de réponses principalement dans une seule langue principale.

Pour minimiser ce comportement, il est recommandé de spécifier explicitement la langue de réponse en ajoutant "Respond only in English" à la fin de votre requête (prompt) et en incluant cette ligne dans le system prompt. Il est également conseillé d'utiliser des modèles comme Qwen3 ou Gemma3, qui font preuve d'une plus grande stabilité dans les versions avec moins de paramètres par rapport à DeepSeek.

De plus, vous pouvez vérifier manuellement si les réponses sont en anglais en utilisant des outils comme OpenWebUI ou sur le backend de votre chat si vous travaillez via une API.

Un modèle neuronal dans OpenWebUI ou Ollama met du temps à répondre¶

Si le modèle met longtemps à répondre, cela peut être dû à sa taille et à la capacité de votre serveur.

Premièrement, assurez-vous que votre modèle tient entièrement dans la mémoire vidéo (VRAM) du GPU. Par exemple, le modèle qwen3-next:80b pèse 67 Go lorsqu'il est compressé (q4) et nécessite 80 à 90 Go de mémoire vidéo lorsqu'il est entièrement décompressé. Si votre GPU est une NVIDIA A5000 ou une RTX 4090 avec 24 Go de mémoire vidéo, Ollama déchargera certaines couches du modèle vers le CPU du serveur, provoquant une surcharge de la VM, une réduction de l'allocation des cœurs et de longs délais de réponse.

Pour travailler avec un tel modèle, des GPU plus puissants sont nécessaires, tels que les Nvidia H100 avec 80 Go de mémoire vidéo ou une combinaison de quatre RTX 4090. La RAM n'est importante que pour les tâches RAG (travail avec des bases de connaissances et des fichiers chargés) et nécessite généralement au moins 32 Go.

Vous pouvez estimer la taille du modèle en mémoire vidéo en multipliant sa taille par 2 si le modèle est compressé en q4, ou par 1,5 s'il est compressé en q8. Pour chaque tranche de 1000 tokens supplémentaires dans une fenêtre de contexte au-delà de 8000, ajoutez 1 Go de mémoire vidéo requise.

Pour vérifier la charge de votre GPU, connectez-vous au serveur via SSH et exécutez ollama ps dans la ligne de commande :

[ root ]$ ollama ps 
NAME                                  ID              SIZE      PROCESSOR    UNTIL
yxchia/multilingual-e5-base:latest    f5248cae7e12    1.1 GB    100% GPU     14 minutes from now
qwen3:14b                             bdbd181c33f2    14 GB     100% GPU     14 minutes from now

La sortie indiquera l'espace occupé par votre modèle et s'il tient entièrement dans le GPU.

Remarque

Pour les GPU avec 24 Go de mémoire vidéo, les modèles plus grands que 14B ou compressés au-delà de q8 ne sont pas recommandés. Plus le nombre de paramètres (volume) du modèle et la taille de la fenêtre de contexte sont élevés, plus le processus de réponse sera long.

Information

Performances de calcul pour les modèles 14B sur Nvidia A5000 :

Le démarrage à froid prend environ 30-40 secondes avant une réponse.
Le temps de réponse est de 10–15 secondes (sans raisonnement).
Le temps de réponse est de 20-30 secondes (avec raisonnement).

Si le RAG (Retrieval-Augmented Generation) ou MCP est utilisé, le temps de réponse augmente de 5 à 10 secondes (pour la recherche dans la base de données et les requêtes d'outils).

La vitesse de génération des tokens est d'environ 40–45 tokens par seconde. Vous pouvez vérifier cela en cliquant sur l'icône au bas de la ligne de réponse du chat dans OpenWebUI et en vérifiant le paramètre response_token/s.

Comment supprimer complètement Docker d'un OS Ubuntu installé¶

Nos images de système d'exploitation Ubuntu incluent Docker préinstallé pour plus de commodité. Si vous n'en avez pas besoin ou si vous souhaitez installer une version différente, utilisez les commandes suivantes :

sudo apt remove docker-ce docker-ce-cli containerd.io docker-buildx-plugin docker-compose-plugin
sudo apt autoremove
sudo rm -rf /var/lib/docker
sudo rm -rf /var/lib/containerd

Assurez-vous que Docker est supprimé en exécutant la commande docker --version.

L'installation de serveurs NZBGet/Torrent/Plex est-elle autorisée ?¶

Nous ne restreignons pas l'utilisation de nos services par les clients. En revanche, HOSTKEY n'ignore pas les réclamations du DMCA et des détenteurs de droits d'auteur qui nous sont envoyées conformément à la loi applicable. Cela inclut aussi bien le stockage de contenu protégé par le droit d'auteur sur un serveur loué que l'hébergement de sites web fournissant l'accès à du contenu protégé stocké ailleurs.

Attention

Si HOSTKEY reçoit une plainte pour violation de droits, le propriétaire du serveur doit supprimer le matériel protégé. Chaque plainte doit être résolue et l'objet de la plainte doit être supprimé de notre réseau. Le non-respect ou l'ignorance de ces réclamations peut entraîner une suspension temporaire ou permanente du serveur.