Qwen3-Coder¶

Dans cet article

Fonctionnalités principales de Qwen3-Coder

Fonctionnalités de déploiement

Prise en main après le déploiement de Qwen3-Coder

Commander un serveur avec Qwen3-Coder via l'API

Information

Qwen3-Coder est le modèle le plus avancé pour la programmation de la série Qwen. Le modèle est disponible en version 30B et nécessite des ressources informatiques importantes pour un déploiement local via la plateforme Ollama. Le déploiement est basé sur Ubuntu 22.04 avec un noyau mis à jour vers la version 6, les pilotes NVIDIA, CUDA, et une intégration avec Open Web UI pour une interface web pratique.

Fonctionnalités principales de Qwen3-Coder¶

Modèle 30B efficace : Le modèle qwen3-coder:30b offre 30B de paramètres au total avec seulement 3,3B activés, offrant des performances élevées tout en maintenant l'efficacité ;
Capacités d'agent exceptionnelles : Optimisé pour les tâches de développement logiciel réelles grâce à un apprentissage par renforcement avancé sur des tâches à long terme utilisant SWE-Bench et des benchmarks similaires ;
Support de contexte long : Support natif de 256K tokens avec la possibilité de s'étendre jusqu'à 1M tokens en utilisant des méthodes d'extrapolation optimisées à l'échelle, optimisé pour comprendre les échelles de référentiels ;
Pré-entraînement à grande échelle : Entraîné sur 7,5 billions de tokens avec un ratio de code de 70 % tout en maintenant de solides capacités générales et mathématiques ;
Apprentissage basé sur l'exécution : L'apprentissage par renforcement basé sur l'exécution de code augmente considérablement le taux de réussite de l'exécution de code dans diverses tâches de programmation réelles ;
Intégration avec Open Web UI : Fournit une interface web moderne pour une interaction pratique avec le modèle via le port 8080, garantissant un contrôle total sur les données et le traitement des requêtes ;
Sécurité et contrôle : Le déploiement local complet garantit la confidentialité du code et des données, tandis que les paramètres OLLAMA_HOST et OLLAMA_ORIGINS garantissent la sécurité du réseau ;
Tolérance aux pannes : Un système intégré redémarre automatiquement les conteneurs et les services pour assurer un fonctionnement stable.
Exemples d'utilisation :
- Développement logiciel : Automatisation de l'écriture, de la refactorisation et du débogage de code ;
- Tâches d'agent : Exécution de tâches de programmation complexes en plusieurs étapes à l'aide d'outils ;
- Travail avec le navigateur : Automatisation du développement web et des tests ;
- Analyse de référentiel : Compréhension et travail avec de grandes bases de code ;
- Revue de code : Analyse automatique et amélioration de la qualité du code ;
- Documentation du code : Génération de documentation technique et de commentaires.

Fonctionnalités de déploiement¶

ID	Nom du logiciel	Système d'exploitation compatible	VM	BM	VGPU	GPU	Min CPU (Cœurs)	Min RAM (GB)	Min HDD/SSD (GB)	Domaine personnalisé	Actif
340	qwen3-coder:30b	Ubuntu 22.04	-	-	+	+	8	60	-	Non	COMMANDER

Caractéristiques techniques de la configuration :

Ubuntu 22.04 avec mise à jour du noyau vers la version 6 ;
Derniers pilotes NVIDIA ;
CUDA Toolkit ;
Ollama pour la gestion des modèles ;
OpenWebUI pour l'interface web.

Caractéristiques d'installation :

Le temps d'installation est de 25 à 45 minutes, y compris l'installation du système d'exploitation ;
Le serveur Ollama charge et exécute le modèle Qwen3-Coder en mémoire GPU/RAM ;
Open WebUI est déployé en tant qu'application web connectée au serveur Ollama ;
Les utilisateurs interagissent avec le modèle via l'interface web Open WebUI pour les tâches de programmation et d'agent ;
Tous les calculs et le traitement du code se produisent localement sur le serveur ;
Les administrateurs peuvent configurer le modèle pour des tâches de développement spécifiques via les outils OpenWebUI ;
Support de divers niveaux de quantification pour optimiser l'utilisation de la mémoire.

Prise en main après le déploiement de Qwen3-Coder¶

Après le paiement, une notification concernant la disponibilité du serveur pour le travail sera envoyée à l'adresse e-mail spécifiée lors de l'inscription. Elle contiendra l'adresse IP du VPS, ainsi que les identifiants et le mot de passe pour se connecter au serveur et un lien pour accéder au panneau OpenWebUI. Les clients de notre entreprise gèrent l'équipement dans le panneau de gestion des serveurs et API — Invapi.

Données d'authentification pour accéder au système d'exploitation du serveur (par exemple, via SSH) vous seront envoyées par e-mail.
Lien pour accéder au panneau de gestion Ollama avec l'interface web Open WebUI : dans la balise webpanel de l'onglet Configuration >> Tags du panneau de contrôle Invapi. Le lien exact sous la forme https://qwen3-coder<Server_ID_from_Invapi>.hostkey.in sera envoyé dans le courrier envoyé lors du déploiement du serveur.

Après avoir cliqué sur le lien de la balise webpanel, une fenêtre de connexion Get started with Open WebUI s'ouvrira, où vous devrez créer un nom de compte administrateur, un e-mail et un mot de passe pour votre chatbot, puis appuyer sur le bouton ~~Create Admin Account~~ :

Attention

Après l'enregistrement du premier utilisateur, le système lui attribue automatiquement un rôle d'administrateur. Pour garantir la sécurité et le contrôle du processus d'inscription, toutes les demandes d'inscription ultérieures doivent être approuvées dans OpenWebUI depuis le compte administrateur.

Après une inscription réussie, l'interface principale d'Open WebUI avec accès à Qwen3-Coder s'ouvrira :

Remarque

Une description détaillée des fonctionnalités pour travailler avec le panneau de gestion Ollama avec Open WebUI peut être trouvée dans l'article Chatbot IA sur votre propre serveur

Remarque

Pour un fonctionnement optimal avec le modèle Qwen3-Coder, il est recommandé d'utiliser un GPU avec au moins 20 Go de mémoire vidéo pour le modèle 30B. Cela garantit un traitement efficace des contextes de code longs et des tâches d'agent complexes. Des informations détaillées sur les paramètres de base d'Ollama et d'Open WebUI peuvent être trouvées dans la documentation développeur d'Ollama et dans la documentation développeur d'Open WebUI.

Recommandations d'utilisation

Pour une efficacité maximale avec Qwen3-Coder, il est recommandé de :

Utiliser des contextes longs pour analyser de grandes bases de code
Spécifier des exigences techniques claires lors de la programmation
Utiliser les capacités d'agent pour les tâches de développement en plusieurs étapes
Intégrer le modèle avec les outils de développement existants via l'API

Commander un serveur avec Qwen3-Coder via l'API¶

Pour installer ce logiciel via l'API, suivez ces instructions.