Qwen3-Coder¶
Dans cet article
Information
Qwen3-Coder est le modèle de programmation le plus avancé de la série Qwen. Le modèle est disponible en version 30B et nécessite des ressources informatiques significatives pour un déploiement local via la plateforme Ollama. Le déploiement se base sur Ubuntu 22.04 avec une mise à jour du noyau vers la version 6, les pilotes NVIDIA, CUDA et l'intégration avec Open Web UI pour une interface web pratique.
Principales fonctionnalités de Qwen3-Coder¶
- Modèle efficace 30B : Le modèle qwen3-coder:30b offre 30B de paramètres au total avec seulement 3.3B activés, offrant des performances élevées tout en maintenant l'efficacité ;
- Capacités exceptionnelles d'agent : Optimisé pour les tâches réelles de développement logiciel grâce à un apprentissage par renforcement avancé sur des tâches à long terme utilisant SWE-Bench et des benchmarks similaires ;
- Support du contexte étendu : Support natif pour 256K jetons avec la possibilité d'étendre jusqu'à 1M de jetons en utilisant des méthodes d'extrapolation optimisées à l'échelle, optimisé pour comprendre les échelles de dépôt ;
- Préentraînement à grande échelle : Entraîné sur 7.5 trillions de jetons avec un ratio de code de 70% tout en maintenant des capacités générales et mathématiques solides ;
- Apprentissage basé sur l'exécution : Apprentissage par renforcement basé sur l'exécution de code augmente significativement le taux de réussite pour exécuter du code dans diverses tâches réelles de programmation ;
- Intégration avec Open Web UI : Fournit une interface web moderne pour interagir facilement avec le modèle via le port 8080, garantissant un contrôle total sur le traitement des données et des requêtes ;
- Sécurité et contrôle : Déploiement local complet assure la confidentialité du code et des données, tandis que les paramètres OLLAMA_HOST et OLLAMA_ORIGINS garantissent la sécurité réseau ;
- Tolérance aux pannes : Un système intégré redémarre automatiquement les conteneurs et services pour assurer un fonctionnement stable.
- Exemples d'utilisation :
- Développement logiciel : Automatisation de l'écriture, du refactoring et du débogage du code ;
- Tâches d'agent : Exécution de tâches de programmation complexes multi-étapes en utilisant des outils ;
- Travail sur navigateur : Automatisation du développement web et des tests ;
- Analyse de dépôt : Compréhension et travail avec de grands codebases ;
- Revue de code : Analyse automatique et amélioration de la qualité du code ;
- Documentation de code : Génération de documentation technique et de commentaires.
Fonctionnalités de déploiement¶
ID | Système d'exploitation compatible | VM | BM | VGPU | GPU | Min CPU (Cœurs) | Min RAM (Go) | Min HDD/SSD (Go) | Actif |
---|---|---|---|---|---|---|---|---|---|
340 | Ubuntu 22.04 | - | - | + | + | 8 | 60 | - | Oui |
Caractéristiques techniques de la construction :
- Ubuntu 22.04 avec mise à jour du noyau vers la version 6 ;
- Derniers pilotes NVIDIA ;
- CUDA Toolkit ;
- Ollama pour la gestion des modèles ;
- OpenWebUI pour l'interface web.
Caractéristiques d'installation :
- Temps d'installation de 25 à 45 minutes, y compris l'installation du système d'exploitation ;
- Le serveur Ollama charge et exécute le modèle Qwen3-Coder en mémoire GPU/RAM ;
- Open WebUI est déployé sous forme d'application web connectée au serveur Ollama ;
- Les utilisateurs interagissent avec le modèle via l'interface web Open WebUI pour des tâches de programmation et d'agent ;
- Toutes les calculs et traitements du code se produisent localement sur le serveur ;
- Les administrateurs peuvent configurer le modèle pour des tâches de développement spécifiques à l'aide des outils OpenWebUI ;
- Support des différents niveaux de quantification pour optimiser l'utilisation de la mémoire.
Mise en route après le déploiement de Qwen3-Coder¶
Après paiement, une notification sur la disponibilité du serveur sera envoyée à l'adresse e-mail indiquée lors de l'enregistrement. Elle contiendra l'adresse IP du VPS ainsi que les informations d'identification pour se connecter au serveur et un lien pour accéder au panneau OpenWebUI. Nos clients gèrent l'équipement dans le panneau de gestion des serveurs et API — Invapi.
- Données d'authentification pour accéder à l'environnement système du serveur (par exemple, via SSH) vous seront envoyées par e-mail.
- Lien pour accéder au panneau de gestion Ollama avec interface web Open WebUI : dans le tag webpanel dans la rubrique Info >> Étiquettes du panneau de contrôle Invapi. Le lien exact sous la forme
https://qwen3-coder<Server_ID_from_Invapi>.hostkey.in
sera envoyé dans la lettre envoyée lors du déploiement du serveur.
Après avoir cliqué sur le lien depuis l'icône webpanel, une fenêtre de connexion Get started with Open WebUI s'ouvrira, où vous devez créer un nom d'utilisateur administrateur, un e-mail et un mot de passe pour votre chatbot, puis appuyer sur le Create Admin Account bouton:
Attention
Après l'enregistrement du premier utilisateur, le système leur attribue automatiquement un rôle d'administrateur. Pour garantir la sécurité et le contrôle sur le processus de création de compte, toutes les demandes d'enregistrement ultérieures doivent être approuvées dans OpenWebUI depuis le compte administrateur.
Après une inscription réussie, l'interface principale d'Open WebUI avec accès à Qwen3-Coder s'affichera :
Note
Une description détaillée des fonctionnalités pour travailler avec le panneau de gestion Ollama avec interface web Open WebUI se trouve dans l'article Chatbot IA sur votre propre serveur.
Note
Pour un fonctionnement optimal avec le modèle Qwen3-Coder, il est recommandé d'utiliser une carte graphique dotée de 20 Go de mémoire vidéo au moins pour le modèle 30B. Cela garantit un traitement efficace des contextes de code longs et des tâches complexes d'agent. Des informations détaillées sur les paramètres Ollama de base et Open WebUI peuvent être trouvées dans la documentation du développeur Ollama et dans la documentation du développeur Open WebUI.
Recommandations d'utilisation
Pour une efficacité maximale avec Qwen3-Coder, il est recommandé de :
- Utiliser des contextes étendus pour analyser de grands dépôts
- Spécifier des exigences techniques claires lors de la programmation
- Exploiter les capacités d'agent pour des tâches de développement multi-étapes
- Intégrer le modèle avec les outils de développement existants via API
Commander un serveur avec Qwen3-Coder via l'API¶
Pour installer ce logiciel en utilisant l'API, suivez les instructions.
Une partie du contenu de cette page a été créée ou traduite à l'aide d'IA.