Qwen3-32B¶
Dans cet article
Information
Qwen3-32B est un modèle de langage avancé de nouvelle génération de la série Qwen qui nécessite des ressources informatiques importantes pour le déploiement local via la plateforme Ollama. Le déploiement repose sur des systèmes modernes utilisant des accélérateurs graphiques NVIDIA. L'intégration avec Open Web UI offre une interface conviviale pour interagir avec le modèle tout en maintenant un contrôle complet sur les données.
Principales caractéristiques de Qwen3-32B¶
- Architecture multilingue : Le modèle dispose de 32 milliards de paramètres et prend en charge 119 langues et dialectes, entraîné sur 36 trillions de mots, garantissant une compréhension des nuances culturelles et une traduction de haute qualité ;
- Modes d'opération : Optimisé pour le raisonnement profond (mode réflexion) et les réponses rapides (non-mode réflexion), permettant l'adaptation à différents types de tâches ;
- Intégration avec Open Web UI : Fournit une interface web moderne pour une interaction conviviale avec le modèle via le port 8080, garantissant un contrôle complet sur les données et le traitement des requêtes ;
- Évolutivité : Prend en charge différents niveaux de quantification (FP16, 8 bits, 4 bits) pour l'optimisation de l'utilisation de la mémoire selon les ressources disponibles ;
- Sécurité et contrôle : Un déploiement local complet garantit la confidentialité des données, tandis que les paramètres OLLAMA_HOST et OLLAMA_ORIGINS assurent la sécurité du réseau ;
- Haute performance : Atteint environ 34 jetons par seconde sur des GPU grand public de haute performance, rendant le modèle viable pour une utilisation locale ;
- Tolérance aux pannes : Un système intégré de redémarrage automatique des conteneurs et services garantit un fonctionnement stable.
- Exemples d'utilisation :
- Support client : Automatisation des réponses aux questions des utilisateurs avec prise en charge de plusieurs langues ;
- Éducation : Création de matériel pédagogique, assistance pour résoudre des tâches complexes ;
- Programmation : Génération et analyse de code avec support pour divers langages de programmation ;
- Contenu multilingue : Création et traduction de textes en tenant compte des spécificités culturelles.
Fonctionnalités de déploiement¶
ID | Système d'exploitation compatible | VM | BM | VGPU | GPU | Min CPU (Cœurs) | Min RAM (Go) | Min HDD/SSD (Go) | Actif |
---|---|---|---|---|---|---|---|---|---|
334 | Ubuntu 22.04 | - | - | + | + | 4 | 64 | - | Oui |
- Temps d'installation 20-40 minutes ensemble avec le système d'exploitation ;
- Le serveur Ollama charge et exécute le modèle Qwen3-32B en mémoire GPU/RAM ;
- Open WebUI est déployé sous forme d'une application web connectée au serveur Ollama ;
- Les utilisateurs interagissent avec le modèle via l'interface web Open WebUI, envoyant des requêtes et recevant des réponses ;
- Toutes les calculs et traitements de données se produisent localement sur le serveur avec prise en charge multilingue ;
- Les administrateurs peuvent configurer le modèle pour des tâches spécifiques à l'aide d'outils OpenWebUI.
Démarrage après le déploiement de Qwen3-32B¶
Après paiement de la commande à l'email indiqué lors de l'enregistrement, une notification concernant la disponibilité du serveur sera envoyée. Elle inclura l'adresse IP VPS, ainsi que les identifiants pour se connecter au serveur et un lien pour accéder au panneau OpenWebUI. Les clients de notre entreprise gèrent le matériel dans le panneau de gestion des serveurs et API — Invapi.
-
Identifiants d'authentification pour accéder au système d'exploitation du serveur (par exemple, via SSH) vous seront envoyés par e-mail.
-
Lien pour accéder au panneau de gestion Ollama avec l'interface web Open WebUI: dans la balise webpanel dans l'onglet Info >> Tags du panneau de contrôle Invapi. Le lien exact sous la forme
https://qwen3-32b<Server_ID_from_Invapi>.hostkey.in
vous est envoyé par e-mail à la livraison du serveur.
Après avoir cliqué sur le lien depuis l'icône webpanel, une fenêtre de connexion Get started with Open WebUI s'ouvrira, où vous devez créer un nom d'utilisateur administrateur, un e-mail et un mot de passe pour votre chatbot, puis appuyer sur le Create Admin Account bouton:
Attention
Après l'enregistrement du premier utilisateur, le système leur attribue automatiquement un rôle d'administrateur. Pour garantir la sécurité et le contrôle sur le processus de création de compte, toutes les demandes d'enregistrement ultérieures doivent être approuvées dans OpenWebUI depuis le compte administrateur.
Après une inscription réussie, l'interface principale d'Open WebUI s'ouvre :
Note
Une description détaillée des fonctionnalités de travail avec le panneau de gestion Ollama avec Open WebUI se trouve dans l'article Chatbot IA sur votre propre serveur.
Note
Pour un fonctionnement optimal, il est recommandé d'utiliser une GPU avec plus de 16 Go de mémoire vidéo minimum, ce qui fournira une marge pour le traitement de grands contextes et des requêtes en parallèle. Des informations détaillées sur les paramètres principaux d'Ollama et Open WebUI peuvent être trouvées dans la documentation des développeurs d'Ollama et dans la documentation des développeurs d'Open WebUI.
Commander un serveur avec Qwen3-32B via l'API¶
Pour installer ce logiciel en utilisant l'API, suivez les instructions suivantes.
Certains des contenus de cette page ont été créés ou traduits avec l'aide d'une IA.