Qwen3-32B¶

Dans cet article

Fonctionnalités principales de Qwen3-32B

Fonctionnalités de déploiement

Prise en main après le déploiement de Qwen3-32B

Commande d'un serveur avec Qwen3-32B via l'API

Information

Qwen3-32B est un modèle de langage de nouvelle génération avancé de la série Qwen qui nécessite des ressources informatiques importantes pour le déploiement local via la plateforme Ollama. Le déploiement repose sur des systèmes modernes utilisant des accélérateurs graphiques NVIDIA. L'intégration avec Open Web UI offre une interface pratique pour interagir avec le modèle tout en conservant un contrôle total sur les données.

Fonctionnalités principales de Qwen3-32B¶

Architecture multilingue : Le modèle dispose de 32 milliards de paramètres et prend en charge 119 langues et dialectes, entraîné sur 36 billions de mots, garantissant une compréhension des nuances culturelles et une traduction de haute qualité ;
Modes de fonctionnement : Optimisé à la fois pour le raisonnement approfondi (mode réflexion) et les réponses rapides (mode sans réflexion), permettant une adaptation à divers types de tâches ;
Intégration avec Open Web UI : Fournit une interface web moderne pour une interaction pratique avec le modèle via le port 8080, garantissant un contrôle total sur les données et le traitement des requêtes ;
Évolutivité : Prend en charge différents niveaux de quantification (FP16, 8 bits, 4 bits) pour optimiser l'utilisation de la mémoire en fonction des ressources disponibles ;
Sécurité et contrôle : Le déploiement local complet garantit la confidentialité des données, tandis que les paramètres OLLAMA_HOST et OLLAMA_ORIGINS assurent la sécurité du réseau ;
Haute performance : Atteint environ 34 jetons par seconde sur des GPU grand public haute performance, rendant le modèle viable pour une utilisation locale ;
Tolérance aux pannes : Un système intégré de redémarrage automatique des conteneurs et des services assure un fonctionnement stable.
Exemples d'utilisation :
- Support client : Automatisation des réponses aux questions des utilisateurs avec prise en charge de plusieurs langues ;
- Éducation : Création de matériel pédagogique, assistance dans la résolution de tâches complexes ;
- Programmation : Génération et analyse de code avec prise en charge de divers langages de programmation ;
- Contenu multilingue : Création et traduction de textes en tenant compte des spécificités culturelles.

Fonctionnalités de déploiement¶

ID	Nom du logiciel	Système d'exploitation compatible	VM	BM	VGPU	GPU	Min CPU (Cœurs)	Min RAM (GB)	Min HDD/SSD (GB)	Domaine personnalisé	Actif
334	qwen3:32b	Ubuntu 22.04	-	-	+	+	4	64	-	Non	COMMANDER

Temps d'installation de 20 à 40 minutes avec le système d'exploitation ;
Le serveur Ollama charge et exécute le modèle Qwen3-32B en mémoire GPU/RAM ;
Open WebUI est déployé en tant qu'application web connectée au serveur Ollama ;
Les utilisateurs interagissent avec le modèle via l'interface web Open WebUI, envoyant des requêtes et recevant des réponses ;
Tous les calculs et le traitement des données se produisent localement sur le serveur avec prise en charge multilingue ;
Les administrateurs peuvent configurer le modèle pour des tâches spécifiques via les outils OpenWebUI.

Prise en main après le déploiement de Qwen3-32B¶

Après le paiement de la commande, une notification concernant la disponibilité du serveur sera envoyée à l'adresse e-mail spécifiée lors de l'inscription. Elle contiendra l'adresse IP du VPS, ainsi que les identifiants de connexion et le mot de passe pour se connecter au serveur et un lien pour accéder au panneau OpenWebUI. Les clients de notre entreprise gèrent l'équipement dans le panneau de gestion des serveurs et l'API — Invapi.

Données d'authentification pour l'accès au système d'exploitation du serveur (par exemple, via SSH) vous seront envoyées par e-mail.
Lien pour accéder au panneau de gestion Ollama avec l'interface web Open WebUI : dans la balise webpanel de l'onglet Configuration >> Tags du panneau de contrôle Invapi. Le lien exact sous la forme https://qwen3-32b<Server_ID_from_Invapi>.hostkey.in est envoyé par e-mail lors de la livraison du serveur.

Après avoir cliqué sur le lien de la balise webpanel, une fenêtre de connexion Get started with Open WebUI s'ouvrira, où vous devrez créer un nom de compte administrateur, un e-mail et un mot de passe pour votre chatbot, puis appuyer sur le bouton ~~Create Admin Account~~ :

Attention

Après l'enregistrement du premier utilisateur, le système lui attribue automatiquement un rôle d'administrateur. Pour garantir la sécurité et le contrôle du processus d'inscription, toutes les demandes d'inscription ultérieures doivent être approuvées dans OpenWebUI depuis le compte administrateur.

Après une inscription réussie, l'interface principale d'Open WebUI s'ouvrira :

Remarque

Une description détaillée des fonctionnalités de travail avec le panneau de gestion Ollama avec Open WebUI peut être trouvée dans l'article Chatbot IA sur votre propre serveur

Remarque

Pour un fonctionnement optimal, il est recommandé d'utiliser un GPU avec plus de 16 Go de mémoire vidéo que le minimum requis, ce qui fournira une marge pour le traitement de grands contextes et des requêtes parallèles. Des informations détaillées sur les paramètres principaux d'Ollama et d'Open WebUI peuvent être trouvées dans la documentation des développeurs d'Ollama et dans la documentation des développeurs d'Open WebUI.

Commande d'un serveur avec Qwen3-32B via l'API¶

Pour installer ce logiciel via l'API, suivez ces instructions.