Saltar a contenido

Qwen3-32B

En este artículo

Información

Qwen3-32B es un modelo de lenguaje avanzado de próxima generación de la serie Qwen que requiere recursos computacionales significativos para su implementación local a través de la plataforma Ollama. La implementación se basa en sistemas modernos que utilizan aceleradores gráficos NVIDIA. La integración con Open Web UI proporciona una interfaz conveniente para interactuar con el modelo mientras se mantiene el control total sobre los datos.

Características principales de Qwen3-32B

  • Arquitectura multilingüe: El modelo tiene 32 mil millones de parámetros y admite 119 idiomas y dialectos, entrenado con 36 billones de palabras, lo que garantiza la comprensión de matices culturales y traducciones de alta calidad;
  • Modos de operación: Optimizado tanto para el razonamiento profundo (modo de pensamiento) como para respuestas rápidas (modo sin pensamiento), lo que permite adaptarse a diversos tipos de tareas;
  • Integración con Open Web UI: Proporciona una interfaz web moderna para una interacción conveniente con el modelo a través del puerto 8080, garantizando el control total sobre los datos y el procesamiento de solicitudes;
  • Escalabilidad: Admite diferentes niveles de cuantización (FP16, 8 bits, 4 bits) para optimizar el uso de memoria según los recursos disponibles;
  • Seguridad y control: La implementación local completa garantiza la confidencialidad de los datos, mientras que las configuraciones OLLAMA_HOST y OLLAMA_ORIGINS garantizan la seguridad de la red;
  • Alto rendimiento: Alcanza alrededor de 34 tokens por segundo en GPUs de consumo de alto rendimiento, lo que hace que el modelo sea viable para uso local;
  • Tolerancia a fallos: Un sistema integrado de reinicio automático de contenedores y servicios garantiza un funcionamiento estable.
  • Ejemplos de uso:
    • Soporte al cliente: Automatización de respuestas a preguntas de usuarios con soporte para múltiples idiomas;
    • Educación: Creación de materiales educativos, asistencia en la resolución de tareas complejas;
    • Programación: Generación y análisis de código con soporte para varios lenguajes de programación;
    • Contenido multilingüe: Creación y traducción de textos considerando especificidades culturales.

Funcionalidades de implementación

ID Nombre del software SO compatible VM BM VGPU GPU CPU mín. (núcleos) RAM mín. (GB) HDD/SSD mín. (GB) Dominio personalizado Activo
334 qwen3:32b Ubuntu 22.04 - - + + 4 64 - No ORDER
  • Tiempo de instalación de 20 a 40 minutos junto con el sistema operativo;
  • El servidor Ollama carga y ejecuta el modelo Qwen3-32B en la memoria GPU/RAM;
  • Open WebUI se implementa como una aplicación web conectada al servidor Ollama;
  • Los usuarios interactúan con el modelo a través de la interfaz web de Open WebUI, enviando solicitudes y recibiendo respuestas;
  • Todos los cálculos y el procesamiento de datos ocurren localmente en el servidor con soporte multilingüe;
  • Los administradores pueden configurar el modelo para tareas específicas a través de las herramientas de OpenWebUI.

Primeros pasos después de implementar Qwen3-32B

Tras el pago del pedido, se enviará una notificación sobre la disponibilidad del servidor para trabajar al correo electrónico especificado durante el registro. Esta notificación incluirá la dirección IP del VPS, así como el nombre de usuario y la contraseña para conectarse al servidor y un enlace para acceder al panel de OpenWebUI. Los clientes de nuestra empresa gestionan el equipo en el panel de gestión de servidores y la APIInvapi.

  • Datos de autenticación para acceder al sistema operativo del servidor (por ejemplo, vía SSH) se le enviarán en el correo electrónico recibido.
  • Enlace para acceder al panel de gestión de Ollama con la interfaz web Open WebUI: en la etiqueta webpanel en la pestaña Configuration >> Tags del panel de control de Invapi. El enlace exacto en el formato https://qwen3-32b<Server_ID_from_Invapi>.hostkey.in se envía por correo electrónico al entregar el servidor.

Al hacer clic en el enlace de la etiqueta webpanel, se abrirá una ventana de inicio de sesión Get started with Open WebUI, donde deberá crear un nombre de cuenta de administrador, correo electrónico y contraseña para su chatbot, y luego presionar el botón Create Admin Account:

Atención

Después de registrar el primer usuario, el sistema les asigna automáticamente un rol de administrador. Para garantizar la seguridad y el control sobre el proceso de registro, todas las solicitudes de registro posteriores deben aprobarse en OpenWebUI desde la cuenta de administrador.

Tras un registro exitoso, se abrirá la interfaz principal de Open WebUI:

Nota

Una descripción detallada de las características del trabajo con el panel de gestión de Ollama con Open WebUI se puede encontrar en el artículo Chatbot de IA en su propio servidor

Nota

Para un funcionamiento óptimo, se recomienda utilizar una GPU con más de la memoria de video mínima requerida de 16 GB, lo que proporcionará un búfer para el procesamiento de contextos grandes y solicitudes paralelas. Información detallada sobre la configuración principal de Ollama y Open WebUI se puede encontrar en la documentación de desarrolladores de Ollama y en la documentación de desarrolladores de Open WebUI.

Pedido de un servidor con Qwen3-32B usando la API

Para instalar este software usando la API, siga estas instrucciones.


Parte del contenido de esta página fue creado o traducido usando IA.

question_mark
Is there anything I can help you with?
question_mark
AI Assistant ×