Qwen3-Coder¶

En este artículo

Características principales de Qwen3-Coder

Funcionalidades de implementación

Primeros pasos después de implementar Qwen3-Coder

Solicitar un servidor con Qwen3-Coder a través de la API

Información

Qwen3-Coder es el modelo más avanzado para programación de la serie Qwen. El modelo está disponible en una versión de 30B y requiere recursos computacionales significativos para su implementación local a través de la plataforma Ollama. La implementación se basa en Ubuntu 22.04 con el kernel actualizado a la versión 6, controladores NVIDIA, CUDA e integración con Open Web UI para una interfaz web conveniente.

Características principales de Qwen3-Coder¶

Modelo eficiente de 30B: El modelo qwen3-coder:30b ofrece 30B de parámetros totales con solo 3.3B activados, proporcionando alto rendimiento manteniendo la eficiencia;
Capacidades excepcionales de agente: Optimizado para tareas reales de desarrollo de software mediante aprendizaje por refuerzo avanzado en tareas a largo plazo utilizando SWE-Bench y benchmarks similares;
Soporte de contexto largo: Soporte nativo para 256K tokens con la capacidad de extender hasta 1M tokens utilizando métodos de extrapolación optimizados a escala, optimizado para comprender escalas de repositorios;
Preentrenamiento a escala: Entrenado con 7.5 billones de tokens con una proporción de código del 70% mientras mantiene fuertes capacidades generales y matemáticas;
Aprendizaje basado en ejecución: El aprendizaje por refuerzo basado en la ejecución de código aumenta significativamente la tasa de éxito de la ejecución de código en varias tareas de programación reales;
Integración con Open Web UI: Proporciona una interfaz web moderna para una interacción conveniente con el modelo a través del puerto 8080, asegurando control total sobre los datos y el procesamiento de solicitudes;
Seguridad y control: La implementación local completa asegura la confidencialidad del código y los datos, mientras que la configuración de OLLAMA_HOST y OLLAMA_ORIGINS garantiza la seguridad de la red;
Tolerancia a fallos: Un sistema integrado reinicia automáticamente los contenedores y servicios para asegurar un funcionamiento estable.
Ejemplos de uso:
- Desarrollo de software: Automatización de la escritura de código, refactorización y depuración;
- Tareas de agente: Ejecución de tareas de programación complejas y multietapa utilizando herramientas;
- Trabajo con navegador: Automatización del desarrollo web y pruebas;
- Análisis de repositorios: Comprensión y trabajo con grandes bases de código;
- Revisión de código: Análisis automático y mejora de la calidad del código;
- Documentación de código: Generación de documentación técnica y comentarios.

Funcionalidades de implementación¶

ID	Nombre del Software	SO Compatible	VM	BM	VGPU	GPU	CPU Mín. (Núcleos)	RAM Mín. (GB)	HDD/SSD Mín. (GB)	Dominio Personalizado	Activo
340	qwen3-coder:30b	Ubuntu 22.04	-	-	+	+	8	60	-	No	PEDIR

Características técnicas de la construcción:

Ubuntu 22.04 con actualización del kernel a la versión 6;
Últimos controladores NVIDIA;
CUDA Toolkit;
Ollama para la gestión del modelo;
OpenWebUI para la interfaz web. Características de instalación:
El tiempo de instalación es de 25 a 45 minutos, incluida la instalación del sistema operativo;
El servidor Ollama carga y ejecuta el modelo Qwen3-Coder en la memoria GPU/RAM;
Open WebUI se implementa como una aplicación web conectada al servidor Ollama;
Los usuarios interactúan con el modelo a través de la interfaz web de Open WebUI para tareas de programación y agentes;
Todos los cálculos y el procesamiento de código ocurren localmente en el servidor;
Los administradores pueden configurar el modelo para tareas de desarrollo específicas a través de las herramientas de OpenWebUI;
Soporte para varios niveles de cuantización para optimizar el uso de la memoria.

Primeros pasos después de implementar Qwen3-Coder¶

Después del pago, se enviará una notificación sobre la preparación del servidor para el trabajo al correo electrónico especificado durante el registro. Contendrá la dirección IP del VPS, así como el nombre de usuario y la contraseña para conectarse al servidor y un enlace para acceder al panel OpenWebUI. Los clientes de nuestra empresa gestionan el equipo en el panel de gestión de servidores y API — Invapi.

Datos de autenticación para acceder al sistema operativo del servidor (por ejemplo, vía SSH) se le enviarán por correo electrónico.
Enlace para acceder al panel de gestión de Ollama con la interfaz web Open WebUI: en la etiqueta webpanel en la pestaña Configuration* >> **Tags del panel de control de Invapi. El enlace exacto en el formato https://qwen3-coder<Server_ID_from_Invapi>.hostkey.in se enviará en el correo electrónico enviado al implementar el servidor.

Después de hacer clic en el enlace de la etiqueta webpanel, se abrirá una ventana de inicio de sesión Get started with Open WebUI, donde debe crear un nombre de cuenta de administrador, correo electrónico y contraseña para su chatbot, luego presione el botón ~~Create Admin Account~~:

Atención

Después de registrar el primer usuario, el sistema les asigna automáticamente un rol de administrador. Para garantizar la seguridad y el control sobre el proceso de registro, todas las solicitudes de registro posteriores deben aprobarse en OpenWebUI desde la cuenta de administrador.

Después de un registro exitoso, se abrirá la interfaz principal de Open WebUI con acceso a Qwen3-Coder:

Nota

Una descripción detallada de las características para trabajar con el panel de gestión de Ollama con Open WebUI se puede encontrar en el artículo Chatbot de IA en su propio servidor

Nota

Para un funcionamiento óptimo con el modelo Qwen3-Coder, se recomienda utilizar una GPU con al menos 20 GB de memoria de video para el modelo de 30B. Esto asegura un procesamiento eficiente de contextos de código largos y tareas de agente complejas. Información detallada sobre la configuración básica de Ollama y Open WebUI se puede encontrar en la documentación del desarrollador de Ollama y en la documentación del desarrollador de Open WebUI.

Recomendaciones de uso

Para una máxima eficiencia con Qwen3-Coder, se recomienda:

Utilizar contextos largos para analizar grandes bases de código
Especificar requisitos técnicos claros al programar
Aprovechar las capacidades del agente para tareas de desarrollo multietapa
Integrar el modelo con las herramientas de desarrollo existentes a través de la API

Solicitar un servidor con Qwen3-Coder a través de la API¶

Para instalar este software utilizando la API, siga estas instrucciones.