Saltar a contenido

Qwen3-Coder

En este artículo

Información

Qwen3-Coder es el modelo más avanzado para programación de la serie Qwen. El modelo está disponible en una versión de 30B y requiere recursos computacionales significativos para su implementación local a través de la plataforma Ollama. La implementación se basa en Ubuntu 22.04 con el kernel actualizado a la versión 6, controladores NVIDIA, CUDA e integración con Open Web UI para una interfaz web conveniente.

Características principales de Qwen3-Coder

  • Modelo eficiente de 30B: El modelo qwen3-coder:30b ofrece 30B de parámetros totales con solo 3.3B activados, proporcionando alto rendimiento manteniendo la eficiencia;
  • Capacidades excepcionales de agente: Optimizado para tareas reales de desarrollo de software mediante aprendizaje por refuerzo avanzado en tareas a largo plazo utilizando SWE-Bench y benchmarks similares;
  • Soporte de contexto largo: Soporte nativo para 256K tokens con la capacidad de extender hasta 1M tokens utilizando métodos de extrapolación optimizados a escala, optimizado para comprender escalas de repositorios;
  • Preentrenamiento a escala: Entrenado con 7.5 billones de tokens con una proporción de código del 70% mientras mantiene fuertes capacidades generales y matemáticas;
  • Aprendizaje basado en ejecución: El aprendizaje por refuerzo basado en la ejecución de código aumenta significativamente la tasa de éxito de la ejecución de código en diversas tareas de programación reales;
  • Integración con Open Web UI: Proporciona una interfaz web moderna para una interacción conveniente con el modelo a través del puerto 8080, asegurando control total sobre los datos y el procesamiento de solicitudes;
  • Seguridad y control: La implementación local completa garantiza la confidencialidad del código y los datos, mientras que la configuración de OLLAMA_HOST y OLLAMA_ORIGINS garantiza la seguridad de la red;
  • Tolerancia a fallos: Un sistema integrado reinicia automáticamente los contenedores y servicios para garantizar un funcionamiento estable.
  • Ejemplos de uso:
    • Desarrollo de software: Automatización de la escritura, refactorización y depuración de código;
    • Tareas de agente: Ejecución de tareas de programación complejas y multietapa utilizando herramientas;
    • Trabajo con navegador: Automatización del desarrollo web y las pruebas;
    • Análisis de repositorios: Comprensión y trabajo con grandes bases de código;
    • Revisión de código: Análisis automático y mejora de la calidad del código;
    • Documentación de código: Generación de documentación técnica y comentarios.

Funcionalidades de implementación

ID Nombre del software SO compatible VM BM VGPU GPU CPU mín. (núcleos) RAM mín. (GB) HDD/SSD mín. (GB) Dominio personalizado Activo
340 qwen3-coder:30b Ubuntu 22.04 - - + + 8 60 - No ORDER

Características técnicas de la construcción:

  • Ubuntu 22.04 con actualización del kernel a la versión 6;
  • Últimos controladores NVIDIA;
  • CUDA Toolkit;
  • Ollama para la gestión del modelo;
  • OpenWebUI para la interfaz web. Características de instalación:

  • El tiempo de instalación es de 25 a 45 minutos, incluida la instalación del sistema operativo;

  • El servidor Ollama carga y ejecuta el modelo Qwen3-Coder en la memoria GPU/RAM;
  • Open WebUI se implementa como una aplicación web conectada al servidor Ollama;
  • Los usuarios interactúan con el modelo a través de la interfaz web de Open WebUI para tareas de programación y agentes;
  • Todos los cálculos y el procesamiento de código ocurren localmente en el servidor;
  • Los administradores pueden configurar el modelo para tareas de desarrollo específicas a través de las herramientas de OpenWebUI;
  • Soporte para varios niveles de cuantización para optimizar el uso de la memoria.

Primeros pasos después de implementar Qwen3-Coder

Después del pago, se enviará una notificación sobre la preparación del servidor para el trabajo al correo electrónico especificado durante el registro. Contendrá la dirección IP del VPS, así como el nombre de usuario y la contraseña para conectarse al servidor y un enlace para acceder al panel OpenWebUI. Los clientes de nuestra empresa gestionan el equipo en el panel de gestión de servidores y APIInvapi.

  • Datos de autenticación para acceder al sistema operativo del servidor (por ejemplo, a través de SSH) se le enviarán por correo electrónico.

  • Enlace para acceder al panel de gestión de Ollama con la interfaz web Open WebUI: en la etiqueta webpanel en la pestaña Configuration* >> **Tags del panel de control de Invapi. El enlace exacto en el formato https://qwen3-coder<Server_ID_from_Invapi>.hostkey.in se enviará en el correo enviado al implementar el servidor.

Después de hacer clic en el enlace de la etiqueta webpanel, se abrirá una ventana de inicio de sesión Get started with Open WebUI, donde debe crear un nombre de cuenta de administrador, correo electrónico y contraseña para su chatbot, y luego presionar el botón Create Admin Account:

Atención

Después de registrar el primer usuario, el sistema les asigna automáticamente un rol de administrador. Para garantizar la seguridad y el control sobre el proceso de registro, todas las solicitudes de registro posteriores deben aprobarse en OpenWebUI desde la cuenta de administrador.

Después de un registro exitoso, se abrirá la interfaz principal de Open WebUI con acceso a Qwen3-Coder:

Nota

Una descripción detallada de las características para trabajar con el panel de gestión de Ollama con Open WebUI se puede encontrar en el artículo Chatbot de IA en su propio servidor

Nota

Para un funcionamiento óptimo con el modelo Qwen3-Coder, se recomienda utilizar una GPU con al menos 20 GB de memoria de video para el modelo de 30B. Esto garantiza un procesamiento eficiente de contextos de código largos y tareas de agente complejas. Información detallada sobre la configuración básica de Ollama y Open WebUI se puede encontrar en la documentación del desarrollador de Ollama y en la documentación del desarrollador de Open WebUI.

Recomendaciones de uso

Para una máxima eficiencia con Qwen3-Coder, se recomienda:

  • Utilizar contextos largos para analizar grandes bases de código
  • Especificar requisitos técnicos claros al programar
  • Aprovechar las capacidades del agente para tareas de desarrollo multietapa
  • Integrar el modelo con las herramientas de desarrollo existentes a través de la API

Solicitar un servidor con Qwen3-Coder a través de la API

Para instalar este software utilizando la API, siga estas instrucciones.


Parte del contenido de esta página fue creado o traducido utilizando IA.

question_mark
Is there anything I can help you with?
question_mark
AI Assistant ×