DeepSeek-R1:70B¶

En este artículo

Características principales de DeepSeek-R1:70B

Funcionalidades de implementación

Requisitos del sistema y especificaciones técnicas

Primeros pasos después de desplegar DeepSeek-R1:70B

Pedido de un servidor con DeepSeek-R1:70B mediante API

Información

DeepSeek-R1:70B es un modelo de lenguaje avanzado con 70 mil millones de parámetros, diseñado para tareas de alto rendimiento y despliegue local a través del framework Ollama. Combina un poder expresivo excepcional, soporte para inferencias complejas y una integración sencilla mediante Open Web UI. Para funcionar eficazmente, el modelo requiere recursos computacionales potentes, específicamente GPUs modernas de NVIDIA (con soporte FP16/INT4) o aceleradores compatibles. Se recomienda el despliegue en Ubuntu 22.04 o versiones posteriores del sistema operativo para garantizar un funcionamiento estable con modelos grandes.

Características principales de DeepSeek-R1:70B¶

Alto rendimiento: Gracias a su arquitectura masiva con 70 mil millones de parámetros, DeepSeek-R1:70B demuestra resultados sobresalientes en la generación y comprensión de lenguaje natural, asegurando precisión y profundidad en las respuestas incluso en escenarios complejos;
Soporte multilingüe: El modelo está entrenado con extensos corpus multilingües y puede trabajar con confianza con decenas de idiomas, incluyendo ruso, inglés, chino, español, francés y muchos otros;
Modos de inferencia avanzados: Soporta razonamiento zero-shot, few-shot y chain-of-thought, lo que le permite resolver tareas lógicas, analíticas y creativas complejas sin necesidad de entrenamiento adicional;
Aplicación versátil: DeepSeek-R1:70B maneja eficientemente una amplia gama de tareas, desde la generación de texto artístico y técnico hasta la escritura y depuración de código, la resolución de problemas matemáticos y el análisis de datos estructurados;
Integración profunda: El modelo puede conectarse fácilmente a sistemas externos mediante REST API o integrarse en chatbots, plataformas analíticas, IDEs y aplicaciones corporativas;
Capacidades de ajuste fino y adaptación: Soporta ajuste fino y adaptación LoRA para dominios especializados, como medicina, finanzas, derecho, ingeniería e investigación científica;
Ético y fiable: Incluye mecanismos integrados para filtrar contenido tóxico, dañino o sesgado, alineándose con los estándares modernos de IA responsable;
Optimizado para uso local: A pesar de su escala, DeepSeek-R1:70B soporta cuantización (por ejemplo, hasta 4 bits), lo que permite ejecutarlo en servidores con memoria GPU limitada sin una pérdida crítica de calidad;
Manejo de datos heterogéneos: El modelo procesa eficientemente no solo texto estándar, sino también código de programación, tablas, JSON, XML y otros formatos, lo que lo convierte en una herramienta valiosa en ciencia de datos y automatización;
Ejemplos de uso:
Soporte al cliente inteligente: Generación de respuestas personalizadas y dependientes del contexto en tiempo real;
Educación y ciencia: Asistencia en la resolución de problemas complejos, explicación de conceptos, generación de materiales educativos;
Contenido y marketing: Creación de textos creativos, análisis de tono, generación de ideas para campañas;
Ingeniería de software: Autocompletado de código, refactorización, documentación, generación de pruebas unitarias.

Funcionalidades de implementación¶

ID	Nombre del Software	SO Compatible	VM	BM	VGPU	GPU	CPU Mín. (Núcleos)	RAM Mín. (GB)	HDD/SSD Mín. (GB)	Dominio Personalizado	Activo
410	DeepSeek-r1:70b	Ubuntu 22.04	-	-	+	+	8	128	240	No	PEDIR

El tiempo de instalación es de 30-40 minutos junto con el sistema operativo;
El servidor Ollama carga y ejecuta el LLM en memoria;
Open WebUI se despliega como una aplicación web conectada al servidor Ollama;
Los usuarios interactúan con el LLM a través de la interfaz web de Open WebUI, enviando solicitudes y recibiendo respuestas;
Todos los cálculos y el procesamiento de datos ocurren localmente en el servidor. Los administradores pueden configurar el LLM para tareas específicas a través de las herramientas de OpenWebUI.

Requisitos del sistema y especificaciones técnicas¶

Sistema operativo: Ubuntu 22.04;
RAM: mínimo 128 GB de RAM;
Acelerador gráfico: 2x5090 con 32 GB de memoria de video (64 GB en total) u otras configuraciones. Se recomienda utilizar A100/H100/RTX 6000 PRO
Espacio en disco: Suficiente para instalar el sistema, controladores y el modelo;
Controladores: Controladores NVIDIA y CUDA para un correcto funcionamiento de la GPU;
Consumo de memoria de video: 48 GB con un contexto de 2K tokens;
Reinicio automático: Se configura el reinicio automático del contenedor en caso de fallos;
Soporte GPU: Integración completa con NVIDIA CUDA para un rendimiento máximo.

Primeros pasos después de desplegar DeepSeek-R1:70B¶

Tras el pago, se enviará un correo electrónico a la dirección especificada durante el registro notificando que el servidor está listo. Incluirá la dirección IP del VPS, así como el nombre de usuario y la contraseña para acceder al servidor y un enlace para acceder al panel de control de OpenWebUI. Los clientes de nuestra empresa gestionan el equipo a través del panel de gestión de servidores y la API — Invapi.

Datos de inicio de sesión para acceder al sistema operativo del servidor (por ejemplo, vía SSH) se le enviarán por correo electrónico.
Enlace para acceder al panel de control de Ollama con la interfaz web de Open WebUI: En la etiqueta webpanel bajo la pestaña Info >> Tags del panel de control de Invapi. El enlace exacto en el formato https://deepseek<Server_ID_from_Invapi>.hostkey.in se enviará por correo electrónico cuando se entregue el servidor.

Después de hacer clic en el enlace de la etiqueta webpanel, se abrirá una ventana de inicio de sesión Get started with Open WebUI, donde deberá crear un nombre de cuenta de administrador, correo electrónico y contraseña para su chatbot, y luego presionar el botón ~~Create Admin Account~~:

Atención

Después de registrar el primer usuario, el sistema les asigna automáticamente un rol de administrador. Para garantizar la seguridad y el control sobre el proceso de registro, todas las solicitudes de registro posteriores deben aprobarse en OpenWebUI desde la cuenta de administrador.

Nota

Información detallada sobre las características del trabajo con el panel de control de Ollama con Open WebUI se puede encontrar en el artículo Chatbot de IA en su propio servidor.

Nota

Para un rendimiento óptimo, se recomienda utilizar una GPU con más de los 48 GB de memoria de video requeridos como mínimo. Esto asegura margen para procesar contextos más grandes y solicitudes paralelas. Información detallada sobre la configuración principal de Ollama y Open WebUI se puede encontrar en la documentación de los desarrolladores de Ollama y en la documentación de los desarrolladores de Open WebUI.

Pedido de un servidor con DeepSeek-R1:70B mediante API¶

Para instalar este software utilizando la API, siga estas instrucciones.