Preguntas sobre gestión de software¶

En este artículo

Tengo problemas con el software instalado en mi servidor; ¿a quién debo contactar?

Mi kernel y drivers no se actualizan/instalan en Ubuntu

Me da un error con Docker Compose

Los modelos neuronales multilingües como DeepSeek R1 responden en chino en lugar de inglés

El modelo neuronal en OpenWebUI o Ollama tarda mucho tiempo en responder

Cómo eliminar completamente Docker de un OS Ubuntu instalado

¿Está permitida la instalación de servidores NZBGet/Torrent/Plex?

Tengo problemas con el software instalado en mi servidor; ¿a quién debo contactar?¶

Nosotros no administramos el servidor tras la entrega ni ningún software instalado en el servidor del cliente, ni proporcionamos consultoría sobre asuntos relacionados. El cliente es responsable de administrar su propio servidor.

Si se requiere asistencia de nuestros administradores de sistemas, estamos disponibles para ayudar bajo paid administration.

Para solicitar administración de pago, envíe una especificación técnica al Sales Department; estimaremos el tiempo requerido para el trabajo y le proporcionaremos un presupuesto.

Mi kernel y drivers no se actualizan/instalan en Ubuntu¶

El problema donde un nuevo kernel o los drivers (módulos del kernel) no se instalan puede ocurrir debido a que la partición /boot está llena durante actualizaciones simultáneas del kernel del sistema, lo que impide la creación de nuevos discos RAM iniciales (initrd). Para comprobar esto, ejecute el comando:

sudo apt --fix-broken install

Si ve errores en la salida, compruebe el nivel de llenado de la partición /boot. Para ello, observe la salida del comando df -h /boot

/dev/sda2       739M  287M  398M  42% /boot

Para que la reconstrucción de initrd sea exitosa, el número antes del porcentaje de llenado de la partición /boot debe ser superior a 200M. Si no hay espacio libre, realice los siguientes pasos:

Cree una copia de seguridad de la partición para poder restaurar archivos rápidamente si borra accidentalmente alguno necesario:
```
sudo rsync -av /boot/ /boot.old/
```

Observe el contenido de la partición /boot y busque todas las imágenes initrd:

ls /boot | grep 'initrd.img-'

Debería obtener una salida similar a esta:

initrd.img
initrd.img-6.8.0-57-generic
initrd.img-6.8.0-58-generic
initrd.img-6.8.0-59-generic
initrd.img-6.8.0-60-generic
initrd.img-initrd.img
initrd.img-initrd.img.old
initrd.img.old

Elimine las imágenes initrd adicionales, DEJANDO LAS ÚLTIMAS DOS. En nuestro caso, necesitamos eliminar initrd.img-6.8.0-57-generic e initrd.img-6.8.0-58-generic.

Atención

Los siguientes comandos pueden provocar un mal funcionamiento de su sistema operativo, así que preste atención a las versiones de los archivos eliminados. ¡Debe haber archivos para las dos últimas versiones del kernel en la partición /boot! Puede comprobar qué kernel está utilizando actualmente con el comando uname -a. Si algo sale mal, puede restaurar el contenido de la partición /boot desde la copia de seguridad realizada en el paso uno con el comando sudo rsync -av /boot.old/ /boot/.

Haga esto con el comando:
```
rm -f /boot/initrd.img-6.8.0-57-generic
```
Repita para cada archivo.

Haga lo mismo con los archivos vmlinuz y System.map (opcional):
```
rm -f /boot/vmlinuz-6.8.0-57-generic 
rm -f /boot/System.map-6.8.0-57-generic
```
Limpie el sistema de paquetes relacionados con kernels antiguos y ejecute la post-instalación y la construcción de drivers y módulos del kernel con los comandos:
```
sudo apt autoremove
sudo apt --fix-broken install
```
Reinicie el OS:
```
reboot
```

Me da un error con Docker Compose¶

Si recibe un error como docker: 'compose' is not a docker command o docker-compose: command not found al ejecutar docker compose, puede significar que la versión de su sistema operativo es antigua y Docker Compose no se instaló como un plugin o no se añadió al PATH. Para resolver este problema, siga estos pasos:

Instale Docker Compose (si no está instalado):

mkdir -p ~/.docker/cli-plugins/
curl -SL https://github.com/docker/compose/releases/latest/download/docker-compose-linux-x86_64 -o ~/.docker/cli-plugins/docker-compose
chmod +x ~/.docker/cli-plugins/docker-compose

Reemplace latest con la versión actual desde el official repository si es necesario.

Compruebe la instalación:
```
docker-compose --version
```
Si el comando se ejecuta correctamente, Docker Compose está instalado.
Si el comando sigue sin encontrarse, asegúrese de que ~/.docker/cli-plugins/ esté añadido a la variable de entorno PATH. Añada esto a su ~/.bashrc o ~/.zshrc:
```
export PATH=$PATH:~/.docker/cli-plugins/
```
Luego ejecute:
```
source ~/.bashrc  # o source ~/.zshrc
```
Compruebe la instalación de nuevo:
```
docker-compose --version
```

Los modelos neuronales multilingües como DeepSeek R1 responden en chino en lugar de inglés¶

La mayoría de los modelos multilingües, como DeepSeek, pueden cambiar ocasionalmente al idioma principal de entrenamiento (chino, por ejemplo) incluso si la solicitud se realizó en inglés. Esto ocurre debido a la destilación del modelo, la compresión o la presencia de respuestas principalmente en un idioma principal.

Para minimizar este comportamiento, se recomienda especificar explícitamente el idioma de respuesta añadiendo "Respond only in English" al final de la consulta (prompt) e incluyendo esta línea en el system prompt. También es aconsejable utilizar modelos como Qwen3 o Gemma3, que demuestran una mayor estabilidad en versiones con menos parámetros en comparación con DeepSeek.

Además, puede comprobar manualmente las respuestas en inglés utilizando herramientas como OpenWebUI o en el backend de su chat si está trabajando a través de una API.

El modelo neuronal en OpenWebUI o Ollama tarda mucho tiempo en responder¶

Si el modelo tarda mucho tiempo en responder, puede deberse a su tamaño y a la capacidad de su servidor.

En primer lugar, asegúrese de que su modelo quepa por completo en la memoria de video (VRAM) de la GPU. Por ejemplo, el modelo qwen3-next:80b ocupa 67 GB cuando está comprimido (q4) y requiere entre 80 y 90 GB de memoria de video cuando está totalmente descomprimido. Si su GPU es una NVIDIA A5000 o RTX 4090 con 24 GB de memoria de video, Ollama transferirá partes de las capas del modelo a la CPU del servidor, lo que causará una sobrecarga de la VM, una reducción en la asignación de núcleos y largos retrasos en la respuesta.

Para trabajar con un modelo así, se necesitan GPUs más potentes, como una Nvidia H100 con 80 GB de memoria de video o una combinación de cuatro RTX 4090s. La RAM es importante solo para tareas RAG (trabajar con bases de conocimiento y archivos cargados) y normalmente requiere al menos 32 GB.

Puede estimar el tamaño del modelo en la memoria de video multiplicando su tamaño por 2 si el modelo está comprimido a q4, o por 1.5 si el modelo está comprimido como q8. Por cada 1000 tokens adicionales en una ventana de contexto superior a 8000, añada 1 GB de memoria de video requerida.

Para comprobar la carga de su GPU, inicie sesión en el servidor vía SSH y ejecute ollama ps en la línea de comandos:

[ root ]$ ollama ps 
NAME                                  ID              SIZE      PROCESSOR    UNTIL
yxchia/multilingual-e5-base:latest    f5248cae7e12    1.1 GB    100% GPU     14 minutes from now
qwen3:14b                             bdbd181c33f2    14 GB     100% GPU     14 minutes from now

La salida mostrará cuánto espacio ocupa su modelo y si cabe por completo en la GPU.

Nota

Para GPUs con 24 GB de memoria de video, no se recomiendan modelos superiores a 14B o comprimidos más allá de q8. Cuanto mayor sea el número de parámetros (volumen) del modelo y el tamaño de la ventana de contexto, más largo será el proceso de respuesta.

Información

Rendimiento computacional para modelos 14B en Nvidia A5000:

El arranque en frío tarda unos 30-40 segundos antes de una respuesta.
El tiempo de respuesta es de 10–15 segundos (sin razonamiento).
El tiempo de respuesta es de 20-30 segundos (con razonamiento).

Si se utiliza RAG (Generación Aumentada por Recuperación) o MCP, el tiempo de respuesta aumenta entre 5 y 10 segundos (para la búsqueda en bases de datos y solicitudes de herramientas).

La velocidad de generación de tokens es de ~40–45 tokens por segundo. Puede verificar esto haciendo clic en el icono al final de la línea de respuesta del chat en OpenWebUI y comprobando el parámetro response_token/s.

Cómo eliminar completamente Docker de un OS Ubuntu instalado¶

Nuestras imágenes del sistema operativo Ubuntu vienen con Docker preinstalado por conveniencia. Si no lo necesita o desea instalar una versión diferente, utilice los siguientes comandos:

sudo apt remove docker-ce docker-ce-cli containerd.io docker-buildx-plugin docker-compose-plugin
sudo apt autoremove
sudo rm -rf /var/lib/docker
sudo rm -rf /var/lib/containerd

Asegúrese de que Docker se ha eliminado ejecutando el comando docker --version.

¿Está permitida la instalación de servidores NZBGet/Torrent/Plex?¶

No restringimos a los clientes en el uso de nuestro servicio. Al mismo tiempo, HOSTKEY no ignora las reclamaciones de DMCA y propietarios de derechos de autor que se nos envían de acuerdo con la legislación aplicable. Esto incluye tanto el almacenamiento de contenido protegido por derechos de autor en un servidor alquilado como el alojamiento de sitios web que proporcionan acceso a contenido protegido por derechos de autor almacenado en otros lugares.

Atención

Si HOSTKEY recibe cualquier reclamación por infracción, el propietario del servidor debe eliminar el material protegido por derechos de autor. Cada reclamación debe ser resuelta y el objeto de la reclamación debe ser eliminado de nuestra red. El incumplimiento o la ignorancia de estas reclamaciones puede resultar en una suspensión temporal o permanente del servidor.