Gestión de software¶
En este artículo
- Mi kernel y controladores no se actualizan/instalan en Ubuntu
- Obtengo un error con Docker Compose
- Los modelos neuronales multilingües como DeepSeek R1 responden en chino en lugar de en inglés
- El modelo neuronal en OpenWebUI o Ollama tarda mucho en responder
- Cómo eliminar completamente Docker de un sistema operativo Ubuntu instalado
Mi kernel y controladores no se actualizan/instalan en Ubuntu¶
El problema en el que un nuevo kernel o controladores (módulos del kernel) no se instalan puede ocurrir debido a que la partición /boot está llena durante las actualizaciones simultáneas del kernel del sistema, lo que impide la construcción de nuevos discos RAM iniciales (initrd). Para verificar esto, ejecute el comando:
Si ve errores en la salida, verifique el nivel de llenado de la partición /boot. Para ello, observe la salida del comando df -h /boot
Para reconstrucciones exitosas de initrd, el número antes del porcentaje de llenado de la partición /boot debe ser superior a 200M. Si no hay espacio libre, realice los siguientes pasos:
-
Cree una copia de seguridad de la partición para poder restaurar rápidamente los archivos si elimina accidentalmente algunos necesarios:
-
Observe el contenido de la partición
/booty busque todas las imágenes initrd:Debería obtener una salida similar a esta:
-
Elimine las imágenes initrd adicionales, DEJANDO LAS DOS ÚLTIMAS. En nuestro caso, debemos eliminar
initrd.img-6.8.0-57-genericyinitrd.img-6.8.0-58-generic.Atención
Los siguientes comandos pueden provocar un mal funcionamiento de su sistema operativo, por lo que preste atención a las versiones de los archivos eliminados. ¡Debe haber archivos para las últimas dos versiones del kernel en la partición
/boot! Puede verificar qué kernel está utilizando actualmente con el comandouname -a. Si algo sale mal, puede restaurar el contenido de la partición /boot desde la copia de seguridad realizada en el paso uno con el comandosudo rsync -av /boot.old/ /boot/.Haga esto con el comando:
Repítalo para cada archivo.
Haga lo mismo con los archivos
vmlinuzySystem.map(opcional): -
Limpie el sistema de paquetes relacionados con kernels antiguos y ejecute la postinstalación y la construcción de controladores y módulos del kernel con los comandos:
-
Reinicie el sistema operativo:
Obtengo un error con Docker Compose¶
Si recibe un error como docker: 'compose' is not a docker command o docker-compose: command not found al ejecutar docker compose, puede significar que la versión de su sistema operativo es antigua y Docker Compose no se instaló como un complemento ni se añadió a PATH. Para resolver este problema, siga estos pasos:
-
Instale Docker Compose (si no está instalado):
mkdir -p ~/.docker/cli-plugins/ curl -SL https://github.com/docker/compose/releases/latest/download/docker-compose-linux-x86_64 -o ~/.docker/cli-plugins/docker-compose chmod +x ~/.docker/cli-plugins/docker-composeReemplace
latestpor la versión actual del repositorio oficial si es necesario. -
Verifique la instalación:
Si el comando se ejecuta correctamente, Docker Compose está instalado.
-
Si el comando aún no se encuentra, asegúrese de que
~/.docker/cli-plugins/se haya añadido a la variable de entornoPATH. Añada esto a~/.bashrco~/.zshrc:Luego ejecute:
-
Verifique la instalación nuevamente:
Los modelos neuronales multilingües como DeepSeek R1 responden en chino en lugar de en inglés¶
La mayoría de los modelos multilingües, como DeepSeek, pueden cambiar ocasionalmente al idioma principal de entrenamiento (chino, por ejemplo) incluso si la solicitud se realizó en inglés. Esto ocurre debido a la destilación del modelo, la compresión o la presencia de respuestas principalmente en un idioma principal.
Para minimizar este comportamiento, se recomienda especificar explícitamente el idioma de respuesta añadiendo "Respond only in English" al final de la consulta del prompt e incluyendo esta línea en el prompt del sistema. También es aconsejable utilizar modelos como Qwen3 o Gemma3, que demuestran mayor estabilidad en versiones con menos parámetros en comparación con DeepSeek.
Además, puede verificar manualmente las respuestas en inglés utilizando herramientas como OpenWebUI o en el backend de su chat si está trabajando a través de una API.
El modelo neuronal en OpenWebUI o Ollama tarda mucho en responder¶
Si el modelo tarda mucho en responder, puede deberse a su tamaño y a la capacidad de su servidor.
En primer lugar, asegúrese de que su modelo quepa completamente en la memoria de vídeo de la GPU. Por ejemplo, el modelo qwen3-next:80b ocupa 67 GB cuando está comprimido (q4) y requiere 80–90 GB de memoria de vídeo cuando está completamente descomprimido. Si su GPU es una NVIDIA A5000 o RTX 4090 con 24 GB de memoria de vídeo, Ollama descargará partes de las capas del modelo al CPU del servidor, lo que provocará una sobrecarga de la VM, una reducción en la asignación de núcleos y largos retrasos en las respuestas.
Para trabajar con un modelo de este tipo, se necesitan GPUs más potentes, como la Nvidia H100 con 80 GB de memoria de vídeo o una combinación de cuatro RTX 4090. La RAM es importante solo para tareas de RAG (trabajo con bases de conocimientos y archivos cargados) y normalmente requiere al menos 32 GB.
Puede estimar el tamaño del modelo en la memoria de vídeo multiplicando su tamaño por 2 si el modelo está comprimido a q4, o por 1.5 si el modelo está comprimido como q8. Por cada 1000 tokens adicionales en una ventana de contexto superior a 8000, añada 1 GB de memoria de vídeo requerida.
Para verificar la carga de su GPU, inicie sesión en el servidor mediante SSH y ejecute ollama ps en la línea de comandos:
[ root ]$ ollama ps
NAME ID SIZE PROCESSOR UNTIL
yxchia/multilingual-e5-base:latest f5248cae7e12 1.1 GB 100% GPU 14 minutes from now
qwen3:14b bdbd181c33f2 14 GB 100% GPU 14 minutes from now
La salida mostrará cuánto espacio ocupa su modelo y si cabe completamente en la GPU.
Nota
Para GPUs con 24 GB de memoria de vídeo, no se recomiendan modelos superiores a 14B o comprimidos más allá de q8. Cuanto mayor sea el recuento de parámetros (volumen) del modelo y el tamaño de la ventana de contexto, más largo será el proceso de respuesta.
Información
Rendimiento computacional para modelos de 14B en Nvidia A5000:
- El arranque en frío tarda unos 30-40 segundos antes de responder.
- El tiempo de respuesta es de 10–15 segundos (sin razonamiento).
- El tiempo de respuesta es de 20-30 segundos (con razonamiento).
Si se utiliza RAG (Generación Aumentada por Recuperación) o MCP, el tiempo de respuesta aumenta en 5–10 segundos (para la búsqueda en la base de datos y las solicitudes de herramientas).
La velocidad de generación de tokens es de ~40–45 tokens por segundo. Puede verificar esto haciendo clic en el icono en la parte inferior de la línea de respuesta del chat en OpenWebUI y comprobando el parámetro response_token/s.
Cómo eliminar completamente Docker de un sistema operativo Ubuntu instalado¶
Nuestras imágenes de sistema operativo Ubuntu vienen con Docker preinstalado para mayor comodidad. Si no lo necesita o desea instalar una versión diferente, utilice los siguientes comandos:
sudo apt remove docker-ce docker-ce-cli containerd.io docker-buildx-plugin docker-compose-plugin
sudo apt autoremove
sudo rm -rf /var/lib/docker
sudo rm -rf /var/lib/containerd
Asegúrese de que Docker se ha eliminado ejecutando el comando docker --version.
Parte del contenido de esta página fue creado o traducido utilizando IA.