Ga naar inhoud

Softwarebeheer

In dit artikel

Mijn kernel en drivers worden niet bijgewerkt/geïnstalleerd op Ubuntu

Het probleem waarbij een nieuwe kernel of drivers (kernelmodules) niet worden geïnstalleerd, kan optreden doordat de /boot-partitie vol is tijdens gelijktijdige systeemkernel-updates, waardoor het bouwen van nieuwe initiële RAM-schijven (initrd) wordt voorkomen. Om dit te controleren, voer het volgende commando uit:

sudo apt --fix-broken install

Als u fouten in de uitvoer ziet, controleer dan het vulniveau van de /boot-partitie. Kijk hiervoor naar de uitvoer van het commando df -h /boot

/dev/sda2       739M  287M  398M  42% /boot   

Voor succesvolle herbouws van initrd moet het getal vóór het percentage vulniveau van de /boot-partitie meer dan 200M zijn. Als er geen vrije ruimte is, voer dan de volgende stappen uit:

  1. Maak een back-up van de partitie zodat u bestanden snel kunt herstellen als u per ongeluk noodzakelijke bestanden verwijdert:

    sudo rsync -av /boot/ /boot.old/
    
  2. Bekijk de inhoud van de /boot-partitie en zoek alle initrd-images:

    ls /boot | grep 'initrd.img-'
    

    U zou uitvoer moeten krijgen die er ongeveer als volgt uitziet:

    initrd.img
    initrd.img-6.8.0-57-generic
    initrd.img-6.8.0-58-generic
    initrd.img-6.8.0-59-generic
    initrd.img-6.8.0-60-generic
    initrd.img-initrd.img
    initrd.img-initrd.img.old
    initrd.img.old  
    
  3. Verwijder extra initrd-images, HET LAATSTE TWEE BEWAAREND. In ons geval moeten we initrd.img-6.8.0-57-generic en initrd.img-6.8.0-58-generic verwijderen.

    Let op

    De volgende commando's kunnen leiden tot een storing van uw besturingssysteem, dus let op de versies van de verwijderde bestanden. Er moeten bestanden zijn voor de laatste en de op een na laatste kernelversies in de /boot-partitie! U kunt controleren welke kernel u momenteel gebruikt met het commando uname -a. Als er iets misgaat, kunt u de inhoud van de /boot-partitie herstellen vanuit de back-up die in stap één is gemaakt met het commando sudo rsync -av /boot.old/ /boot/.

    Doe dit met het commando:

    rm -f /boot/initrd.img-6.8.0-57-generic
    

    Herhaal dit voor elk bestand.

    Doe hetzelfde met de bestanden vmlinuz en System.map (optioneel):

    rm -f /boot/vmlinuz-6.8.0-57-generic 
    rm -f /boot/System.map-6.8.0-57-generic
    
  4. Maak het systeem schoon van pakketten gerelateerd aan oude kernels en voer post-installatie en het bouwen van drivers en kernelmodules uit met de commando's:

    sudo apt autoremove
    sudo apt --fix-broken install
    
  5. Herstart het besturingssysteem:

    reboot
    

Ik krijg een foutmelding met Docker Compose

Als u een foutmelding krijgt zoals docker: 'compose' is not a docker command of docker-compose: command not found bij het uitvoeren van docker compose, kan dit betekenen dat uw besturingssysteemversie oud is, waarbij Docker Compose niet als plug-in is geïnstalleerd of niet aan PATH is toegevoegd. Volg deze stappen om dit probleem op te lossen:

  1. Installeer Docker Compose (indien niet geïnstalleerd):

    mkdir -p ~/.docker/cli-plugins/
    curl -SL https://github.com/docker/compose/releases/latest/download/docker-compose-linux-x86_64 -o ~/.docker/cli-plugins/docker-compose
    chmod +x ~/.docker/cli-plugins/docker-compose
    

    Vervang latest indien nodig door de huidige versie uit de officiële repository.

  2. Controleer de installatie:

    docker-compose --version
    

    Als het commando succesvol wordt uitgevoerd, is Docker Compose geïnstalleerd.

  3. Als het commando nog steeds niet wordt gevonden, zorg er dan voor dat ~/.docker/cli-plugins/ is toegevoegd aan de omgevingsvariabele PATH. Voeg dit toe aan ~/.bashrc of ~/.zshrc:

    export PATH=$PATH:~/.docker/cli-plugins/
    

    Voer vervolgens uit:

    source ~/.bashrc  # of source ~/.zshrc
    
  4. Controleer de installatie opnieuw:

    docker-compose --version
    

Meertalige neurale modellen zoals DeepSeek R1 reageren in het Chinees in plaats van Engels

De meeste meertalige modellen, zoals DeepSeek, kunnen af en toe overschakelen naar de primaire trainingstaal (bijvoorbeeld Chinees), zelfs als het verzoek in het Engels is gedaan. Dit komt door modeldistillatie, compressie of de aanwezigheid van antwoorden voornamelijk in één hoofdtalen.

Om dit gedrag te minimaliseren, wordt aanbevolen om de antwoordtaal expliciet op te geven door "Respond only in English" toe te voegen aan het einde van de promptquery en deze regel op te nemen in de systeemprompt. Het is ook raadzaam om modellen zoals Qwen3 of Gemma3 te gebruiken, die een grotere stabiliteit tonen in versies met minder parameters in vergelijking met DeepSeek.

Daarnaast kunt u handmatig controleren op antwoorden in het Engels met behulp van tools zoals OpenWebUI of op het backend van uw chat als u via een API werkt.

Neuraal model in OpenWebUI of Ollama reageert langzaam

Als het model lang nodig heeft om te reageren, kan dit te wijten zijn aan de grootte ervan en de capaciteit van uw server.

Zorg er allereerst voor dat uw model volledig in het videogeheugen van de GPU past. Het model qwen3-next:80b is bijvoorbeeld 67 GB wanneer gecomprimeerd (q4) en vereist 80–90 GB videogeheugen wanneer volledig uitgepakt. Als uw GPU een NVIDIA A5000 of RTX 4090 is met 24 GB videogeheugen, zal Ollama delen van de modellagen offloaden naar de CPU van de server, wat leidt tot overbelasting van de VM, vermindering van core-toewijzing en lange vertragingen in de reactie.

Om met zo'n model te werken, zijn krachtigere GPUs nodig, zoals de Nvidia H100 met 80 GB videogeheugen of een combinatie van vier RTX 4090's. RAM is alleen belangrijk voor RAG-taken (werken met kennisbases en geladen bestanden) en vereist doorgaans minimaal 32 GB.

U kunt de grootte van het model in het videogeheugen schatten door de grootte te vermenigvuldigen met 2 als het model is gecomprimeerd naar q4, of met 1,5 als het model is gecomprimeerd als q8. Voeg voor elke extra 1000 tokens in een contextvenster boven de 8000 1 GB vereist videogeheugen toe.

Om de belasting van uw GPU te controleren, logt u in op de server via SSH en voert u ollama ps uit in de commandoregel:

[ root ]$ ollama ps 
NAME                                  ID              SIZE      PROCESSOR    UNTIL
yxchia/multilingual-e5-base:latest    f5248cae7e12    1.1 GB    100% GPU     14 minutes from now
qwen3:14b                             bdbd181c33f2    14 GB     100% GPU     14 minutes from now

De uitvoer toont hoeveel ruimte uw model inneemt en of het volledig in de GPU past.

Opmerking

Voor GPUs met 24 GB videogeheugen worden modellen groter dan 14B of gecomprimeerd verder dan q8 niet aanbevolen. Hoe groter het aantal parameters (volume) van het model en de grootte van het contextvenster, hoe langer het reactieproces zal zijn.

Informatie

Rekenprestaties voor 14B-modellen op Nvidia A5000:

  • Koude start duurt ongeveer 30-40 seconden voordat er een reactie komt.
  • Reactietijd is 10–15 seconden (zonder redeneren).
  • Reactietijd is 20-30 seconden (met redeneren).

Als RAG (Retrieval-Augmented Generation) of MCP wordt gebruikt, neemt de reactietijd met 5–10 seconden toe (voor databasezoekopdrachten en toolverzoeken).

De snelheid van token-generatie is ~40–45 tokens per seconde. U kunt dit verifiëren door te klikken op het pictogram onderaan de chatreactieregel in OpenWebUI en de parameter response_token/s te controleren.

Hoe Docker volledig te verwijderen van een geïnstalleerd Ubuntu-besturingssysteem

Onze Ubuntu-besturingssysteemimages worden geleverd met vooraf geïnstalleerde Docker voor uw gemak. Als u het niet nodig heeft of een andere versie wilt installeren, gebruikt u de volgende commando's:

sudo apt remove docker-ce docker-ce-cli containerd.io docker-buildx-plugin docker-compose-plugin
sudo apt autoremove
sudo rm -rf /var/lib/docker
sudo rm -rf /var/lib/containerd

Zorg ervoor dat Docker is verwijderd door het commando docker --version uit te voeren.

question_mark
Is there anything I can help you with?
question_mark
AI Assistant ×