Ga naar inhoud

Phi-4-14b

In dit artikel

Informatie

Phi4-14b is een modern taalmodel dat is aangepast voor lokaal gebruik via het Ollama-platform. Deze oplossing combineert de prestaties van het Phi-4-model met het gemak van het gebruik van Open Web UI. Het systeem wordt geïmplementeerd op Ubuntu 22.04 en vereist een moderne grafische accelerator voor efficiënte werking. De combinatie van Ollama en Open Web UI creëert een volwaardige lokale oplossing voor het werken met kunstmatige intelligentie, met volledige controle over gegevens en het verwerkingsproces van verzoeken.

Belangrijkste functies van Phi-4-14b

  • Krachtige basisarchitectuur: het model heeft 14 miljard parameters en een contextvenster van 16.000 tokens, waardoor het lange teksten en complexe taken met hoge nauwkeurigheid kan verwerken;

  • Handige Open Web UI-interface: biedt een moderne webinterface voor interactie met het model, inclusief chatgeschiedenis, parameterinstellingen en beheer van verschillende modellen in één interface;

  • Geavanceerde RAG-mogelijkheden: ingebouwde ondersteuning voor het doorzoeken van documenten in verschillende formaten (PDF, PPT, tekstbestanden) en web scraping, waardoor het model kan werken met actuele informatie en gebruikersgegevens;

  • Multitasking: het model behandelt efficiënt verschillende taken, waaronder dialoogbeheer, het beantwoorden van vragen, gegevensanalyse, tekstgeneratie en basisprogrammering;

  • Veiligheid en nauwkeurigheid: het model is onderworpen aan meerstaps training met inachtneming van gebruikersvoorkeuren onder deskundig toezicht, wat zorgt voor hoge nauwkeurigheid van antwoorden, naleving van ethische normen en het volgen van gebruikersinstructies;

  • Openheid en flexibiliteit: dankzij de open-source code van Ollama kan het systeem worden geconfigureerd en aangepast aan specifieke behoeften, inclusief integratie met andere tools en diensten;

  • Ondersteuning voor verschillende gegevenstypen: het model kan werken met tekstgegevens, code, gestructureerde en semi-gestructureerde gegevens, wat de toepasbaarheid in verschillende sectoren vergroot.

  • Gebruiksvoorbeelden:

    • Klantenservice: automatisering van antwoorden op gebruikersvragen;

    • Onderwijs: het maken van educatief materiaal, hulp bij het oplossen van taken;

    • Marketing: genereren van reclameteksten, analyseren van recensies;

    • Softwareontwikkeling: het maken en documenteren van code.

Implementatiefuncties

ID Softwarenaam Compatibel OS VM BM VGPU GPU Min CPU (Kernen) Min RAM (GB) Min HDD/SSD (GB) Aangepast Domein Actief
256 Phi-4-14b Ubuntu 22.04 - - + + 4 16 - Nee BESTELLEN
  • De installatietijd is 15-30 minuten, inclusief het besturingssysteem;

  • De Ollama-server laadt en voert de LLM uit in het geheugen;

  • Open WebUI wordt geïmplementeerd als een webapplicatie die is verbonden met de Ollama-server;

  • Gebruikers communiceren met de LLM via de webinterface van Open WebUI, waarbij ze verzoeken verzenden en antwoorden ontvangen;

  • Alle berekeningen en gegevensverwerking vinden lokaal op de server plaats. Beheerders kunnen de LLM configureren voor specifieke taken met behulp van OpenWebUI-tools.

Systeemvereisten en technische kenmerken

  • Grafische accelerator: NVIDIA A4000 (of krachtiger) of een AMD-equivalent met minimaal 16 GB videogeheugen;

  • Schijfruimte: voldoende voor het installeren van het systeem, stuurprogramma's en het model;

  • Stuurprogramma's: NVIDIA-stuurprogramma's en CUDA voor correcte GPU-werking;

  • Videogeheugengebruik: 12 GB bij een context van 2K tokens;

  • Automatische herstart: automatische containerherstart is geconfigureerd bij storingen;

  • GPU-ondersteuning: volledige integratie met NVIDIA CUDA voor maximale prestaties.

Aan de slag na implementatie van Phi-4-14b

Na betaling wordt er een bestelbevestiging verzonden naar het e-mailadres dat tijdens de registratie is opgegeven, waarin staat dat de server klaar is voor gebruik. Hierin staat het VPS-IP-adres, evenals de inloggegevens en het wachtwoord voor verbinding met de server en een link om toegang te krijgen tot het OpenWebUI-paneel. Klanten van ons bedrijf beheren apparatuur in het serverbeheer- en API-besturingspaneelInvapi.

  • Inloggegevens voor toegang tot het besturingssysteem van de server (bijv. via SSH) worden naar u verzonden in de ontvangen e-mail.

  • Link voor toegang tot het Ollama-beheerpaneel met Open WebUI-webinterface: in de tag webpanel in het tabblad Configuration >> Tags van het Invapi-besturingspaneel. De exacte link in het formaat https://phi<Server_ID_from_Invapi>.hostkey.in wordt verzonden in de e-mail bij levering van de server.

Na het klikken op de link vanuit de tag webpanel, opent er een Get started with Open WebUI-inlogvenster, waar u een admin-accountnaam, e-mailadres en wachtwoord voor uw chatbot moet maken en vervolgens op de knop Create Admin Account klikt:

Let op

Na het registreren van de eerste gebruiker, wijst het systeem deze automatisch een beheerdersrol toe. Om veiligheid en controle over het registratieproces te waarborgen, moeten alle volgende registratieverzoeken worden goedgekeurd in OpenWebUI vanuit het beheerdersaccount.

Opmerking

Een gedetailleerde beschrijving van de functies voor het werken met het Ollama-beheerpaneel met Open WebUI is te vinden in het artikel AI Chatbot op uw eigen server

Opmerking

Het wordt aanbevolen om een GPU te gebruiken met meer dan de minimale vereiste 16 GB videogeheugen voor optimale werking, wat ruimte biedt voor het verwerken van grote contexten en parallelle verzoeken. Gedetailleerde informatie over de belangrijkste instellingen van Ollama en Open WebUI is te vinden in de documentatie van de Ollama-ontwikkelaars en in de documentatie van de Open WebUI-ontwikkelaars.

Een server met Phi-4-14b bestellen via de API

question_mark
Is there anything I can help you with?
question_mark
AI Assistant ×