Ga naar inhoud

Gemma-3-27B

In dit artikel

Informatie

Gemma-3-27B is een krachtig taalmodel dat aanzienlijke rekenkracht vereist voor lokale implementatie via het Ollama-platform. Dit model heeft hoge hardware-eisen, met name wat betreft het volume van het GPU-geheugen. De implementatie is gebaseerd op Ubuntu 22.04 met moderne NVIDIA-graphicsaccelerators. Integratie met Open Web UI biedt een handige interface voor interactie met het model, terwijl volledige controle over gegevens en verwerking van verzoeken wordt behouden.

Belangrijkste functies van Gemma-3-27B

  • Hoogpresterende architectuur: Het model heeft 27 miljard parameters en is geoptimaliseerd voor het afhandelen van complexe taken met hoge nauwkeurigheid met behulp van moderne technologieën;
  • Integratie met Open Web UI: Biedt een moderne webinterface voor handige interactie met het model via poort 8080, waarbij volledige controle over gegevens en verwerking van verzoeken wordt gegarandeerd;
  • Schaalbaarheid: Ondersteunt configuraties met meerdere kaarten en werklastverdeling over meerdere GPUs voor optimale prestaties;
  • Beveiliging en controle: Volledige lokale implementatie zorgt voor vertrouwelijkheid van gegevens, terwijl de instellingen OLLAMA_HOST en OLLAMA_ORIGINS netwerkbeveiliging garanderen;
  • Prestaties: Maakt gebruik van LLAMA_FLASH_ATTENTION-technologie om de verwerking van verzoeken te versnellen en de werking van het model te optimaliseren;
  • Betrouwbaarheid: Een geïntegreerd systeem van automatische herstarts voor containers en diensten zorgt voor stabiele werking.

  • Gebruiksvoorbeelden:

    • Klantenservice: Automatisering van antwoorden op vragen van gebruikers;
    • Onderwijs: Het maken van educatief materiaal, bijstand bij het oplossen van taken;
    • Marketing: Het genereren van reclameteksten, het analyseren van recensies;
    • Softwareontwikkeling: Het maken en documenteren van code.

Implementatiefuncties

ID Softwarenaam Compatibel OS VM BM VGPU GPU Min CPU (Kernen) Min RAM (GB) Min HDD/SSD (GB) Aangepast Domein Actief
250 Gemma-3-27b Ubuntu 22.04 - - + + 4 32 - Nee BESTELLEN
  • Installatietijd: 15-30 minuten samen met het besturingssysteem;
  • De Ollama-server laadt en voert LLM uit in het geheugen;
  • Open WebUI wordt geïmplementeerd als een webapplicatie die is verbonden met de Ollama-server;
  • Gebruikers communiceren met LLM via de Open WebUI-webinterface, waarbij ze verzoeken verzenden en antwoorden ontvangen;
  • Alle berekeningen en gegevensverwerking vinden lokaal op de server plaats. Beheerders kunnen LLM configureren voor specifieke taken met behulp van OpenWebUI-tools.

Systeemvereisten en technische specificaties

  • Grafische accelerator met CUDA-ondersteuning (een van de opties, kan beter zijn):

    • 2x NVIDIA A4000 (16/24 GB videogeheugen elk)
    • 2x NVIDIA A5000 (24 GB videogeheugen elk)
    • 1x NVIDIA A6000 (48 GB videogeheugen)
    • 1x NVIDIA 5090 (32 GB videogeheugen)
  • Schijfruimte: SSD van voldoende grootte voor het systeem en het model;

  • Software: NVIDIA-stuurprogramma's en CUDA;
  • Videogeheugengebruik: 28 GB met een 2K token-context;
  • Systeemmonitoring: Automatische controles van stuurprogramma's en containers.

Aan de slag na implementatie van Gemma-3-27B

Na betaling wordt er een e-mail verzonden naar het geregistreerde adres waarin wordt aangegeven dat de server klaar is voor gebruik. Deze bevat het VPS-IP-adres, evenals inloggegevens en wachtwoord voor toegang tot de server en een link voor toegang tot het OpenWebUI-paneel. Klanten van ons bedrijf beheren apparatuur in het serverbeheerpaneel en APIInvapi.

  • Authenticatiegegevens voor toegang tot het besturingssysteem van de server (bijv. via SSH) worden naar u verzonden in de ontvangen e-mail.

  • Link voor toegang tot het Ollama-beheerpaneel met Open WebUI-webinterface: In de webpanel tag in het tabblad Configuration >> Tags van het Invapi-beheerpaneel. De exacte link in de vorm https://gemma<Server_ID_from_Invapi>.hostkey.in wordt verzonden in de e-mail wanneer de server wordt vrijgegeven.

Na het klikken op de link vanuit de tag webpanel, opent er een Get started with Open WebUI inlogvenster, waar u een beheerdersaccountnaam, e-mailadres en wachtwoord voor uw chatbot moet maken, en vervolgens op de knop Create Admin Account moet drukken:

Let op

Na het registreren van de eerste gebruiker, wijst het systeem deze automatisch een beheerdersrol toe. Om veiligheid en controle over het registratieproces te waarborgen, moeten alle volgende registratieverzoeken worden goedgekeurd in OpenWebUI vanuit het beheerdersaccount.

Opmerking

Gedetailleerde informatie over de functies van het werken met het Ollama-beheerpaneel met Open WebUI is te vinden in het artikel AI Chatbot op uw eigen server.

Opmerking

Voor optimale prestaties wordt aanbevolen om een GPU te gebruiken met meer dan het minimumvereiste van 16 GB videogeheugen. Dit biedt een buffer voor het verwerken van grote contexten en parallelle verzoeken. Gedetailleerde informatie over de belangrijkste instellingen van Ollama en Open WebUI is te vinden in de documentatie van de Ollama-ontwikkelaars en de documentatie van de Open WebUI-ontwikkelaars.

Bestel een server met Gemma-3-27B via API

question_mark
Is there anything I can help you with?
question_mark
AI Assistant ×