Անցնել պարունակությանը

Gemma-3-27B

Այս հոդվածում

Տեղեկատվություն

Gemma-3-27B-ը հզոր լեզվական մոդել է, որը պահանջում է զգալի հաշվողական ռեսուրսներ տեղական տեղակայման համար Ollama հարթակի միջոցով։ Այս մոդելն ունի բարձր ապարատային պահանջներ, հատկապես GPU հիշողության ծավալի առումով։ Տեղակայումը հիմնված է Ubuntu 22.04-ի վրա՝ օգտագործելով ժամանակակից NVIDIA գրաֆիկական արագացուցիչներ։ Open Web UI-ի հետ ինտեգրումը ապահովում է հարմարավետ ինտերֆեյս մոդելի հետ փոխազդելու համար՝ պահպանելով տվյալների և հարցումների մշակման վրա ամբողջական վերահսկողություն։

Gemma-3-27B-ի հիմնական հնարավորությունները

  • Բարձր արդյունավետության ճարտարապետություն. Մոդելն ունի 27 միլիարդ պարամետր և օպտիմալացված է բարդ խնդիրները ժամանակակից տեխնոլոգիաների միջոցով բարձր ճշգրտությամբ մշակելու համար.
  • Ինտեգրում Open Web UI-ի հետ. Տրամադրում է ժամանակակից վեբ ինտերֆեյս մոդելի հետ հարմարավետ փոխազդելու համար 8080 պորտի միջոցով՝ ապահովելով տվյալների և հարցումների մշակման վրա ամբողջական վերահսկողություն.
  • Մասշտաբայնություն. Տեղադրում է բազմաքարտ կոնֆիգուրացիաներ և բեռի բաշխումը մի քանի GPU-ների միջև օպտիմալ արդյունավետության համար.
  • Անվտանգություն և վերահսկողություն. Տեղական տեղակայումը ապահովում է տվյալների գաղտնիությունը, մինչդեռ OLLAMA_HOST և OLLAMA_ORIGINS կարգավորումները երաշխավորում են ցանցային անվտանգությունը.
  • Արդյունավետություն. Օգտագործում է LLAMA_FLASH_ATTENTION տեխնոլոգիան հարցումների մշակումը արագացնելու և մոդելի աշխատանքը օպտիմալացնելու համար.
  • Հուսալիություն. Կոնտեյներների և ծառայությունների ավտոմատ վերագործարկման ինտեգրված համակարգը ապահովում է կայուն աշխատանք։

  • Օգտագործման օրինակներ.

    • Հաճախորդների աջակցություն. Օգտատերերի հարցերին պատասխանների ավտոմատացում.
    • Կրթություն. Կրթական նյութերի ստեղծում, խնդիրների լուծման մեջ օգնություն.
    • Մարքեթինգ. Վաճառքի տեքստերի գեներացում, կարծիքների վերլուծություն.
    • Ծրագրային ապահովման մշակում. Կոդի ստեղծում և փաստաթղթավորում։

Տեղակայման հնարավորություններ

ID Ծրագրային ապահովման անվանում Համատեղելի ՕՀ VM BM VGPU GPU Նվազագույն CPU (միջուկներ) Նվազագույն RAM (ԳԲ) Նվազագույն HDD/SSD (ԳԲ) Սեփական դոմեն Ակտիվ
250 Gemma-3-27b Ubuntu 22.04 - - + + 4 32 - Ոչ ՊԱՏՎԻՐԵԼ
  • Ինստալյացիայի ժամանակը. 15-30 րոպե՝ միասին օպերացիոն համակարգի հետ.
  • Ollama սերվերը բեռնում և գործարկում է LLM հիշողության մեջ.
  • Open WebUI-ն տեղակայված է որպես վեբ հավելված, որը միացված է Ollama սերվերին.
  • Օգտատերերը փոխազդում են LLM-ի հետ Open WebUI վեբ ինտերֆեյսի միջոցով՝ ուղարկելով հարցումներ և ստանալով պատասխաններ.
  • Բոլոր հաշվարկները և տվյալների մշակումը տեղի են ունենում տեղական սերվերի վրա։ Ադմինիստրատորները կարող են կարգավորել LLM-ը կոնկրետ խնդիրների համար՝ օգտագործելով OpenWebUI գործիքները։

Համակարգի պահանջներ և տեխնիկական բնութագրեր

  • Գրաֆիկական արագացուցիչ CUDA աջակցությամբ (ընտրություններից մեկը, կարող է լավ լինել).

    • 2x NVIDIA A4000 (16/24 GB վիդեո հիշողություն յուրաքանչյուրը)
    • 2x NVIDIA A5000 (24 GB վիդեո հիշողություն յուրաքանչյուրը)
    • 1x NVIDIA A6000 (48 GB վիդեո հիշողություն)
    • 1x NVIDIA 5090 (32 GB վիդեո հիշողություն)
  • Դիսկային տարածք. SSD բավարար չափսով համակարգի և մոդելի համար.

  • Ծրագրային ապահովում. NVIDIA դրայվերներ և CUDA.
  • Վիդեո հիշողության սպառում. 28 GB 2K տոկենային համատեքստով.
  • Համակարգի մոնիտորինգ. Դրայվերների և կոնտեյներների ավտոմատ ստուգումներ։

Սկսել Gemma-3-27B տեղակայելուց հետո

Վճարումից հետո գրանցված հասցեին կուղարկվի էլ. փոստ, որը կուղեկցվի սերվերի պատրաստ լինելու մասին։ Այն կներառի VPS IP հասցեն, ինչպես նաև սերվերին մուտք գործելու համար օգտատերի անունը և գաղտնաբառը, ինչպես նաև OpenWebUI վահանակին մուտք գործելու հղում։ Մեր ընկերության հաճախորդները կառավարում են սարքավորումները սերվերի կառավարման վահանակում և API-ումInvapi։

  • Մուտք գործելու տվյալներ սերվերի օպերացիոն համակարգ (օրինակ՝ SSH-ի միջոցով) կուղարկվեն ձեզ ստացված էլ. փոստով։

  • Հղում Ollama կառավարման վահանակին մուտք գործելու համար Open WebUI վեբ ինտերֆեյսով. webpanel թեգում Configuration >> Tags Invapi կառավարման վահանակում։ Ճշգրիտ հղումը https://gemma<Server_ID_from_Invapi>.hostkey.in ձևաչափով ուղարկվում է էլ. փոստով, երբ սերվերը արձակվում է։

Թեգի հղումը սեղմելուց հետո webpanel, կբացվի Get started with Open WebUI մուտքի պատուհան, որտեղ անհրաժեշտ է ստեղծել ադմինիստրատորի անուն, էլ. փոստ և գաղտնաբառ ձեր չատբոտի համար, այնուհետև սեղմել Create Admin Account կոճակը.

Զգուշացում

Առաջին օգտատերի գրանցումից հետո համակարգը ավտոմատ կերպով նշանակում է նրան ադմինիստրատորի դեր։ Անվտանգությունն ու գրանցման գործընթացի վերահսկողությունն ապահովելու համար բոլոր հաջորդ գրանցման հարցումները պետք է հաստատվեն OpenWebUI-ում ադմինիստրատորի հաշվից։

Նշում

Մանրամասն տեղեկատվություն Ollama կառավարման վահանակի հետ աշխատելու առանձնահատկությունների մասին Open WebUI-ով կարելի է գտնել AI Chatbot on Your Own Server հոդվածում։

Նշում

Օպտիմալ արդյունավետության համար խորհուրդ է տրվում օգտագործել GPU, որն ունի ավելի շատ, քան նվազագույն պահանջվող 16 GB վիդեո հիշողություն։ Սա ապահովում է բուֆեր մեծ համատեքստերի և զուգահեռ հարցումների մշակման համար։ Մանրամասն տեղեկատվություն Ollama-ի հիմնական կարգավորումների և Open WebUI-ի մասին կարելի է գտնել Ollama developers' documentation և Open WebUI developers' documentation։

Պատվիրել սերվեր Gemma-3-27B-ով API-ի միջոցով

question_mark
Is there anything I can help you with?
question_mark
AI Assistant ×