Gemma-3-27B¶
Այս հոդվածում
Տեղեկատվություն
Gemma-3-27B-ը հզոր լեզվական մոդել է, որը պահանջում է զգալի հաշվողական ռեսուրսներ տեղական տեղակայման համար Ollama հարթակի միջոցով։ Այս մոդելն ունի բարձր ապարատային պահանջներ, հատկապես GPU հիշողության ծավալի առումով։ Տեղակայումը հիմնված է Ubuntu 22.04-ի վրա՝ օգտագործելով ժամանակակից NVIDIA գրաֆիկական արագացուցիչներ։ Open Web UI-ի հետ ինտեգրումը ապահովում է հարմարավետ ինտերֆեյս մոդելի հետ փոխազդելու համար՝ պահպանելով տվյալների և հարցումների մշակման վրա ամբողջական վերահսկողություն։
Gemma-3-27B-ի հիմնական հնարավորությունները¶
- Բարձր արդյունավետության ճարտարապետություն. Մոդելն ունի 27 միլիարդ պարամետր և օպտիմալացված է բարդ խնդիրները ժամանակակից տեխնոլոգիաների միջոցով բարձր ճշգրտությամբ մշակելու համար.
- Ինտեգրում Open Web UI-ի հետ. Տրամադրում է ժամանակակից վեբ ինտերֆեյս մոդելի հետ հարմարավետ փոխազդելու համար 8080 պորտի միջոցով՝ ապահովելով տվյալների և հարցումների մշակման վրա ամբողջական վերահսկողություն.
- Մասշտաբայնություն. Տեղադրում է բազմաքարտ կոնֆիգուրացիաներ և բեռի բաշխումը մի քանի GPU-ների միջև օպտիմալ արդյունավետության համար.
- Անվտանգություն և վերահսկողություն. Տեղական տեղակայումը ապահովում է տվյալների գաղտնիությունը, մինչդեռ OLLAMA_HOST և OLLAMA_ORIGINS կարգավորումները երաշխավորում են ցանցային անվտանգությունը.
- Արդյունավետություն. Օգտագործում է LLAMA_FLASH_ATTENTION տեխնոլոգիան հարցումների մշակումը արագացնելու և մոդելի աշխատանքը օպտիմալացնելու համար.
-
Հուսալիություն. Կոնտեյներների և ծառայությունների ավտոմատ վերագործարկման ինտեգրված համակարգը ապահովում է կայուն աշխատանք։
-
Օգտագործման օրինակներ.
- Հաճախորդների աջակցություն. Օգտատերերի հարցերին պատասխանների ավտոմատացում.
- Կրթություն. Կրթական նյութերի ստեղծում, խնդիրների լուծման մեջ օգնություն.
- Մարքեթինգ. Վաճառքի տեքստերի գեներացում, կարծիքների վերլուծություն.
- Ծրագրային ապահովման մշակում. Կոդի ստեղծում և փաստաթղթավորում։
Տեղակայման հնարավորություններ¶
| ID | Ծրագրային ապահովման անվանում | Համատեղելի ՕՀ | VM | BM | VGPU | GPU | Նվազագույն CPU (միջուկներ) | Նվազագույն RAM (ԳԲ) | Նվազագույն HDD/SSD (ԳԲ) | Սեփական դոմեն | Ակտիվ |
|---|---|---|---|---|---|---|---|---|---|---|---|
| 250 | Gemma-3-27b | Ubuntu 22.04 | - | - | + | + | 4 | 32 | - | Ոչ | ՊԱՏՎԻՐԵԼ |
- Ինստալյացիայի ժամանակը. 15-30 րոպե՝ միասին օպերացիոն համակարգի հետ.
- Ollama սերվերը բեռնում և գործարկում է LLM հիշողության մեջ.
- Open WebUI-ն տեղակայված է որպես վեբ հավելված, որը միացված է Ollama սերվերին.
- Օգտատերերը փոխազդում են LLM-ի հետ Open WebUI վեբ ինտերֆեյսի միջոցով՝ ուղարկելով հարցումներ և ստանալով պատասխաններ.
- Բոլոր հաշվարկները և տվյալների մշակումը տեղի են ունենում տեղական սերվերի վրա։ Ադմինիստրատորները կարող են կարգավորել LLM-ը կոնկրետ խնդիրների համար՝ օգտագործելով OpenWebUI գործիքները։
Համակարգի պահանջներ և տեխնիկական բնութագրեր¶
-
Գրաֆիկական արագացուցիչ CUDA աջակցությամբ (ընտրություններից մեկը, կարող է լավ լինել).
- 2x NVIDIA A4000 (16/24 GB վիդեո հիշողություն յուրաքանչյուրը)
- 2x NVIDIA A5000 (24 GB վիդեո հիշողություն յուրաքանչյուրը)
- 1x NVIDIA A6000 (48 GB վիդեո հիշողություն)
- 1x NVIDIA 5090 (32 GB վիդեո հիշողություն)
-
Դիսկային տարածք. SSD բավարար չափսով համակարգի և մոդելի համար.
- Ծրագրային ապահովում. NVIDIA դրայվերներ և CUDA.
- Վիդեո հիշողության սպառում. 28 GB 2K տոկենային համատեքստով.
- Համակարգի մոնիտորինգ. Դրայվերների և կոնտեյներների ավտոմատ ստուգումներ։
Սկսել Gemma-3-27B տեղակայելուց հետո¶
Վճարումից հետո գրանցված հասցեին կուղարկվի էլ. փոստ, որը կուղեկցվի սերվերի պատրաստ լինելու մասին։ Այն կներառի VPS IP հասցեն, ինչպես նաև սերվերին մուտք գործելու համար օգտատերի անունը և գաղտնաբառը, ինչպես նաև OpenWebUI վահանակին մուտք գործելու հղում։ Մեր ընկերության հաճախորդները կառավարում են սարքավորումները սերվերի կառավարման վահանակում և API-ում — Invapi։
-
Մուտք գործելու տվյալներ սերվերի օպերացիոն համակարգ (օրինակ՝ SSH-ի միջոցով) կուղարկվեն ձեզ ստացված էլ. փոստով։
-
Հղում Ollama կառավարման վահանակին մուտք գործելու համար Open WebUI վեբ ինտերֆեյսով. webpanel թեգում Configuration >> Tags Invapi կառավարման վահանակում։ Ճշգրիտ հղումը
https://gemma<Server_ID_from_Invapi>.hostkey.inձևաչափով ուղարկվում է էլ. փոստով, երբ սերվերը արձակվում է։
Թեգի հղումը սեղմելուց հետո webpanel, կբացվի Get started with Open WebUI մուտքի պատուհան, որտեղ անհրաժեշտ է ստեղծել ադմինիստրատորի անուն, էլ. փոստ և գաղտնաբառ ձեր չատբոտի համար, այնուհետև սեղմել Create Admin Account կոճակը.

Զգուշացում
Առաջին օգտատերի գրանցումից հետո համակարգը ավտոմատ կերպով նշանակում է նրան ադմինիստրատորի դեր։ Անվտանգությունն ու գրանցման գործընթացի վերահսկողությունն ապահովելու համար բոլոր հաջորդ գրանցման հարցումները պետք է հաստատվեն OpenWebUI-ում ադմինիստրատորի հաշվից։
Նշում
Մանրամասն տեղեկատվություն Ollama կառավարման վահանակի հետ աշխատելու առանձնահատկությունների մասին Open WebUI-ով կարելի է գտնել AI Chatbot on Your Own Server հոդվածում։
Նշում
Օպտիմալ արդյունավետության համար խորհուրդ է տրվում օգտագործել GPU, որն ունի ավելի շատ, քան նվազագույն պահանջվող 16 GB վիդեո հիշողություն։ Սա ապահովում է բուֆեր մեծ համատեքստերի և զուգահեռ հարցումների մշակման համար։ Մանրամասն տեղեկատվություն Ollama-ի հիմնական կարգավորումների և Open WebUI-ի մասին կարելի է գտնել Ollama developers' documentation և Open WebUI developers' documentation։