Llama-3.3-70B¶
Այս հոդվածում
Տեղեկատվություն
Llama-3.3-70B-ը բարձր արդյունավետ լեզվական մոդել է՝ 70 միլիարդ պարամետրով, որը նախատեսված է տեղական տեղակայման համար Ollama-ի միջոցով։ Մոդելը պահանջում է հզոր հաշվարկային ռեսուրսներ՝ առնվազն 53 ԳԲ վիդեո հիշողությամբ (NVIDIA A100/H100 կամ մի քանի սպառողական GPU): Ubuntu 22.04-ի վրա տեղակայումը աջակցում է բաշխված հաշվարկներին և Open Web UI-ի հետ ինտեգրմանը՝ ապահովելով տվյալների ամբողջական վերահսկողություն և արդյունավետության օպտիմալացում։
Llama-3.3-70B-ի հիմնական հնարավորությունները¶
-
Բարձր արդյունավետ ճարտարապետություն. մոդելն ունի 70 միլիարդ պարամետր և օպտիմալացված է բարդ խնդիրները մշակելու համար՝ աննախադեպ ճշգրտությամբ՝ ժամանակակից բաշխված հաշվարկների տեխնոլոգիաների միջոցով.
-
Ինտեգրում Open Web UI-ի հետ. ժամանակակից վեբ ինտերֆեյս, որը հասանելի է 8080 պորտով, ապահովելով տվյալների, հաշվարկային ռեսուրսների և մշակման գործընթացների ամբողջական վերահսկողություն.
-
Բաշխված հաշվարկներ. բարձր մակարդակի աջակցություն բազմաքարտ կոնֆիգուրացիաների համար՝ մի քանի GPU-ների միջև բեռի ավտոմատ հավասարակշռմամբ.
-
Մասշտաբայնություն. հորիզոնական մասշտաբավորման հնարավորություն՝ ավելացնելով լրացուցիչ GPU-ներ՝ արդյունավետությունը բարձրացնելու համար.
-
Արդյունավետություն. LLAMA_FLASH_ATTENTION տեխնոլոգիայի օգտագործում՝ հաշվարկները օպտիմալացնելու և հարցումների մշակումը արագացնելու համար.
-
Սխալաների նկատմամբ դիմադրողականություն. ավտոմատ վերականգնման համակարգը ապահովում է անընդհատ աշխատանք։
-
Օգտագործման օրինակներ.
-
Գնորդների աջակցություն. օգտատերերի հարցումներին պատասխանների ավտոմատացում.
-
Կրթություն. կրթական նյութերի ստեղծում, խնդիրների լուծման մեջ օգնություն.
-
Մարքեթինգ. գովազդային տեքստերի գեներացում, կարծիքների վերլուծություն.
-
Ծրագրավորում. կոդի ստեղծում և փաստաթղթավորում։
-
Տեղակայման հնարավորություններ¶
| ID | Ծրագրային ապահովման անվանում | Համատեղելի ՕՀ | VM | BM | VGPU | GPU | Նվազագույն CPU (միջուկներ) | Նվազագույն RAM (ԳԲ) | Նվազագույն HDD/SSD (ԳԲ) | Սեփական դոմեն | Ակտիվ |
|---|---|---|---|---|---|---|---|---|---|---|---|
| 253 | Llama-3.3-70B | Ubuntu 22.04 | - | - | + | + | 4 | 64 | - | Ոչ | ՊԱՏՎԻՐԵԼ |
-
Ինստալյացիայի ժամանակը 15-30 րոպե է՝ ներառյալ օպերացիոն համակարգը.
-
Ollama սերվերը բեռնում և գործարկում է LLM-ը հիշողության մեջ.
-
Open WebUI-ն տեղակայված է որպես վեբ հավելված, որը միացված է Ollama սերվերին.
-
Օգտատերերը փոխազդում են LLM-ի հետ Open WebUI վեբ ինտերֆեյսի միջոցով՝ ուղարկելով հարցումներ և ստանալով պատասխաններ.
-
Բաշխված հաշվարկների կոնֆիգուրացիա բազմաքարտ համակարգերի համար.
-
Համակարգի վիճակի մոնիտորինգ, ներառյալ GPU-ի ջերմաստիճանը և արդյունավետությունը.
-
Մի քանի գրաֆիկական արագացուցիչների զուգահեռ աշխատանքի օպտիմալացում.
-
Բոլոր հաշվարկները և տվյալների մշակումը տեղի են ունենում տեղում՝ սերվերի վրա։ Ադմինիստրատորները կարող են կոնֆիգուրացնել LLM-ը կոնկրետ խնդիրների համար OpenWebUI գործիքների միջոցով։
Համակարգի պահանջներ և տեխնիկական բնութագրեր¶
-
Գրաֆիկական արագացուցիչ CUDA աջակցությամբ (մեկը տարբերակներից, կարող է ավելի լավ լինել).
- 1x NVIDIA H100
- 2x NVIDIA A100 (48 ԳԲ վիդեո հիշողություն յուրաքանչյուրը)
- 2x NVIDIA RTX 5090 (32 ԳԲ վիդեո հիշողություն յուրաքանչյուրը)
- 2x NVIDIA A6000 (48 ԳԲ վիդեո հիշողություն յուրաքանչյուրը)
- 3x NVIDIA RTX 4090 (24 ԳԲ վիդեո հիշողություն յուրաքանչյուրը)
- 3x NVIDIA A5000 (24 ԳԲ վիդեո հիշողություն յուրաքանչյուրը)
-
Դիսկային տարածք. SSD բավարար չափսով համակարգի և մոդելի համար.
-
Ծրագրային ապահովում. NVIDIA դրայվերներ և CUDA.
-
Վիդեո հիշողության օգտագործում. 53 ԳԲ 2K տոկենային համատեքստով.
-
Համակարգի մոնիտորինգ. դրայվերների վիճակի, կոնտեյներների և GPU-ի ջերմաստիճանի համապարփակ ստուգում։
Սկսել Llama-3.3-70B-ը տեղակայելուց հետո¶
Վճարումից հետո գրանցված էլ. հասցեին կուղարկվի էլ. նամակ, որը կհայտնի, որ սերվերը պատրաստ է աշխատանքի։ Այն կներառի VPS IP հասցեն, ինչպես նաև սերվերին միանալու համար login-ի և գաղտնաբառի տվյալները, ինչպես նաև OpenWebUI-ին մուտք գործելու հղումը։ Մեր ընկերության հաճախորդները սարքավորումները կառավարում են սերվերի կառավարման վահանակի և API-ի միջոցով — Invapi։
-
Սերվերի օպերացիոն համակարգին մուտքի տվյալներ (օրինակ՝ SSH-ի միջոցով) կուղարկվի ձեզ ստացված էլ. նամակով։
-
Հղում Ollama կառավարման վահանակին Open WebUI վեբ ինտերֆեյսով. webpanel թեգի տակ Configuration >> Tags tab-ում Invapi-ի կառավարման կոնսոլում։ Ճշգրիտ հղումը
https://llama<Server_ID_from_Invapi>.hostkey.inձևաչափով ուղարկվում է էլ. նամակով սերվերի հանձնման ժամանակ։
Սեղմելով webpanel թեգի հղումը, կբացվի Get started with Open WebUI մուտքի պատուհան, որտեղ անհրաժեշտ է ստեղծել Ձեր չատբոտի ադմինիստրատորի անուն, էլ. հասցե և գաղտնաբառ, այնուհետև սեղմել Create Admin Account կոճակը.

Զգուշացում
Առաջին օգտատիրոջ գրանցումից հետո համակարգը ավտոմատ կերպով նշանակում է նրան ադմինիստրատորի դեր։ Անվտանգությունն ու գրանցման գործընթացի վերահսկողությունը ապահովելու համար բոլոր հաջորդ գրանցման հարցումները պետք է հաստատվեն OpenWebUI-ում ադմինիստրատորի հաշվից։
Նշում
Ollama-ի կառավարման վահանակի և Open WebUI-ի հետ աշխատանքի մանրամասն տեղեկատվություն կարելի է գտնել AI Chatbot on Your Own Server հոդվածում։
Նշում
Օպտիմալ արդյունավետության համար խորհուրդ է տրվում օգտագործել GPU-ներ՝ նվազագույն պահանջվող 16 ԳԲ-ից ավելի վիդեո հիշողությամբ։ Սա ապահովում է բուֆեր՝ ավելի մեծ համատեքստերի և զուգահեռ հարցումների մշակման համար։ Ollama-ի հիմնական կարգավորումների և Open WebUI-ի մանրամասն տեղեկատվություն կարելի է գտնել Ollama-ի մշակողների փաստաթղթերում և Open WebUI-ի մշակողների փաստաթղթերում։