Llama-3.3-70B¶

Այս հոդվածում

Llama-3.3-70B-ի հիմնական հնարավորությունները

Տեղակայման հնարավորություններ

Համակարգի պահանջներ և տեխնիկական բնութագրեր

Սկսել Llama-3.3-70B-ը տեղակայելուց հետո

Սերվեր պատվիրել Llama-3.3-70B-ով API-ի միջոցով

Տեղեկատվություն

Llama-3.3-70B-ը բարձր արդյունավետ լեզվական մոդել է՝ 70 միլիարդ պարամետրով, որը նախատեսված է տեղական տեղակայման համար Ollama-ի միջոցով։ Մոդելը պահանջում է հզոր հաշվարկային ռեսուրսներ՝ առնվազն 53 ԳԲ վիդեո հիշողությամբ (NVIDIA A100/H100 կամ մի քանի սպառողական GPU): Ubuntu 22.04-ի վրա տեղակայումը աջակցում է բաշխված հաշվարկներին և Open Web UI-ի հետ ինտեգրմանը՝ ապահովելով տվյալների ամբողջական վերահսկողություն և արդյունավետության օպտիմալացում։

Llama-3.3-70B-ի հիմնական հնարավորությունները¶

Բարձր արդյունավետ ճարտարապետություն. մոդելն ունի 70 միլիարդ պարամետր և օպտիմալացված է բարդ խնդիրները մշակելու համար՝ աննախադեպ ճշգրտությամբ՝ ժամանակակից բաշխված հաշվարկների տեխնոլոգիաների միջոցով.
Ինտեգրում Open Web UI-ի հետ. ժամանակակից վեբ ինտերֆեյս, որը հասանելի է 8080 պորտով, ապահովելով տվյալների, հաշվարկային ռեսուրսների և մշակման գործընթացների ամբողջական վերահսկողություն.
Բաշխված հաշվարկներ. բարձր մակարդակի աջակցություն բազմաքարտ կոնֆիգուրացիաների համար՝ մի քանի GPU-ների միջև բեռի ավտոմատ հավասարակշռմամբ.
Մասշտաբայնություն. հորիզոնական մասշտաբավորման հնարավորություն՝ ավելացնելով լրացուցիչ GPU-ներ՝ արդյունավետությունը բարձրացնելու համար.
Արդյունավետություն. LLAMA_FLASH_ATTENTION տեխնոլոգիայի օգտագործում՝ հաշվարկները օպտիմալացնելու և հարցումների մշակումը արագացնելու համար.
Սխալաների նկատմամբ դիմադրողականություն. ավտոմատ վերականգնման համակարգը ապահովում է անընդհատ աշխատանք։
Օգտագործման օրինակներ.
- Գնորդների աջակցություն. օգտատերերի հարցումներին պատասխանների ավտոմատացում.
- Կրթություն. կրթական նյութերի ստեղծում, խնդիրների լուծման մեջ օգնություն.
- Մարքեթինգ. գովազդային տեքստերի գեներացում, կարծիքների վերլուծություն.
- Ծրագրավորում. կոդի ստեղծում և փաստաթղթավորում։

Տեղակայման հնարավորություններ¶

ID	Ծրագրային ապահովման անվանում	Համատեղելի ՕՀ	VM	BM	VGPU	GPU	Նվազագույն CPU (միջուկներ)	Նվազագույն RAM (ԳԲ)	Նվազագույն HDD/SSD (ԳԲ)	Սեփական դոմեն	Ակտիվ
253	Llama-3.3-70B	Ubuntu 22.04	-	-	+	+	4	64	-	Ոչ	ՊԱՏՎԻՐԵԼ

Ինստալյացիայի ժամանակը 15-30 րոպե է՝ ներառյալ օպերացիոն համակարգը.
Ollama սերվերը բեռնում և գործարկում է LLM-ը հիշողության մեջ.
Open WebUI-ն տեղակայված է որպես վեբ հավելված, որը միացված է Ollama սերվերին.
Օգտատերերը փոխազդում են LLM-ի հետ Open WebUI վեբ ինտերֆեյսի միջոցով՝ ուղարկելով հարցումներ և ստանալով պատասխաններ.
Բաշխված հաշվարկների կոնֆիգուրացիա բազմաքարտ համակարգերի համար.
Համակարգի վիճակի մոնիտորինգ, ներառյալ GPU-ի ջերմաստիճանը և արդյունավետությունը.
Մի քանի գրաֆիկական արագացուցիչների զուգահեռ աշխատանքի օպտիմալացում.
Բոլոր հաշվարկները և տվյալների մշակումը տեղի են ունենում տեղում՝ սերվերի վրա։ Ադմինիստրատորները կարող են կոնֆիգուրացնել LLM-ը կոնկրետ խնդիրների համար OpenWebUI գործիքների միջոցով։

Համակարգի պահանջներ և տեխնիկական բնութագրեր¶

Գրաֆիկական արագացուցիչ CUDA աջակցությամբ (մեկը տարբերակներից, կարող է ավելի լավ լինել).
- 1x NVIDIA H100
- 2x NVIDIA A100 (48 ԳԲ վիդեո հիշողություն յուրաքանչյուրը)
- 2x NVIDIA RTX 5090 (32 ԳԲ վիդեո հիշողություն յուրաքանչյուրը)
- 2x NVIDIA A6000 (48 ԳԲ վիդեո հիշողություն յուրաքանչյուրը)
- 3x NVIDIA RTX 4090 (24 ԳԲ վիդեո հիշողություն յուրաքանչյուրը)
- 3x NVIDIA A5000 (24 ԳԲ վիդեո հիշողություն յուրաքանչյուրը)
Դիսկային տարածք. SSD բավարար չափսով համակարգի և մոդելի համար.
Ծրագրային ապահովում. NVIDIA դրայվերներ և CUDA.
Վիդեո հիշողության օգտագործում. 53 ԳԲ 2K տոկենային համատեքստով.
Համակարգի մոնիտորինգ. դրայվերների վիճակի, կոնտեյներների և GPU-ի ջերմաստիճանի համապարփակ ստուգում։

Սկսել Llama-3.3-70B-ը տեղակայելուց հետո¶

Վճարումից հետո գրանցված էլ. հասցեին կուղարկվի էլ. նամակ, որը կհայտնի, որ սերվերը պատրաստ է աշխատանքի։ Այն կներառի VPS IP հասցեն, ինչպես նաև սերվերին միանալու համար login-ի և գաղտնաբառի տվյալները, ինչպես նաև OpenWebUI-ին մուտք գործելու հղումը։ Մեր ընկերության հաճախորդները սարքավորումները կառավարում են սերվերի կառավարման վահանակի և API-ի միջոցով — Invapi։

Սերվերի օպերացիոն համակարգին մուտքի տվյալներ (օրինակ՝ SSH-ի միջոցով) կուղարկվի ձեզ ստացված էլ. նամակով։
Հղում Ollama կառավարման վահանակին Open WebUI վեբ ինտերֆեյսով. webpanel թեգի տակ Configuration >> Tags tab-ում Invapi-ի կառավարման կոնսոլում։ Ճշգրիտ հղումը https://llama<Server_ID_from_Invapi>.hostkey.in ձևաչափով ուղարկվում է էլ. նամակով սերվերի հանձնման ժամանակ։

Սեղմելով webpanel թեգի հղումը, կբացվի Get started with Open WebUI մուտքի պատուհան, որտեղ անհրաժեշտ է ստեղծել Ձեր չատբոտի ադմինիստրատորի անուն, էլ. հասցե և գաղտնաբառ, այնուհետև սեղմել Create Admin Account կոճակը.

Զգուշացում

Առաջին օգտատիրոջ գրանցումից հետո համակարգը ավտոմատ կերպով նշանակում է նրան ադմինիստրատորի դեր։ Անվտանգությունն ու գրանցման գործընթացի վերահսկողությունը ապահովելու համար բոլոր հաջորդ գրանցման հարցումները պետք է հաստատվեն OpenWebUI-ում ադմինիստրատորի հաշվից։

Նշում

Ollama-ի կառավարման վահանակի և Open WebUI-ի հետ աշխատանքի մանրամասն տեղեկատվություն կարելի է գտնել AI Chatbot on Your Own Server հոդվածում։

Նշում

Օպտիմալ արդյունավետության համար խորհուրդ է տրվում օգտագործել GPU-ներ՝ նվազագույն պահանջվող 16 ԳԲ-ից ավելի վիդեո հիշողությամբ։ Սա ապահովում է բուֆեր՝ ավելի մեծ համատեքստերի և զուգահեռ հարցումների մշակման համար։ Ollama-ի հիմնական կարգավորումների և Open WebUI-ի մանրամասն տեղեկատվություն կարելի է գտնել Ollama-ի մշակողների փաստաթղթերում և Open WebUI-ի մշակողների փաստաթղթերում։

Սերվեր պատվիրել Llama-3.3-70B-ով API-ի միջոցով¶

Այս ծրագրային ապահովումը տեղադրելու համար API-ի միջոցով հետևեք այս հրահանգներին։