Անցնել պարունակությանը

Llama-3.3-70B

Այս հոդվածում

Տեղեկատվություն

Llama-3.3-70B-ը բարձր արդյունավետ լեզվական մոդել է՝ 70 միլիարդ պարամետրով, որը նախատեսված է տեղական տեղակայման համար Ollama-ի միջոցով։ Մոդելը պահանջում է հզոր հաշվարկային ռեսուրսներ՝ առնվազն 53 ԳԲ վիդեո հիշողությամբ (NVIDIA A100/H100 կամ մի քանի սպառողական GPU): Ubuntu 22.04-ի վրա տեղակայումը աջակցում է բաշխված հաշվարկներին և Open Web UI-ի հետ ինտեգրմանը՝ ապահովելով տվյալների ամբողջական վերահսկողություն և արդյունավետության օպտիմալացում։

Llama-3.3-70B-ի հիմնական հնարավորությունները

  • Բարձր արդյունավետ ճարտարապետություն. մոդելն ունի 70 միլիարդ պարամետր և օպտիմալացված է բարդ խնդիրները մշակելու համար՝ աննախադեպ ճշգրտությամբ՝ ժամանակակից բաշխված հաշվարկների տեխնոլոգիաների միջոցով.

  • Ինտեգրում Open Web UI-ի հետ. ժամանակակից վեբ ինտերֆեյս, որը հասանելի է 8080 պորտով, ապահովելով տվյալների, հաշվարկային ռեսուրսների և մշակման գործընթացների ամբողջական վերահսկողություն.

  • Բաշխված հաշվարկներ. բարձր մակարդակի աջակցություն բազմաքարտ կոնֆիգուրացիաների համար՝ մի քանի GPU-ների միջև բեռի ավտոմատ հավասարակշռմամբ.

  • Մասշտաբայնություն. հորիզոնական մասշտաբավորման հնարավորություն՝ ավելացնելով լրացուցիչ GPU-ներ՝ արդյունավետությունը բարձրացնելու համար.

  • Արդյունավետություն. LLAMA_FLASH_ATTENTION տեխնոլոգիայի օգտագործում՝ հաշվարկները օպտիմալացնելու և հարցումների մշակումը արագացնելու համար.

  • Սխալաների նկատմամբ դիմադրողականություն. ավտոմատ վերականգնման համակարգը ապահովում է անընդհատ աշխատանք։

  • Օգտագործման օրինակներ.

    • Գնորդների աջակցություն. օգտատերերի հարցումներին պատասխանների ավտոմատացում.

    • Կրթություն. կրթական նյութերի ստեղծում, խնդիրների լուծման մեջ օգնություն.

    • Մարքեթինգ. գովազդային տեքստերի գեներացում, կարծիքների վերլուծություն.

    • Ծրագրավորում. կոդի ստեղծում և փաստաթղթավորում։

Տեղակայման հնարավորություններ

ID Ծրագրային ապահովման անվանում Համատեղելի ՕՀ VM BM VGPU GPU Նվազագույն CPU (միջուկներ) Նվազագույն RAM (ԳԲ) Նվազագույն HDD/SSD (ԳԲ) Սեփական դոմեն Ակտիվ
253 Llama-3.3-70B Ubuntu 22.04 - - + + 4 64 - Ոչ ՊԱՏՎԻՐԵԼ
  • Ինստալյացիայի ժամանակը 15-30 րոպե է՝ ներառյալ օպերացիոն համակարգը.

  • Ollama սերվերը բեռնում և գործարկում է LLM-ը հիշողության մեջ.

  • Open WebUI-ն տեղակայված է որպես վեբ հավելված, որը միացված է Ollama սերվերին.

  • Օգտատերերը փոխազդում են LLM-ի հետ Open WebUI վեբ ինտերֆեյսի միջոցով՝ ուղարկելով հարցումներ և ստանալով պատասխաններ.

  • Բաշխված հաշվարկների կոնֆիգուրացիա բազմաքարտ համակարգերի համար.

  • Համակարգի վիճակի մոնիտորինգ, ներառյալ GPU-ի ջերմաստիճանը և արդյունավետությունը.

  • Մի քանի գրաֆիկական արագացուցիչների զուգահեռ աշխատանքի օպտիմալացում.

  • Բոլոր հաշվարկները և տվյալների մշակումը տեղի են ունենում տեղում՝ սերվերի վրա։ Ադմինիստրատորները կարող են կոնֆիգուրացնել LLM-ը կոնկրետ խնդիրների համար OpenWebUI գործիքների միջոցով։

Համակարգի պահանջներ և տեխնիկական բնութագրեր

  • Գրաֆիկական արագացուցիչ CUDA աջակցությամբ (մեկը տարբերակներից, կարող է ավելի լավ լինել).

    • 1x NVIDIA H100
    • 2x NVIDIA A100 (48 ԳԲ վիդեո հիշողություն յուրաքանչյուրը)
    • 2x NVIDIA RTX 5090 (32 ԳԲ վիդեո հիշողություն յուրաքանչյուրը)
    • 2x NVIDIA A6000 (48 ԳԲ վիդեո հիշողություն յուրաքանչյուրը)
    • 3x NVIDIA RTX 4090 (24 ԳԲ վիդեո հիշողություն յուրաքանչյուրը)
    • 3x NVIDIA A5000 (24 ԳԲ վիդեո հիշողություն յուրաքանչյուրը)
  • Դիսկային տարածք. SSD բավարար չափսով համակարգի և մոդելի համար.

  • Ծրագրային ապահովում. NVIDIA դրայվերներ և CUDA.

  • Վիդեո հիշողության օգտագործում. 53 ԳԲ 2K տոկենային համատեքստով.

  • Համակարգի մոնիտորինգ. դրայվերների վիճակի, կոնտեյներների և GPU-ի ջերմաստիճանի համապարփակ ստուգում։

Սկսել Llama-3.3-70B-ը տեղակայելուց հետո

Վճարումից հետո գրանցված էլ. հասցեին կուղարկվի էլ. նամակ, որը կհայտնի, որ սերվերը պատրաստ է աշխատանքի։ Այն կներառի VPS IP հասցեն, ինչպես նաև սերվերին միանալու համար login-ի և գաղտնաբառի տվյալները, ինչպես նաև OpenWebUI-ին մուտք գործելու հղումը։ Մեր ընկերության հաճախորդները սարքավորումները կառավարում են սերվերի կառավարման վահանակի և API-ի միջոցով — Invapi։

  • Սերվերի օպերացիոն համակարգին մուտքի տվյալներ (օրինակ՝ SSH-ի միջոցով) կուղարկվի ձեզ ստացված էլ. նամակով։

  • Հղում Ollama կառավարման վահանակին Open WebUI վեբ ինտերֆեյսով. webpanel թեգի տակ Configuration >> Tags tab-ում Invapi-ի կառավարման կոնսոլում։ Ճշգրիտ հղումը https://llama<Server_ID_from_Invapi>.hostkey.in ձևաչափով ուղարկվում է էլ. նամակով սերվերի հանձնման ժամանակ։

Սեղմելով webpanel թեգի հղումը, կբացվի Get started with Open WebUI մուտքի պատուհան, որտեղ անհրաժեշտ է ստեղծել Ձեր չատբոտի ադմինիստրատորի անուն, էլ. հասցե և գաղտնաբառ, այնուհետև սեղմել Create Admin Account կոճակը.

Զգուշացում

Առաջին օգտատիրոջ գրանցումից հետո համակարգը ավտոմատ կերպով նշանակում է նրան ադմինիստրատորի դեր։ Անվտանգությունն ու գրանցման գործընթացի վերահսկողությունը ապահովելու համար բոլոր հաջորդ գրանցման հարցումները պետք է հաստատվեն OpenWebUI-ում ադմինիստրատորի հաշվից։

Նշում

Ollama-ի կառավարման վահանակի և Open WebUI-ի հետ աշխատանքի մանրամասն տեղեկատվություն կարելի է գտնել AI Chatbot on Your Own Server հոդվածում։

Նշում

Օպտիմալ արդյունավետության համար խորհուրդ է տրվում օգտագործել GPU-ներ՝ նվազագույն պահանջվող 16 ԳԲ-ից ավելի վիդեո հիշողությամբ։ Սա ապահովում է բուֆեր՝ ավելի մեծ համատեքստերի և զուգահեռ հարցումների մշակման համար։ Ollama-ի հիմնական կարգավորումների և Open WebUI-ի մանրամասն տեղեկատվություն կարելի է գտնել Ollama-ի մշակողների փաստաթղթերում և Open WebUI-ի մշակողների փաստաթղթերում։

Սերվեր պատվիրել Llama-3.3-70B-ով API-ի միջոցով

question_mark
Is there anything I can help you with?
question_mark
AI Assistant ×