Անցնել պարունակությանը

Qwen3-32B

Այս հոդվածում

Տեղեկատվություն

Qwen3-32B-ը Qwen շարքի առաջադեմ հաջորդ սերնդի լեզվական մոդել է, որը տեղական տեղակայման համար Ollama հարթակի միջոցով պահանջում է զգալի հաշվարկային ռեսուրսներ: Տեղակայումը հիմնված է NVIDIA գրաֆիկական արագացուցիչներով ժամանակակից համակարգերի վրա: Open Web UI-ի հետ ինտեգրումը ապահովում է մոդելի հետ փոխազդեցության հարմարավետ ինտերֆեյս՝ պահպանելով տվյալների վրա ամբողջական վերահսկողությունը:

Qwen3-32B-ի հիմնական հնարավորություններ

  • Բազմալեզու ճարտարապետություն. Մոդելն ունի 32 միլիարդ պարամետր և աջակցում է 119 լեզուներ և բարբառներ, ուսուցված 36 տրիլիոն բառերի վրա՝ ապահովելով մշակութային նրբերանգների հասկացում և բարձրորակ թարգմանություն;
  • Աշխատանքի ռեժիմներ. Օպտիմալացված է թե՛ խորը տրամաբանության (մտածողության ռեժիմ), թե՛ արագ պատասխանների (ոչ մտածողության ռեժիմ) համար՝ թույլ տալով հարմարվել տարբեր խնդիրների տեսակներին;
  • Ինտեգրում Open Web UI-ի հետ. Տրամադրում է ժամանակակից վեբ ինտերֆեյս՝ մոդելի հետ հարմարավետ փոխազդեցության համար 8080 պորտի միջոցով՝ ապահովելով տվյալների և հարցումների մշակման վրա ամբողջական վերահսկողություն;
  • Մասշտաբայնություն. Աջակցում է քանտացիայի տարբեր մակարդակներ (FP16, 8-բիթ, 4-բիթ)՝ հիշողության օգտագործումը օպտիմալացնելու համար՝ կախված հասանելի ռեսուրսներից;
  • Անվտանգություն և վերահսկողություն. Ամբողջական տեղական տեղակայումը ապահովում է տվյալների գաղտնիությունը, մինչդեռ OLLAMA_HOST և OLLAMA_ORIGINS կարգավորումները երաշխավորում են ցանցային անվտանգությունը;
  • Բարձր արդյունավետություն. Բարձր արդյունավետ սպառողական GPU-ների վրա հասնում է վայրկյանում մոտ 34 թոկենի, ինչը մոդելը դարձնում է գործնական տեղական օգտագործման համար;
  • Ձախողումների նկատմամբ դիմադրողականություն. Տարանցված համակարգը՝ ավտոմատ կոնտեյներների և ծառայությունների վերագործարկմամբ, ապահովում է կայուն աշխատանք:
  • Օգտագործման օրինակներ.
    • Հաճախորդների աջակցություն. Օգտատերերի հարցերին պատասխանների ավտոմատացում՝ բազմալեզու աջակցությամբ;
    • Կրթություն. Կրթական նյութերի ստեղծում, բարդ խնդիրների լուծման մեջ օգնություն;
    • Պրոգրամավորում. Կոդի գեներացում և վերլուծություն՝ տարբեր ծրագրավորման լեզուների աջակցությամբ;
    • Բազմալեզու բովանդակություն. Տեքստերի ստեղծում և թարգմանություն՝ հաշվի առնելով մշակութային առանձնահատկությունները:

Տեղակայման հնարավորություններ

ID Ծրագրային ապահովման անվանում Համատեղելի ՕՀ VM BM VGPU GPU Նվազագույն CPU (միջուկներ) Նվազագույն RAM (ԳԲ) Նվազագույն HDD/SSD (ԳԲ) Սեփական դոմեն Ակտիվ
334 qwen3:32b Ubuntu 22.04 - - + + 4 64 - Ոչ ՊԱՏՎԻՐԵԼ
  • Տեղադրման ժամանակը 20-40 րոպե է՝ ներառյալ OS-ը;
  • Ollama սերվերը բեռնում և գործարկում է Qwen3-32B մոդելը GPU/RAM հիշողության մեջ;
  • Open WebUI-ն տեղակայված է որպես վեբ հավելված, որը միացված է Ollama սերվերին;
  • Օգտատերերը փոխազդում են մոդելի հետ Open WebUI վեբ ինտերֆեյսի միջոցով՝ ուղարկելով հարցումներ և ստանալով պատասխաններ;
  • Բոլոր հաշվարկները և տվյալների մշակումը տեղի են ունենում տեղում սերվերի վրա՝ բազմալեզու աջակցությամբ;
  • Համակարգավարները կարող են կարգավորել մոդելը կոնկրետ խնդիրների համար OpenWebUI գործիքների միջոցով:

Սկսել Qwen3-32B-ի տեղակայումից հետո

Պատվերի վճարումից հետո գրանցման ժամանակ նշված էլ. հասցեին կուղարկվի ծանուցում սերվերի աշխատանքի համար պատրաստ լինելու մասին: Այն կներառի VPS IP հասցեն, ինչպես նաև սերվերին միանալու համար օգտատերի անունը և գաղտնաբառը, ինչպես նաև OpenWebUI վահանակին մուտք գործելու հղումը: Մեր ընկերության հաճախորդները սարքավորումները կառավարում են սերվերի կառավարման վահանակում և API-ումInvapi:

  • Սերվերի օպերացիոն համակարգին մուտք գործելու համար ինքնությունի տվյալներ (օրինակ՝ SSH-ի միջոցով) կուղարկվեն ձեզ ստացված էլ. նամակում:
  • Ollama կառավարման վահանակին մուտք գործելու համար հղում Open WebUI վեբ ինտերֆեյսով. Invapi կառավարման վահանակի Configuration >> Tags բաժնում webpanel թեգում: Ճշգրիտ հղումը https://qwen3-32b<Server_ID_from_Invapi>.hostkey.in ձևաչափով ուղարկվում է էլ. նամակով սերվերի հանձնման ժամանակ:

Սեղմելով webpanel թեգի հղումը, կբացվի Get started with Open WebUI մուտքի պատուհան, որտեղ անհրաժեշտ է ստեղծել admin հաշվի անուն, էլ. հասցե և գաղտնաբառ ձեր չատբոտի համար, այնուհետև սեղմել Create Admin Account կոճակը:

Զգուշացում

Առաջին օգտատիրոջ գրանցումից հետո համակարգը ավտոմատ կերպով նշանակում է նրան admin դեր: Անվտանգությունն ու գրանցման գործընթացի վրա վերահսկողությունը ապահովելու համար բոլոր հաջորդ գրանցման հարցումները պետք է հաստատվեն OpenWebUI-ում վարչակազմի հաշվից:

Հաջող գրանցումից հետո կբացվի Open WebUI-ի հիմնական ինտերֆեյսը:

Նշում

Ollama կառավարման վահանակի հետ աշխատելու առանձնահատկությունների մանրամասն նկարագրությունը կարելի է գտնել AI Chatbot on Your Own Server հոդվածում:

Նշում

Օպտիմալ աշխատանքի համար խորհուրդ է տրվում օգտագործել GPU, որի վիդեո հիշողությունը գերազանցում է 16 ԳԲ նվազագույն պահանջը, ինչը կապահովի բուֆերը մեծ համատեքստերի և զուգահեռ հարցումների մշակման համար: Ollama-ի և Open WebUI-ի հիմնական կարգավորումների մասին մանրամասն տեղեկատվությունը կարելի է գտնել Ollama-ի մշակողների փաստաթղթերում և Open WebUI-ի մշակողների փաստաթղթերում:

Պատվիրել սերվեր Qwen3-32B-ով API-ի միջոցով

question_mark
Is there anything I can help you with?
question_mark
AI Assistant ×