Phi-4-14b¶
Այս հոդվածում
Տեղեկատվություն
Phi4-14b-ը ժամանակակից լեզվական մոդել է, որը հարմարեցված է տեղական օգտագործման համար Ollama հարթակի միջոցով։ Այս լուծումը համադրում է Phi-4 մոդելի արդյունավետությունը Open Web UI օգտագործման հարմարավետության հետ։ Համակարգը տեղակայված է Ubuntu 22.04-ի վրա և պահանջում է ժամանակակից գրաֆիկական արագացուցիչ արդյունավետ աշխատանքի համար։ Ollama-ի և Open Web UI-ի համադրությունը ստեղծում է լիարժեք տեղական լուծում արհեստական բանականությամբ աշխատելու համար՝ ապահովելով տվյալների և հարցումների մշակման գործընթացի լիարժեք վերահսկողություն։
Phi-4-14b-ի հիմնական հնարավորությունները¶
-
Հզոր հիմնական ճարտարապետություն. մոդելն ունի 14 միլիարդ պարամետր և 16 հազար տոկենի համատեքստային պատուհան, ինչը թույլ է տալիս մշակել երկար տեքստեր և բարդ խնդիրներ բարձր ճշգրտությամբ.
-
Հարմար Open Web UI ինտերֆեյս. ապահովում է ժամանակակից վեբ ինտերֆեյս մոդելի հետ փոխազդելու համար, ներառյալ չատի պատմությունը, պարամետրերի կարգավորումները և տարբեր մոդելների կառավարումը մեկ ինտերֆեյսում.
-
Բարձր մակարդակի RAG հնարավորություններ. ներկառուցված աջակցություն տարբեր ֆորմատների (PDF, PPT, տեքստային ֆայլեր) փաստաթղթերի փնտրտուքի և վեբ խաղարկության համար, ինչը թույլ է տալիս մոդելին աշխատել ժամանակակից տեղեկատվության և օգտատերերի տվյալների հետ.
-
Բազմախնդրություն. մոդելը արդյունավետ կերպով կատարում է տարբեր խնդիրներ, ներառյալ զրույցների կառավարում, հարցերին պատասխանել, տվյալների վերլուծություն, տեքստի ստեղծում և հիմնարար ծրագրավորում.
-
Անվտանգություն և ճշգրտություն. մոդելը անցել է բազմաստիճան ուսուցում՝ հաշվի առնելով օգտատերերի նախապատվությունները փորձագետների հսկողության ներքո, ինչը ապահովում է պատասխանների բարձր ճշգրտություն, էթիկական նորմերին համապատասխանություն և օգտատերերի հրահանգների կատարում.
-
Բացվածություն և ճկունություն. Ollama-ի բաց կոդի շնորհիվ համակարգը կարելի է կարգավորել և փոփոխել կոնկրետ կարիքների համար, ներառյալ այլ գործիքների և ծառայությունների հետ ինտեգրում.
-
Տարբեր տվյալների տեսակների աջակցություն. մոդելը կարողանում է աշխատել տեքստային տվյալների, կոդի, կառուցվածքային և կիսակառուցվածքային տվյալների հետ, ընդլայնելով դրա կիրառելիությունը տարբեր ոլորտներում։
-
Կիրառման օրինակներ.
-
Գնորդների աջակցություն. օգտատերերի հարցերին պատասխանների ավտոմատացում.
-
Կրթություն. կրթական նյութերի ստեղծում, խնդիրների լուծման մեջ օգնություն.
-
Մարքեթինգ. գովազդային տեքստերի գեներացում, կարծիքների վերլուծություն.
-
Ծրագրային ապահովման մշակում. կոդի ստեղծում և փաստաթղթավորում։
-
Տեղակայման հնարավորություններ¶
| ID | Ծրագրային ապահովման անվանում | Համատեղելի ՕՀ | VM | BM | VGPU | GPU | Նվազագույն CPU (միջուկներ) | Նվազագույն RAM (ԳԲ) | Նվազագույն HDD/SSD (ԳԲ) | Սեփական դոմեն | Ակտիվ |
|---|---|---|---|---|---|---|---|---|---|---|---|
| 256 | Phi-4-14b | Ubuntu 22.04 | - | - | + | + | 4 | 16 | - | Ոչ | ՊԱՏՎԻՐԵԼ |
-
Ինստալյացիայի ժամանակը 15-30 րոպե է՝ ներառյալ օպերացիոն համակարգը.
-
Ollama սերվերը բեռնում և գործարկում է LLM-ը հիշողության մեջ.
-
Open WebUI-ն տեղակայված է որպես վեբ հավելված, որը միացված է Ollama սերվերին.
-
Օգտատերերը փոխազդում են LLM-ի հետ Open WebUI-ի վեբ ինտերֆեյսի միջոցով՝ ուղարկելով հարցումներ և ստանալով պատասխաններ.
-
Բոլոր հաշվարկները և տվյալների մշակումը տեղի են ունենում տեղում սերվերի վրա։ Ադմինիստրատորները կարող են կարգավորել LLM-ը կոնկրետ խնդիրների համար՝ օգտագործելով OpenWebUI գործիքները։
Համակարգի պահանջներ և տեխնիկական բնութագրեր¶
-
Գրաֆիկական արագացուցիչ. NVIDIA A4000 (կամ ավելի հզոր) կամ AMD համարժեք՝ առնվազն 16 ԳԲ վիդեո հիշողությամբ.
-
Դիսկային տարածք. բավարար համակարգի, դրայվերների և մոդելի տեղադրման համար.
-
Դրայվերներ. NVIDIA դրայվերներ և CUDA՝ GPU-ի ճիշտ աշխատանքի համար.
-
Վիդեո հիշողության սպառում. 12 ԳԲ՝ 2K տոկենների համատեքստում.
-
Ավտոմատ վերագործարկում. ավտոմատ կոնտեյների վերագործարկում կարգավորված է ձախողումների դեպքում.
-
GPU աջակցություն. լիարժեք ինտեգրում NVIDIA CUDA-ի հետ՝ առավելագույն արդյունավետության համար։
Սկսել աշխատել Phi-4-14b-ի տեղակայումից հետո¶
Վճարումից հետո գրանցման ժամանակ նշված էլ. փոստին կուղարկվի պատվերի ծանուցում, որը կնշի, որ սերվերը պատրաստ է օգտագործման համար։ Այն կներառի VPS IP հասցեն, ինչպես նաև սերվերին միանալու և OpenWebUI վահանակին մուտք գործելու հղումը։ Մեր ընկերության հաճախորդները սարքավորումները կառավարում են սերվերի կառավարման և API վահանակի միջոցով — Invapi։
-
Մուտքի տվյալներ սերվերի օպերացիոն համակարգին մուտք գործելու համար (օրինակ՝ SSH-ի միջոցով) կուղարկվեն ձեզ ստացված էլ. փոստով։
-
Հղում Ollama կառավարման վահանակին մուտք գործելու համար Open WebUI վեբ ինտերֆեյսով. Invapi վահանակի Configuration >> Tags բաժնում webpanel թեգում։ Ճշգրիտ հղումը
https://phi<Server_ID_from_Invapi>.hostkey.inֆորմատով կուղարկվի էլ. փոստով սերվերի հանձնման ժամանակ։
Սեղմելով webpanel թեգի հղումը, կբացվի Get started with Open WebUI մուտքի պատուհան, որտեղ անհրաժեշտ է ստեղծել Ձեր չատբոտի ադմինի հաշվի անուն, էլ. փոստ և գաղտնաբառ, այնուհետև սեղմել Create Admin Account կոճակը.

Զգուշացում
Առաջին օգտատիրոջ գրանցումից հետո համակարգը ավտոմատ կերպով նշանակում է նրան ադմինիստրատորի դեր։ Անվտանգությունն ու գրանցման գործընթացի վերահսկողությունն ապահովելու համար բոլոր հաջորդ գրանցման հարցումները պետք է հաստատվեն OpenWebUI-ում ադմինիստրատորի հաշվից։
Նշում
Ollama կառավարման վահանակի և Open WebUI-ի հետ աշխատանքի առանձնահատկությունների մանրամասն նկարագրությունը կարելի է գտնել AI Chatbot on Your Own Server հոդվածում։
Նշում
Օպտիմալ աշխատանքի համար խորհուրդ է տրվում օգտագործել GPU, որի վիդեո հիշողությունը գերազանցում է 16 ԳԲ նվազագույն պահանջը՝ ապահովելով լրացուցիչ տարածք մեծ համատեքստերի և զուգահեռ հարցումների մշակման համար։ Ollama-ի հիմնական կարգավորումների և Open WebUI-ի մասին մանրամասն տեղեկատվությունը կարելի է գտնել Ollama մշակողների փաստաթղթերում և Open WebUI մշակողների փաստաթղթերում։