CogVideoX-5b¶
Այս հոդվածում
Տեղեկատվություն
CogVideoX-5b-ն արհեստական բանականության տեխնոլոգիաների միջոցով տեսանյութեր ստեղծելու մոդել է, որը հասանելի է Huggingface Space ինտերֆեյսի միջոցով։ Այն հիմնված է ճանաչողական մոդելների և տրանսֆորմերների վրա՝ վիզուալ բովանդակություն ստեղծելու համար։
CogVideoX-5b. Հիմնական հնարավորություններ¶
- Տեքստից տեսանյութի գեներացում — տեքստային նկարագրությունները վերածում է բարձրորակ տեսահատվածների՝ ուժեղ սեմանտիկ և վիզուալ համապատասխանությամբ։
- Տարբեր լուծաչափերի և ֆորմատների աջակցություն — հնարավորություն է տալիս ստեղծել տեսանյութեր տարբեր հարաբերակցություններով և լուծաչափերով՝ տարբեր նպատակների համար։
- Կոնտեքստի ճանաչողական հասկացողություն — օգտատերերի հարցումների բարելավված մեկնաբանություն՝ շնորհիվ նախաճաշակված լեզվական մոդելների։
- Գրաֆիկական ինտերֆեյս — հարմարավետ վեբ-ինտերֆեյս՝ մոդելի հետ փոխազդելու համար՝ առանց ծրագրավորման։
- Տեսանյութի որակի բարելավում — լուծաչափի և կադրերի հաճախականության բարձրացման ինտեգրված մոդելներ (RIFE)։
- Գեներացման պարամետրերի կարգավորում — ոճի, անիմացիայի արագության և տեսանյութի այլ բնութագրերի ճշգրիտ կարգավորման հնարավորություն։
- Մասշտաբայնություն — արդյունավետ աշխատանք GPU-ների վրա՝ զուգահեռ հաշվարկների աջակցությամբ։
- Բաց կոդ — մոդելի կոդի և կշիռների հասանելիություն գիտահետազոտական համայնքների և մշակողների համար։
Տեղակայման հնարավորություններ¶
| ID | Ծրագրային ապահովման անվանում | Համատեղելի ՕՀ | VM | BM | VGPU | GPU | Նվազագույն CPU (միջուկներ) | Նվազագույն RAM (ԳԲ) | Նվազագույն HDD/SSD (ԳԲ) | Սեփական դոմեն | Ակտիվ |
|---|---|---|---|---|---|---|---|---|---|---|---|
| 272 | CogVideo | Ubuntu 22.04 | + | + | + | + | 4 | 32 | 50 | Ոչ | ՊԱՏՎԻՐԵԼ |
- Ինստալյացիայի ժամանակը՝ 15-30 րոպե՝ ներառյալ օպերացիոն համակարգի կարգավորումը։
- Համակարգի պահանջներ. Օպտիմալ աշխատանքի համար խորհուրդ է տրվում առնվազն 24 ԳԲ VRAM GPU։
- SAT BF16. 76 ԳԲ VRAM.
- diffusers BF16. 10 ԳԲ VRAM-ից։
- diffusers INT8 (torchao). 7 ԳԲ VRAM-ից։
- Multi-GPU ռեժիմ (BF16). մոտավորապես 24 ԳԲ յուրաքանչյուր GPU-ի համար՝ diffusers օգտագործելիս։
- Աջակցվող տեսանյութի լուծաչափեր. հիմնական լուծաչափ՝ 1360 × 768.
- Կադրերի քանակը. պետք է համապատասխանի 16N + 1 բանաձևին, որտեղ N ≤ 10 (ըստ լռելյայնի՝ 81 կադր)։
- Կադրերի հաճախականություն. 16 fps.
- Տեսանյութի տևողությունը. 5-10 վայրկյան։
- Խորհուրդ տրվող ճշգրտություն. BF16 (աջակցվում են նաև FP16, FP32, FP8*, INT8. INT4-ը չի աջակցվում)։
- Գեներացման արագություն (50 քայլ). ~1000 վայրկյան NVIDIA A100-ի վրա, ~550 վայրկյան NVIDIA H100-ի վրա։
- Նախաբեռնված կախվածություններ.
- Python 3.9
- python3.9-venv (Python-ի մեկուսացված միջավայրեր ստեղծելու գործիք)
- python3.9-dev (մշակման համար նախատեսված header ֆայլեր և գրադարաններ)
- python3-pip (Python-ի փաթեթների կառավարիչ)
- NVIDIA դրայվերներ
- nvidia-docker2
- docker.io
- nginx-certbot
- git
- curl
- wget
- Ծրագրի թղթապանակ.
/opt/CogVideo.
CogVideoX-5b-ի օգտագործումը տեղակայումից հետո¶
Վճարումից հետո գրանցման ժամանակ նշված էլ. փոստի հասցեին կուղարկվի ծանուցում, որ սերվերը պատրաստ է օգտագործման համար։ Այն կներառի VPS-ի IP հասցեն և մուտքի համար անհրաժեշտ տվյալները։ Մեր ընկերության հաճախորդները սարքավորումները կառավարում են սերվերի կառավարման վահանակի և API-ի միջոցով՝ Invapi։
Մուտքի տվյալները կարելի է գտնել սերվերի կառավարման վահանակի Configuration >> Tags թերթիկում կամ ուղարկված էլ. փոստում.
- CogVideoX-5b-ի կառավարման վահանակին մուտքի հղումը վեբ-ինտերֆեյսի միջոցով. webpanel թեգում.
- Օգտատեր և Գաղտնաբառ. ուղարկվում են էլ. փոստով՝ սերվերի ակտիվացումից հետո։
CogVideoX-5b-ի մեկնարկային մենյուն¶
webpanel թեգից հղումը սեղմելուց հետո բացվում է CogVideoX-ի մեկնարկային մենյուն։

Բովանդակություն գեներացնելու համար կատարեք հետևյալ քայլերը.
-
Զգուշացում. այս ցուցադրական գործիքը նախատեսված է միայն ակադեմիական հետազոտությունների և փորձարարական օգտագործման համար։
-
Եթե տարածքը ծանրաբեռնված է, կարող եք ստեղծել անձնական պատճեն՝ սեղմելով "Duplicate this Space"։
Տվյալների մուտքագրում
-
Դուք ունեք տվյալներ մուտքագրելու երկու տարբերակ (չեն կարող օգտագործվել միաժամանակ).
- I2V. պատկերի մուտքագրում (չի կարող օգտագործվել միաժամանակ տեսանյութի հետ)։
- V2V. տեսանյութի մուտքագրում (չի կարող օգտագործվել միաժամանակ պատկերի հետ)։
-
Մուտքագրեք տեքստային հրահանգը համապատասխան դաշտում։ Սահմանափակում. 200 բառից պակաս։
-
Ըստ ցանկության. սեղմեք
Enhance Promptկոճակը՝ ձեր հարցումը բարելավելու համար GLM-4 մոդելի օգտագործմամբ, որը կբարելավի ձեր սկզբնական տեքստը։
Պարամետրերի կարգավորում
-
Մուտքագրեք Inference Seed արժեքը.
- Դրական թիվ՝ կոնկրետ սիդի համար։ Դրական թիվ մուտքագրելիս (օրինակ՝ 42, 123, 1000) համակարգը դա օգտագործում է որպես պատահական թվերի գեներատորի սկզբնակետ՝ ապահովելով արդյունքների վերարտադրելիությունը։ Նույն սիդը, նույն հրահանգը և կարգավորումները օգտագործելիս հաջորդական գեներացիաները կտան նույնական կամ շատ նման արդյունքներ.
- -1՝ պատահական սիդի համար։ Յուրաքանչյուր գեներացիա կլինի եզակի, նույնիսկ եթե օգտագործում եք նույն հրահանգը և կարգավորումները։
-
Ընտրեք լրացուցիչ տարբերակներ (ըստ ցանկության).
- Super-Resolution. ակտիվացրեք՝ լուծաչափը բարձրացնելու համար (720 × 480 > 2880 × 1920)
- Frame Interpolation. ակտիվացրեք՝ կադրերի հաճախականությունը բարձրացնելու համար (8fps > 16fps)
-
Զգուշացում. ցուցադրման ժամանակ.
- Կադրերի ինտերպոլյացիայի համար օգտագործվում է RIFE.
- Սուպեր-լուծաչափի համար օգտագործվում է Real-ESRGAN.
-
Սեղմեք էկրանի ներքևի մասում գտնվող
Generate Videoկոճակը։ -
Սպասեք գեներացիայի ավարտին՝ արդյունքները կցուցադրվեն ինտերֆեյսի աջ կողմում։
Նշում
CogVideoX-5b-ի օգտագործման մանրամասն տեղեկատվությունը կարելի է գտնել ծրագրի պաշտոնական փաստաթղթերում։