Անցնել պարունակությանը

CogVideoX-5b

Այս հոդվածում

Տեղեկատվություն

CogVideoX-5b-ն արհեստական բանականության տեխնոլոգիաների միջոցով տեսանյութեր ստեղծելու մոդել է, որը հասանելի է Huggingface Space ինտերֆեյսի միջոցով։ Այն հիմնված է ճանաչողական մոդելների և տրանսֆորմերների վրա՝ վիզուալ բովանդակություն ստեղծելու համար։

CogVideoX-5b. Հիմնական հնարավորություններ

  • Տեքստից տեսանյութի գեներացում — տեքստային նկարագրությունները վերածում է բարձրորակ տեսահատվածների՝ ուժեղ սեմանտիկ և վիզուալ համապատասխանությամբ։
  • Տարբեր լուծաչափերի և ֆորմատների աջակցություն — հնարավորություն է տալիս ստեղծել տեսանյութեր տարբեր հարաբերակցություններով և լուծաչափերով՝ տարբեր նպատակների համար։
  • Կոնտեքստի ճանաչողական հասկացողություն — օգտատերերի հարցումների բարելավված մեկնաբանություն՝ շնորհիվ նախաճաշակված լեզվական մոդելների։
  • Գրաֆիկական ինտերֆեյս — հարմարավետ վեբ-ինտերֆեյս՝ մոդելի հետ փոխազդելու համար՝ առանց ծրագրավորման։
  • Տեսանյութի որակի բարելավում — լուծաչափի և կադրերի հաճախականության բարձրացման ինտեգրված մոդելներ (RIFE)։
  • Գեներացման պարամետրերի կարգավորում — ոճի, անիմացիայի արագության և տեսանյութի այլ բնութագրերի ճշգրիտ կարգավորման հնարավորություն։
  • Մասշտաբայնություն — արդյունավետ աշխատանք GPU-ների վրա՝ զուգահեռ հաշվարկների աջակցությամբ։
  • Բաց կոդ — մոդելի կոդի և կշիռների հասանելիություն գիտահետազոտական համայնքների և մշակողների համար։

Տեղակայման հնարավորություններ

ID Ծրագրային ապահովման անվանում Համատեղելի ՕՀ VM BM VGPU GPU Նվազագույն CPU (միջուկներ) Նվազագույն RAM (ԳԲ) Նվազագույն HDD/SSD (ԳԲ) Սեփական դոմեն Ակտիվ
272 CogVideo Ubuntu 22.04 + + + + 4 32 50 Ոչ ՊԱՏՎԻՐԵԼ
  • Ինստալյացիայի ժամանակը՝ 15-30 րոպե՝ ներառյալ օպերացիոն համակարգի կարգավորումը։
  • Համակարգի պահանջներ. Օպտիմալ աշխատանքի համար խորհուրդ է տրվում առնվազն 24 ԳԲ VRAM GPU։
    • SAT BF16. 76 ԳԲ VRAM.
    • diffusers BF16. 10 ԳԲ VRAM-ից։
    • diffusers INT8 (torchao). 7 ԳԲ VRAM-ից։
    • Multi-GPU ռեժիմ (BF16). մոտավորապես 24 ԳԲ յուրաքանչյուր GPU-ի համար՝ diffusers օգտագործելիս։
  • Աջակցվող տեսանյութի լուծաչափեր. հիմնական լուծաչափ՝ 1360 × 768.
  • Կադրերի քանակը. պետք է համապատասխանի 16N + 1 բանաձևին, որտեղ N ≤ 10 (ըստ լռելյայնի՝ 81 կադր)։
  • Կադրերի հաճախականություն. 16 fps.
  • Տեսանյութի տևողությունը. 5-10 վայրկյան։
  • Խորհուրդ տրվող ճշգրտություն. BF16 (աջակցվում են նաև FP16, FP32, FP8*, INT8. INT4-ը չի աջակցվում)։
  • Գեներացման արագություն (50 քայլ). ~1000 վայրկյան NVIDIA A100-ի վրա, ~550 վայրկյան NVIDIA H100-ի վրա։
  • Նախաբեռնված կախվածություններ.
    • Python 3.9
    • python3.9-venv (Python-ի մեկուսացված միջավայրեր ստեղծելու գործիք)
    • python3.9-dev (մշակման համար նախատեսված header ֆայլեր և գրադարաններ)
    • python3-pip (Python-ի փաթեթների կառավարիչ)
    • NVIDIA դրայվերներ
    • nvidia-docker2
    • docker.io
    • nginx-certbot
    • git
    • curl
    • wget
  • Ծրագրի թղթապանակ. /opt/CogVideo.

CogVideoX-5b-ի օգտագործումը տեղակայումից հետո

Վճարումից հետո գրանցման ժամանակ նշված էլ. փոստի հասցեին կուղարկվի ծանուցում, որ սերվերը պատրաստ է օգտագործման համար։ Այն կներառի VPS-ի IP հասցեն և մուտքի համար անհրաժեշտ տվյալները։ Մեր ընկերության հաճախորդները սարքավորումները կառավարում են սերվերի կառավարման վահանակի և API-ի միջոցով՝ Invapi։

Մուտքի տվյալները կարելի է գտնել սերվերի կառավարման վահանակի Configuration >> Tags թերթիկում կամ ուղարկված էլ. փոստում.

  • CogVideoX-5b-ի կառավարման վահանակին մուտքի հղումը վեբ-ինտերֆեյսի միջոցով. webpanel թեգում.
  • Օգտատեր և Գաղտնաբառ. ուղարկվում են էլ. փոստով՝ սերվերի ակտիվացումից հետո։

CogVideoX-5b-ի մեկնարկային մենյուն

webpanel թեգից հղումը սեղմելուց հետո բացվում է CogVideoX-ի մեկնարկային մենյուն։

Բովանդակություն գեներացնելու համար կատարեք հետևյալ քայլերը.

  1. Զգուշացում. այս ցուցադրական գործիքը նախատեսված է միայն ակադեմիական հետազոտությունների և փորձարարական օգտագործման համար։

  2. Եթե տարածքը ծանրաբեռնված է, կարող եք ստեղծել անձնական պատճեն՝ սեղմելով "Duplicate this Space"։

Տվյալների մուտքագրում

  1. Դուք ունեք տվյալներ մուտքագրելու երկու տարբերակ (չեն կարող օգտագործվել միաժամանակ).

    • I2V. պատկերի մուտքագրում (չի կարող օգտագործվել միաժամանակ տեսանյութի հետ)։
    • V2V. տեսանյութի մուտքագրում (չի կարող օգտագործվել միաժամանակ պատկերի հետ)։
  2. Մուտքագրեք տեքստային հրահանգը համապատասխան դաշտում։ Սահմանափակում. 200 բառից պակաս։

  3. Ըստ ցանկության. սեղմեք Enhance Prompt կոճակը՝ ձեր հարցումը բարելավելու համար GLM-4 մոդելի օգտագործմամբ, որը կբարելավի ձեր սկզբնական տեքստը։

Պարամետրերի կարգավորում

  1. Մուտքագրեք Inference Seed արժեքը.

    • Դրական թիվ՝ կոնկրետ սիդի համար։ Դրական թիվ մուտքագրելիս (օրինակ՝ 42, 123, 1000) համակարգը դա օգտագործում է որպես պատահական թվերի գեներատորի սկզբնակետ՝ ապահովելով արդյունքների վերարտադրելիությունը։ Նույն սիդը, նույն հրահանգը և կարգավորումները օգտագործելիս հաջորդական գեներացիաները կտան նույնական կամ շատ նման արդյունքներ.
    • -1՝ պատահական սիդի համար։ Յուրաքանչյուր գեներացիա կլինի եզակի, նույնիսկ եթե օգտագործում եք նույն հրահանգը և կարգավորումները։
  2. Ընտրեք լրացուցիչ տարբերակներ (ըստ ցանկության).

    • Super-Resolution. ակտիվացրեք՝ լուծաչափը բարձրացնելու համար (720 × 480 > 2880 × 1920)
    • Frame Interpolation. ակտիվացրեք՝ կադրերի հաճախականությունը բարձրացնելու համար (8fps > 16fps)
  3. Զգուշացում. ցուցադրման ժամանակ.

    • Կադրերի ինտերպոլյացիայի համար օգտագործվում է RIFE.
    • Սուպեր-լուծաչափի համար օգտագործվում է Real-ESRGAN.
  4. Սեղմեք էկրանի ներքևի մասում գտնվող Generate Video կոճակը։

  5. Սպասեք գեներացիայի ավարտին՝ արդյունքները կցուցադրվեն ինտերֆեյսի աջ կողմում։

Նշում

CogVideoX-5b-ի օգտագործման մանրամասն տեղեկատվությունը կարելի է գտնել ծրագրի պաշտոնական փաստաթղթերում։

CogVideoX-5b-ով սերվերի պատվերը API-ի միջոցով

question_mark
Is there anything I can help you with?
question_mark
AI Assistant ×