Skip to content

CogVideoX-5b

Bu makalede

Bilgi

CogVideoX-5b, Huggingface Space arayüzü üzerinden erişilebilir olan ve yapay zeka teknolojileri kullanarak videolar oluşturmak için tasarlanmış bir modeldir. Yapısı, görsel içerik oluşturma için bilişsel modeller ve dönüştürücüler üzerine kuruludur.

CogVideoX-5b Ana Özellikleri

  • Metinden-video üretimi — metin açıklamalarını güçlü semantik ve görsel uyumlu yüksek kaliteli video segmentlerine dönüştürme;
  • Çeşitli çözünürlük ve formatları destekleme — farklı amacı hizmet etmek için değişken en-boy oranlarında ve çözünürlüklerde videolar oluşturma yeteneği;
  • Bağlama anlayışı — önceden eğitilmiş dil modelleri sayesinde kullanıcı taleplerinin daha iyi yorumlanması;
  • Grafik arayüzü — programlamaya gerek kalmadan modelle etkileşimde bulunmak için kullanışlı bir web arayüzü;
  • Video kalitesini artırma — çözünürlük ve kare hızını (RIFE) artırmak için entegre modeller;
  • Üretim parametrelerinin özelleştirilebilirliği — video stilini, animasyon hızını ve diğer karakteristiklerini ince ayar yapma yeteneği;
  • Ölçeklenebilirlik — paralel hesaplama desteği ile GPU'lar üzerinde etkili çalışma;
  • Açık kaynak kodu — araştırma toplulukları ve geliştiriciler için modelin kod ve ağırlıklarının mevcudiyeti.

Çalıştırma Özellikleri

ID Uyumlu OS VM BM VGPU GPU Min CPU (Çekirdekler) Min RAM (GB) Min HDD/SSD (GB) Aktif
272 Ubuntu 22.04 + + + + 4 32 50 Evet
  • Kurulum süresi: işletim sistemi kurulumunu içeren 15-30 dakika.
  • Sistem Gereksinimleri: En iyi performans için en az 24GB VRAM'li bir GPU önerilir.
    • SAT BF16: 76GB VRAM;
    • diffusers BF16: 10GB VRAM'den başlayarak;
    • diffusers INT8 (torchao): 7GB VRAM'den başlayarak;
    • Multi-GPU modu (BF16): diffusers kullanıldığında yaklaşık olarak her GPU için 24GB VRAM.
  • Desteklenen video çözünürlükleri: temel çözünürlük: 1360 × 768;
  • Kare sayısı: formül 16N + 1'e göre olmalıdır, N ≤ 10 (varsayılan olarak 81 kare);
  • Kare hızı: 16 fps;
  • Video süresi: 5-10 saniye;
  • Önerilen hassasiyet: BF16 (FP16, FP32, FP8*, INT8 de destekleniyor; INT4 desteklenmiyor);
  • Üretim hızı (50 adım): ~1000 saniye NVIDIA A100 üzerinde, ~550 saniye NVIDIA H100 üzerinde.
  • Önceden yüklü bağımlılıklar:
    • Python 3.9
    • python3.9-venv (Python ortamları için izole etme aracı)
    • python3.9-dev (geliştirme için başlık dosyaları ve kütüphaneler)
    • python3-pip (Python paket yöneticisi)
    • NVIDIA sürücüleri
    • nvidia-docker2
    • docker.io
    • nginx-certbot
    • git
    • curl
    • wget
  • Proje dizini: /opt/CogVideo.

CogVideoX-5b Kurulum Sonrası Kullanım

Ödeme yapıldıktan sonra, kayıt sırasında sağlanmış e-posta adresine sunucunun kullanıma hazır olduğunu belirten bir bildirim gönderilecektir. Bu bildirimde VPS IP adresi ve erişim için gerekli kimlik bilgileri yer alacaktır. Şirketimizin müşterileri sunucu yönetim paneli ve API aracılığıyla ekipmanlarını yönetir — Invapi.

Kimlik bilgileri sunucu kontrol panelinin Info >> Tags sekmesinde veya gönderilen e-postada bulunabilir:

  • CogVideoX-5b'nin yönetim paneline web arayüzü üzerinden erişim bağlantısı: webpanel etiketinde;
  • Kullanıcı Adı ve Şifre: sunucu serbest bırakıldığında gönderilen e-postada.

CogVideoX-5b Başlatma Menüsü

Başlangıç menüsüne erişmek için webpanel etiketinden gelen bağlantıya tıklayın.

İçerik oluşturmak için şu adımları izleyin:

  1. Uyarıyı göz önünde bulundurun: Bu demonstrasyon aracı yalnızca akademik araştırma ve deneyimsel kullanım için tasarlanmıştır.

  2. Alan aşırı yüklendiğinde kişisel bir kopya oluşturmak için "Bu Space'i Çoğalt" butonuna tıklayabilirsiniz.

Veri Girişi

  1. İki veri girişi seçeneğiniz vardır (aynı anda kullanılamaz):

    • I2V: görüntü girişi (video ile aynı anda kullanılamaz);
    • V2V: video girişi (görüntü ile aynı anda kullanılamaz).
  2. Uygun alana metin önerisini girin. Limit: 200 kelimenin altında.

  3. Opsiyonel: sorgunuzu GLM-4 Model kullanarak geliştirmek için Enhance Prompt butonuna tıklayabilirsiniz, bu da orijinal metnizi zenginleştirir.

Parametre Yapılandırması

  1. Inference Seed değerini girin:

    • Belirli bir tohum için pozitif bir sayı. Pozitif bir sayı (örneğin, 42, 123, 1000) girildiğinde, sistem bu değeri rastgele sayı üreteci için başlangıç noktası olarak kullanır ve sonuçların tekrarlanabilirliğini sağlar. Aynı tohum, öneri ve ayarlardan oluşan aynı veya çok benzer sonuçlar veren bir sonraki üretimde elde edilir;
    • -1 rastgele tohum için. Her üretim benzersiz olacaktır, hatta aynı öneri ve ayarları kullanırsanız bile.
  2. Ek seçeneklerden birini veya birkaçını seçin (opsiyonel):

    • Super-Resolution: etkinleştirerek çözünürlüğü artırın (720 × 480 → 2880 × 1920)
    • Frame Interpolation: etkinleştirerek kare hızını artırın (8fps → 16fps)
  3. Demo'da:

    • RIFE, kare interpolasyonu için kullanılır;
    • Real-ESRGAN, super-resolution için kullanılır.
  4. Ekranın altındaki Generate Video butonuna tıklayın.

  5. Üretimin tamamlanmasını bekleyin — sonuçlar arayüzün sağ tarafında gösterilecektir.

Not

CogVideoX-5b'nin kullanımı hakkında ayrıntılı bilgi projeden resmi dokümantasyonda bulunabilir.

API Kullanarak CogVideoX-5b ile Sunucu Siparişi

Bu yazılımı API kullanarak kurmak için bu talimatları izleyin.


Bu sayfanın bazı içerikleri ya da yazıları AI tarafından oluşturulmuş veya çevrilmiş olabilir.