Skip to content

HunyuanVideo

在这篇文章中

关于产品

HunyuanVideo 是由腾讯开发的视频生成模型。该系统利用人工智能算法将文本描述转换为视频。其架构基于 Transformer 和扩散模型。

HunyuanVideo 主要功能

  • 文生视频生成 — 将文本描述转换为高质量的视频片段,具有高度的语义和视觉一致性;
  • 图像与视频的统一架构 — 使用带有 Full Attention 机制的 Transformer 架构来生成图像和视频;
  • 多模态文本编码器 (MLLM) — 通过使用预训练的多模态语言模型,提高了上下文理解和指令遵循能力;
  • 3D VAE 压缩 — 使用 CausalConv3D 进行高效的像素空间压缩,以优化计算资源;
  • 提示词重写 — 自动改进用户查询,以更准确地解释意图;
  • 可扩展性 — 支持在单个 GPU 上运行,以及在多个 GPU 上进行并行推理以加速生成;
  • 可定制参数 — 为创建视频的时长、风格、分辨率和其他特性提供灵活的设置;
  • 开源代码 — 模型代码和权重对研究社区完全开放。

部署功能

ID 软件名称 兼容操作系统 虚拟机 物理机 vGPU GPU 最低CPU(核) 最低内存(GB) 最低硬盘(GB) 自定义域名 是否启用
257 HunyuanVideo Ubuntu 22.04 - + + + 2 16 50 订购
  • 安装时间:包括操作系统设置在内,需 15-30 分钟。
  • 系统要求: 为了获得最佳性能,需要配备至少 80 GB 显存的 NVIDIA GPU。
  • 预装依赖项:
    • Python 3.9
    • python3.9-venv(用于创建隔离 Python 环境的工具)
    • python3.9-dev(开发用的头文件和库)
    • python3-pip(Python 包管理器)
    • NVIDIA 驱动程序
    • nvidia-docker2
    • docker.io
    • git
    • curl
    • wget
  • 项目目录:/opt/HunyuanVideo

支持的分辨率:

分辨率 9:16 16:9 4:3 3:4 1:1
540p 544×960×129 960×544×129 624×832×129 832×624×129 720×720×129
720p (推荐) 720×1280×129 1280×720×129 1104×832×129 832×1104×129 960×960×129

部署后开始使用 HunyuanVideo

付款后,将向注册时提供的电子邮件地址发送通知,表明服务器已准备好使用。通知中将包含 VPS IP 地址和登录凭据。我们的客户通过 服务器管理面板和 APIInvapi 来管理设备。

通过 webpanel 标签中的链接访问时,将打开登录窗口。

登录信息可以在服务器管理面板的 Configuration >> Tags 部分找到,也可以在服务器部署时发送的电子邮件中找到:

  • HunyuanVideo 管理界面(带 Web UI)的链接:在 webpanel 标签中;
  • 登录名root - 用于管理员;
  • 密码:在电子邮件中提供。

备注

有关使用 HunyuanVideo 的详细信息,请参阅 官方项目文档

通过 API 订购带有 HunyuanVideo 的服务器

question_mark
Is there anything I can help you with?
question_mark
AI Assistant ×