HunyuanVideo¶
在这篇文章中
关于产品
HunyuanVideo 是由腾讯开发的视频生成模型。该系统利用人工智能算法将文本描述转换为视频。其架构基于 Transformer 和扩散模型。
HunyuanVideo 主要功能¶
- 文生视频生成 — 将文本描述转换为高质量的视频片段,具有高度的语义和视觉一致性;
- 图像与视频的统一架构 — 使用带有 Full Attention 机制的 Transformer 架构来生成图像和视频;
- 多模态文本编码器 (MLLM) — 通过使用预训练的多模态语言模型,提高了上下文理解和指令遵循能力;
- 3D VAE 压缩 — 使用 CausalConv3D 进行高效的像素空间压缩,以优化计算资源;
- 提示词重写 — 自动改进用户查询,以更准确地解释意图;
- 可扩展性 — 支持在单个 GPU 上运行,以及在多个 GPU 上进行并行推理以加速生成;
- 可定制参数 — 为创建视频的时长、风格、分辨率和其他特性提供灵活的设置;
- 开源代码 — 模型代码和权重对研究社区完全开放。
部署功能¶
| ID | 软件名称 | 兼容操作系统 | 虚拟机 | 物理机 | vGPU | GPU | 最低CPU(核) | 最低内存(GB) | 最低硬盘(GB) | 自定义域名 | 是否启用 |
|---|---|---|---|---|---|---|---|---|---|---|---|
| 257 | HunyuanVideo | Ubuntu 22.04 | - | + | + | + | 2 | 16 | 50 | 否 | 订购 |
- 安装时间:包括操作系统设置在内,需 15-30 分钟。
- 系统要求: 为了获得最佳性能,需要配备至少 80 GB 显存的 NVIDIA GPU。
- 预装依赖项:
- Python 3.9
- python3.9-venv(用于创建隔离 Python 环境的工具)
- python3.9-dev(开发用的头文件和库)
- python3-pip(Python 包管理器)
- NVIDIA 驱动程序
- nvidia-docker2
- docker.io
- git
- curl
- wget
- 项目目录:
/opt/HunyuanVideo。
支持的分辨率:
| 分辨率 | 9:16 | 16:9 | 4:3 | 3:4 | 1:1 |
|---|---|---|---|---|---|
| 540p | 544×960×129 | 960×544×129 | 624×832×129 | 832×624×129 | 720×720×129 |
| 720p (推荐) | 720×1280×129 | 1280×720×129 | 1104×832×129 | 832×1104×129 | 960×960×129 |
部署后开始使用 HunyuanVideo¶
付款后,将向注册时提供的电子邮件地址发送通知,表明服务器已准备好使用。通知中将包含 VPS IP 地址和登录凭据。我们的客户通过 服务器管理面板和 API — Invapi 来管理设备。
通过 webpanel 标签中的链接访问时,将打开登录窗口。
登录信息可以在服务器管理面板的 Configuration >> Tags 部分找到,也可以在服务器部署时发送的电子邮件中找到:
- HunyuanVideo 管理界面(带 Web UI)的链接:在 webpanel 标签中;
- 登录名:
root- 用于管理员; - 密码:在电子邮件中提供。
备注
有关使用 HunyuanVideo 的详细信息,请参阅 官方项目文档。