当前位置：新聚网 > 科技 > 智能之家 > 正文

英伟达推出 VideoLDM，根据文本可生成 4.7 秒视频

新聚网发布于 2023-04-20
分类：智能之家
阅读(78)

英伟达推出 VideoLDM，根据文本可生成 4.7 秒视频

英伟达表示该模型配有 41 亿个参数，其中 27 亿个经过视频训练，这符合现代生成式 AI 的标准。IT之家从博文中获悉，英伟达表示通过高效的潜在扩散模型（LDM），能够创建多样化、高质量、高清晰度的视频。

英伟达推出 VideoLDM，根据文本可生成 4.7 秒视频

该模型还能创建驾驶场景的视频，视频分辨率为 1024 × 512 像素，最长 5 分钟。英伟达表示目前该项目处于研究阶段，暂时不会向公众开放。

详细报告可以访问：https://research.nvidia.com/labs/toronto-ai/VideoLDM/

未经允许不得转载：新聚网 » 英伟达推出 VideoLDM，根据文本可生成 4.7 秒视频

作者：新聚网

相关推荐