英伟达推出VideoLDM 根据文本可生成4.7秒视频
时间:2023-04-20浏览:884
英伟达和康奈尔大学的研究团队合作,近日推出了名为VideoLDM模型,可以根据文本描述,自动生成最高分辨率2048*1280、24帧、最长4.7秒的视频。英伟达表示该模型配有41亿个参数,其中27亿个经过视频训练,这符合现代生成式AI的标准。英伟达表示通过高效的潜在扩散模型(LDM),能够创建多样化、高质量、高清晰度的视频。
该模型还能创建驾驶场景的视频,视频分辨率为1024×512像素,最长5分钟。英伟达表示目前该项目处于研究阶段,暂时不会向公众开放。
所有文章未经授权禁止转载、摘编、复制或建立镜像,违规转载法律必究。
举报邮箱:3031084316@qq.com