“卖铲人”也坐不住了!英伟达发布视频AI大模型论文 有望深度赋能自动驾驶

Aa
分享到:

  近日,英伟达与慕尼黑大学等院校的研究人员联合发布了一篇有关视频潜在扩散模型(VideoLDM,Latent Diffusion Model)的论文,该模型能够将文本转换成视频,实现高分辨率的长视频合成。相关论文已经发表在预印本网站arXiv上。

  研究人员给出“一个泰迪熊正在弹电吉他、高清、4K”等文本提示词后,运用VideoLDM,成功生成了相关视频(已转为GIF格式):

  目前,VideoLDM生成视频的最高分辨率可达2048×1280、24帧。研究团队仅公布了论文和一些成品视频案例,暂未开放试用。

视频相关推荐

视频推荐资讯

视频相关资讯

推荐报告

相关图表