“卖铲人”也坐不住了！英伟达发布视频AI大模型论文有望深度赋能自动驾驶

2023-04-21 09:27:22|发布者：dr**忧伤

Aa 小中大

　　近日，英伟达与慕尼黑大学等院校的研究人员联合发布了一篇有关视频潜在扩散模型（VideoLDM，Latent Diffusion Model）的论文，该模型能够将文本转换成视频，实现高分辨率的长视频合成。相关论文已经发表在预印本网站arXiv上。

　　研究人员给出“一个泰迪熊正在弹电吉他、高清、4K”等文本提示词后，运用VideoLDM，成功生成了相关视频（已转为GIF格式）：

　　目前，VideoLDM生成视频的最高分辨率可达2048×1280、24帧。研究团队仅公布了论文和一些成品视频案例，暂未开放试用。

报告网所有产经新闻是由用户上传分享，未经用户书面授权，请勿作商用！

“卖铲人”也坐不住了！英伟达发布视频AI大模型论文 有望深度赋能自动驾驶