Meta正在使用人工智能从几个字生成视频
时间:2022-10-05 07:01
人工智能在根据少量文字生成图像方面正变得越来越好,公开可用的AI图像生成器如DALL-E 2和Stable Diffusion。现在,元数据研究人员将人工智能进一步推进:他们利用人工智能根据文本提示合成视频。
meta首席执行官马克·扎克伯格周四在Facebook上发布了一段20秒的视频,介绍了这项名为making - a - video的研究,其中汇集了meta研究人员使用的几个文本提示和生成的(非常短的)视频。这些提示包括“一只泰迪熊在画自画像”,“一艘宇宙飞船在火星上着陆”,“一只戴着针织帽子的树懒宝宝试图弄清楚笔记本电脑的位置”,以及“一个机器人在海洋中冲浪”。
每个提示的视频只有几秒钟长,它们通常以相当低的分辨率和有点不稳定的风格展示提示所暗示的内容(除了树懒宝宝,它看起来不太像真实的生物)。即便如此,它也展示了人工智能研究的一个新方向,因为系统越来越擅长从文字生成图像。然而,如果这项技术最终得到广泛应用,它将引发许多与文本转图像系统同样的担忧,比如它可能被用来通过视频传播错误信息。
Make-A-Video的网页上包含了这些短视频和其他视频,其中一些看起来相当逼真,如响应提示“小丑鱼游过珊瑚礁”或“一对年轻夫妇在大雨中散步”而制作的视频。
扎克伯格在他的脸书帖子中指出,从少量文字生成动态图像是多么棘手。

这家伙正在用人工智能拍电影——你可以帮助决定接下来会发生什么
他写道:“生成视频比生成照片要困难得多,因为除了正确生成每个像素外,系统还必须预测它们将如何随时间变化。”
一篇描述这项工作的研究论文解释说,该项目使用一个文本到图像的人工智能模型来找出文字与图片的对应关系,并使用一种被称为无监督学习的人工智能技术来查看视频,并确定真实的运动是什么样子的。在这种技术中,算法仔细研究没有标记的数据,以识别其中的模式。
与大量流行的从文本生成图像的人工智能系统一样,研究人员指出,他们的文本到图像的人工智能模型是根据互联网数据训练的,这意味着它学习了“并可能夸大了社会偏见,包括有害的偏见,”研究人员写道。他们确实指出,他们过滤了数据中的“NSFW内容和有毒词汇”,但由于数据集可能包括数百万张图片和文本,可能不可能删除所有这类内容。
扎克伯格写道,元计划在未来以演示的形式分享Make-A-Video项目。
为您推荐:
- 在日本买房需要什么手续和条件? 2022-10-05
- 请问日本买房需要什么手续? 2022-10-05
- 请问日本农村也有房产税吗 2022-10-05
- 请问去日本旅游办签证,需要提供房产证,但是只有购房合同,可以办理吗,因为房产证还没下来! 2022-10-05
- 请问2015去日本打工怎样普通工作?工资多少?除去吃喝穿和中介费能剩多少? 2022-10-05
- 现在在日本买房需要什么手续? 2022-10-05
