这些艺术家发现他们的作品被用来训练人工智能现在他们愤怒

时间:2022-11-02 13:47  

艾琳·汉森(Erin Hanson)花了多年的时间来开发充满活力的调色板和粗粗的笔触,这定义了她以生动的油画而闻名。但在最近一次对她的采访中,我向汉森展示了我尝试用几下键盘就能重现她的风格。

使用Stable Diffusion(一款流行的、公开的开源AI图像生成工具),我插入了一系列提示,按照她的一些绘画风格创建图像,这些绘画是海洋悬崖上的加利福尼亚罂粟花和露平的田野。

“那幅有紫色花朵和日落的画,”她看着我的一幅作品,通过Zoom说,“绝对像我的一幅画,你知道吗?”

在汉森的指导下,我又定制了另一个详细的提示:“水晶光的油画,艾琳·汉森的风格,光影,背光树,强烈的轮廓,彩色玻璃,现代印象派,获奖,ArtStation热门,生动,高清,高分辨率。”我给稳定扩散提供了提示;几秒钟内就产生了三幅图像。

“哦,哇,”当我们仔细研究结果时,她说,并指出其中一张图片中的树与她2021年的画作《水晶枫树》(crystal Maples)中的树多么相似。“我会把它挂在我的墙上,”她很快补充道。

An image created by CNN's Rachel Metz with input from artist Erin Hanson, using the AI platform Stable Diffusion. It resembles Hanson's work, particularly with its colors and simulated brush strokes.

这是CNN的Rachel Metz在艺术家Erin Hanson的输入下使用人工智能平台Stable Diffusion创作的图像。它很像汉森的作品,尤其是它的颜色和模拟笔触。

人工智能图像/稳定的扩散

居住在俄勒冈州麦克明维尔的汉森是众多职业艺术家中的一员,他们的作品被包含在训练Stable Diffusion的数据集中,该数据集由总部位于伦敦的Stability AI于8月发布。她是接受CNN商业频道采访的几位艺术家之一,他们对自己作品的照片在没有人通知、征求同意或付费的情况下被使用感到不满。

文本转图像的人工智能系统曾经只提供给特定的科技业内人士,现在正变得越来越受欢迎和强大。这些系统包括Stable Diffusion和DALL-E,前者是一家最近融资超过1亿美元的公司,后者迄今已融资10亿美元。

这些工具通常在收费前提供一些免费的积分,可以用几句话创造出各种各样的图像,包括那些明显能唤起很多很多艺术家作品的图像(如果不是由同一位艺术家创作的话)。用户可以用“以……的风格”或“以……的风格”等单词和特定的名字来调用这些艺术家。目前这些工具的用途可以从个人娱乐到更多的商业案例。

在短短几个月里,数以百万计的人涌向了文本到图像的人工智能系统,它们已经被用于制作实验电影、杂志封面和新闻报道的图片。最近,一个名为Midjourney的人工智能系统生成的图像在科罗拉多州博览会上赢得了一场艺术比赛,并在艺术家中引起了轩然大波。

"Crystalline Maples", a 2021 oil painting by Erin Hanson.

《水晶枫树》,艾琳·汉森2021年的油画作品。

礼貌艾琳·汉森

但当像汉森这样的艺术家发现他们的作品正在被用来训练人工智能时,这引发了一个更根本的担忧:他们自己的艺术实际上正在被用来训练一个电脑程序,而这个程序有一天可能会影响他们的生计。任何使用Stable Diffusion或DALL-E等系统生成图像的人都可以出售这些图像(关于这些图像的版权和所有权的具体条款各不相同)。

“我根本不想参与到这台会让我的工作变得廉价的机器中,”插画师兼印刷师丹尼尔·丹吉尔(Daniel Danger)说,他得知自己的许多作品被用来训练稳定扩散(Stable Diffusion)。

当艺术变成数据

这些机器远非神奇。要让这些系统吸收你的话语并生成图像,它必须接受海量数据的训练,其中可能包括从互联网上抓取的数十亿张图像,以及书面描述。

包括OpenAI的dal - e系统在内的一些服务并不公开其AI系统背后的数据集。但有了稳定扩散技术,稳定AI的起源就很清楚了。它的核心数据集是从互联网上更大规模的图像和文本缓存中筛选出来的图像和文本对。被称为LAION- 5b的全尺寸数据集是由德国人工智能非营利组织LAION创建的,LAION是“大规模人工智能开放网络”的缩写。

这种从互联网上抓取图像或其他内容用于数据集培训的做法并不新鲜,传统上属于所谓的“合理使用”——这是美国版权法的法律原则,允许在某些情况下使用受版权保护的作品。这是因为这些图像,其中许多可能是有版权的,正被用于非常不同的方式,如训练计算机识别猫。

但数据集正变得越来越大,训练出越来越强大的人工智能系统,包括最近的生成式人工智能系统,任何人都可以用它在瞬间生成好看的图像。

A piece by illustrator Daniel Danger that was included in the training data behind the Stable Diffusion AI image generator.

插画家丹尼尔·丹吉尔的作品,包含在稳定扩散AI图像生成器背后的训练数据中。

由丹尼尔危险

一些工具允许任何人搜索LAION-5B数据集,越来越多的专业艺术家发现他们的作品是其中的一部分。其中一个由作家兼技术专家安迪·拜奥和程序员西蒙·威尔逊开发的搜索工具非常突出。虽然它只能用于搜索Stable Diffusion训练数据的一小部分(超过1200万张图像),但它的创建者分析了其中的艺术图像,并确定,在作品被展示的前25位艺术家中,汉森是仅剩的三位在世的艺术家之一。在他们的小样本中,他们发现了3854幅她的艺术作品。

Stability AI创始人兼首席执行官Emad Mostaque通过电子邮件告诉CNN Business,艺术只是Stable Diffusion背后LAION训练数据的一小部分。他说:“美术只占数据集的不到0.1%,只有在用户有意调用时才会创建。”

但对一些艺术家来说,这只是微不足道的安慰。

愤怒的艺术家

Danger的作品包括Phish和Primus等乐队的海报,他是告诉CNN Business的几位专业艺术家之一,他们担心人工智能图像生成器可能威胁到他们的生计。

他担心,人们用人工智能图像生成器生成的图像可能会取代他一些更“实用”的作品,包括书籍封面和在线发表文章的插图等媒体作品。

“当我们可以免费从1000张(图片)中挑选时,我们为什么要向艺术家支付1000美元?”他问道。“人们很便宜。”

meta AI text to video

礼貌我 助教

meta使用人工智能从几个单词生成视频

匹兹堡艺术家塔拉·麦克弗森(Tara McPherson)的作品出现在玩具、服装和奥斯卡获奖影片《朱诺》(Juno)等电影中,她也担心一些作品可能被人工智能抢走。她说,在她不知情的情况下,她的研究成果被收录到Stable Diffusion背后的数据集中,这让她感到失望和“占便宜”。

“这能有多容易?”这种艺术会变得多么优雅?”她问。“现在它有时有点不稳定,但这才刚刚开始。”

尽管这些担忧是真实的,但追索权却不明确。华盛顿大学的法学教授扎尔·赛义德表示,即使人工智能生成的图像具有广泛的影响——比如通过改变商业模式——也并不一定意味着它们侵犯了艺术家的版权。她说,在使用数据集中的每一张图像之前,都不能授权使用。

“你真的会对艺术团体感到非常同情,想要支持他们,但也会觉得,这是不可能的,”她说。“如果我们这么做,本质上就是在说机器学习是不可能的。”

麦克弗森和丹吉尔考虑过在他们的作品上贴上水印的可能性,以保护图片(或者至少让它们看起来不那么吸引人)。但麦克弗森说,当她看到艺术家朋友在他们的网上照片上涂上水印时,“这破坏了艺术,也破坏了人们看到它并从中找到灵感的快乐。”

丹格说,如果可以的话,他将从用于训练人工智能系统的数据集中删除他的图像。但是从数据集中删除艺术家作品的图片并不会阻止Stable Diffusion能够生成艺术家风格的图像。

01 Théatre D'opéra Spatial AI-generated art

Jason M. Allen提供

人工智能赢得了一场艺术比赛,艺术家们非常愤怒

首先,人工智能模型已经经过了训练。但正如Mostaque所说,由于OpenAI的CLIP模型,用户仍然可以调用特定的艺术风格,该模型被用于训练Stable Diffusion来理解文字和图像之间的联系。

LAION创始人克里斯托弗·舒曼(Christoph Schuhmann)通过电子邮件表示,他的团队认为,只有在AI模型的所有部分——可能有很多部分——都尊重这些选择的情况下,才能真正实现选择加入和退出数据集。

“单方面的同意处理方式在人工智能世界是不够的;我们需要一个跨行业的系统来处理这个问题。”

为艺术家提供更多的合作技术特点

合作伙伴Mathew Dryhurst和Holly Herndon是柏林的艺术家,在他们的合作作品中尝试人工智能,他们正在努力应对这些挑战。他们和另外两名合作者一起推出了Spawning,为艺术家们制作工具,希望能让他们更好地理解和控制他们的在线艺术作品如何在数据集中被使用。

今年9月,Spawning发布了一个搜索引擎,可以梳理LAION-5B数据集,名为haveibeentrained.com,并打算在未来几周提供一种方式,让人们选择退出或加入用于培训的数据集。德雷赫斯特说,在过去一个月左右的时间里,他一直在与培训大型人工智能模型的机构会面。他想让他们同意,如果Spawning收集了不想被收录的艺术家的作品列表,他们将尊重这些请求。

德雷赫斯特表示,Spawning的目标是明确共识数据收集对每个人都有好处。穆斯塔克同意,人们应该能够选择退出。他在接受CNN Business采访时表示,Stability AI正在与众多团体合作,希望未来“社区能够更多地控制数据库内容”。在9月份的一个推特帖子中,他说Stability愿意为人们选择退出数据集的方式做出贡献,“比如通过支持赫恩登在这方面的工作和未来的许多其他项目。”

Tara McPherson's "The Wanderers" is one of her works that was included in the dataset underpinning Stable Diffusion.

塔拉·麦克弗森(Tara McPherson)的《流浪者》(The Wanderers)是她的作品之一,被收录在支持稳定扩散的数据集中。

礼貌塔拉麦克弗森

他在给CNN Business的一封电子邮件中说:“我个人理解围绕这个系统的情绪,因为系统变得足够智能,可以理解风格。”

舒曼表示,LAION还在与“各种团体”合作,研究如何让人们选择是否将自己的图像包含在训练的文本到图像AI模型中。舒曼说:“我们非常重视艺术家的感受和关注。”

对于Hanson来说,她并不介意自己的艺术作品被用于训练AI,但她希望获得报酬。她说,如果用训练过的人工智能系统制作的图像被出售,艺术家需要得到补偿,即使是“几分钱”。

这可能即将到来。穆斯塔克表示,Stability AI正在研究如何“从他们的工作中获得奖励”,特别是在Stability AI自己发布AI模型,而不是使用别人构建的模型的情况下。他说,该公司将很快宣布一项计划,就实现这一目标的“实用方法”获取社区反馈。

理论上讲,我可能最终会欠汉森一些钱。自从我们设计了这个“水晶光”提示,我已经在“稳定扩散”上运行过很多次了,次数太多了,以至于我的笔记本电脑上到处都是各种色调的树木,彩虹般的阳光透过树枝照射到下面的地面。就像拥有了自己定制的汉森画廊。

 
本文版权遵从外房网免责声明,更多问题请发送邮件至:
sam@glofang.com
12小时在线QQ客服
周一至周日 9:00-21:00

广告联系

邮箱:glofang@glofang.com