邪修AI用2396部黄片训练,要被罚25亿!

AI界的泥石流来了
你用的 AI,很有可能「不干净」了。

互联网的奇葩事总是能刷新人类对科技公司下限的想象力。
最近,Meta(原来的Facebook)被指控做了一件最尴尬的 AI 训练操作:用 2396 部成人电影来喂养自家的大模型。
图片
是的,你没看错。AI 界的巨头,居然靠着「片库」给模型打基础。
事情是这样的,两家成人内容公司 Strike 3 Holdings 和 Counterlife Media 最近在美国加州联邦法院把 Meta 告了。
lawsuit meta
指控 Meta 从 2018 年起,就通过盗版下载它们公司付费内容 2396 部用于训练 AI 模型,其中包括视频生成类模型 Meta Movie Gen 和大语言模型 LLaMA。
图片
重点是 Meta 不单单是自己用,还做种分享,累计分发下载超过了 10 万次,把「互联网精神贯彻到位。
图片
让人绷不住的是,两家对 Meta 提起律师函后,后者还是没关闭 BT 链接,仍然在继续分发。(好人一生平安)
图片
所以两家成人公司要了波大的赔偿。
按美国的版权法中的故意侵权来算,每部作品最高索赔 15 万美元,所以总计合起来就是 3.59 亿美元(约合人民币 25 亿元)。
图片
看到这可能有同学疑惑了,网上资源那么多,为啥要用成人电影训练呢?
Strike 3 Holdings在诉状里解释了这个问题;
图片
都是法务的话术,中译中的意思是它们的内容很高清、整个故事富有逻辑、表情自然、人物对话连贯、场景和人物变动非常少。
相较于网上良莠不齐的视频内容,高素质的「学习资料」对于 AI 来说是最好的「黄金饲料」,特别是视频生成类的 AI 模型。
图片
Meta 之所以敢这么干还有两个最重要的原因:下载途径非常好获取以及成人内容维护版权的难度还是比较高的。
不过这回 Meta 算是碰到刺头了,Strike 3 Holdings 就是最爱维权的那个成人公司,为此还专门开发了自己的「VXN Scan」追踪系统。
图片
从 2017 年到 2023 年,它就对这类型的侵权提起了 9500 多次诉讼,也就是说,基本每天都在打官司,并且依靠这个模式达到每年数千万美元的「维权费」收入。
目前 Meta 已经承认侵权了,不过阿红估摸着可能会庭外调解砍砍价把「车票钱」给补了。
图片
但赔钱只是一个方面,更大的问题是形象。一个全球科技巨头,被指控「偷偷下片训练 AI,就算最后能摆平这次事件,想洗白也很难。
大家能想象股东大会上,投资人问扎克伯格:咱们 AI 的核心竞争力是什么?扎克伯格甩出一句:「你懂的」的场面吗?
图片
而且盗版这事儿 Meta 已经不是第一次干了。
在 2023 年 Meta 就被指控用盗版网站的书来训练自己的大语言模型,还被自家的员工吐槽,虽然最终这件案子法院判Meta胜出,不过法院也不支持 Meta 的做法。
图片
同时盗版侵权这种事儿在 AI 圈已经屡见不鲜了:
AI 巨头 OPEN AI 和微软也在 2023 年被起诉盗用书籍和网站文章来训练 AI。
图片
然后就是浓眉大眼的苹果和 NVIDIA 也同样被曝出无授权使用 YouTube 上的视频进行 AI 训练。
图片
最后还有 Google,手握 YouTube 这么大一张牌,有多少内容用来训练 AI 咱们也不得而知。
最终大多都是司法赔偿或者调解给钱。
所以,AI训练这行「先上车,后补票」几乎都成为行业共识了。
图片
不过这次Meta被抓的现行要给同行们敲个警钟,赔钱可能可以解决一时的麻烦,但名声臭了,那就真的玩完了。
数据来源:wired、apnews、torrentfreak,图源网络。


本文编辑:@ 阿红

©本文著作权归电手所有,未经电手许可,不得转载使用。