互联网的奇葩事总是能刷新人类对科技公司下限的想象力。最近,Meta(原来的Facebook)被指控做了一件最尴尬的 AI 训练操作:用 2396 部成人电影来喂养自家的大模型。是的,你没看错。AI 界的巨头,居然靠着「片库」给模型打基础。事情是这样的,两家成人内容公司 Strike 3 Holdings 和 Counterlife Media 最近在美国加州联邦法院把 Meta 告了。指控 Meta 从 2018 年起,就通过盗版下载它们公司付费内容 2396 部用于训练 AI 模型,其中包括视频生成类模型 Meta Movie Gen 和大语言模型 LLaMA。重点是 Meta 不单单是自己用,还做种分享,累计分发下载超过了 10 万次,把「互联网精神」贯彻到位。让人绷不住的是,两家对 Meta 提起律师函后,后者还是没关闭 BT 链接,仍然在继续分发。(好人一生平安)按美国的版权法中的故意侵权来算,每部作品最高索赔 15 万美元,所以总计合起来就是 3.59 亿美元(约合人民币 25 亿元)。看到这可能有同学疑惑了,网上资源那么多,为啥要用成人电影训练呢?Strike 3 Holdings在诉状里解释了这个问题;都是法务的话术,中译中的意思是它们的内容很高清、整个故事富有逻辑、表情自然、人物对话连贯、场景和人物变动非常少。相较于网上良莠不齐的视频内容,高素质的「学习资料」对于 AI 来说是最好的「黄金饲料」,特别是视频生成类的 AI 模型。Meta 之所以敢这么干还有两个最重要的原因:下载途径非常好获取以及成人内容维护版权的难度还是比较高的。不过这回 Meta 算是碰到刺头了,Strike 3 Holdings 就是最爱维权的那个成人公司,为此还专门开发了自己的「VXN Scan」追踪系统。从 2017 年到 2023 年,它就对这类型的侵权提起了 9500 多次诉讼,也就是说,基本每天都在打官司,并且依靠这个模式达到每年数千万美元的「维权费」收入。目前 Meta 已经承认侵权了,不过阿红估摸着可能会庭外调解砍砍价把「车票钱」给补了。但赔钱只是一个方面,更大的问题是形象。一个全球科技巨头,被指控「偷偷下片训练 AI」,就算最后能摆平这次事件,想洗白也很难。大家能想象股东大会上,投资人问扎克伯格:咱们 AI 的核心竞争力是什么?扎克伯格甩出一句:「你懂的」的场面吗?在 2023 年 Meta 就被指控用盗版网站的书来训练自己的大语言模型,还被自家的员工吐槽,虽然最终这件案子法院判Meta胜出,不过法院也不支持 Meta 的做法。AI 巨头 OPEN AI 和微软也在 2023 年被起诉盗用书籍和网站文章来训练 AI。然后就是浓眉大眼的苹果和 NVIDIA 也同样被曝出无授权使用 YouTube 上的视频进行 AI 训练。最后还有 Google,手握 YouTube 这么大一张牌,有多少内容用来训练 AI 咱们也不得而知。所以,AI训练这行「先上车,后补票」几乎都成为行业共识了。不过这次Meta被抓的现行要给同行们敲个警钟,赔钱可能可以解决一时的麻烦,但名声臭了,那就真的玩完了。数据来源:wired、apnews、torrentfreak,图源网络。
本文编辑:@ 阿红
©本文著作权归电手所有,未经电手许可,不得转载使用。