当前位置: 首页 » 资讯 » 科技头条 » 正文

AI 数据版权新纪元:Real Simple Licensing 协议引发行业关注

IP属地 中国·北京 编辑:江紫萱 Chinaz 时间:2025-09-11 18:35:50

随着人工智能(AI)行业面临日益严峻的版权问题,尤其是在 Anthropic 与版权方达成15亿美元和解后,许多企业开始重视其训练数据的合法性。目前,有多达40起未授权数据使用的诉讼案正在进行中,其中包括一起因 Midjourney 制作超人形象而被起诉的案件。

在没有有效的授权体系的情况下,AI 公司可能面临大规模的版权诉讼,这让行业前景堪忧。为了应对这一挑战,一群技术专家和网络出版商联合推出了一项名为 Real Simple Licensing(RSL)的新系统,旨在实现大规模的数据授权。该系统已经得到了 Reddit、Quora 和 Yahoo 等大型网络出版商的支持,但行业内能否形成合力,吸引主要的 AI 实验室参与仍然是个未知数。

RSL 的联合创始人 Eckart Walther 表示,他们的目标是创建一个可以在互联网上广泛应用的训练数据授权体系。他指出,“我们需要为互联网提供机器可读的许可协议,而 RSL 正是解决这一问题的工具。”

多年来,诸如数据提供者联盟等组织一直在推动更清晰的数据采集实践,但 RSL 是第一个旨在提供实际技术和法律基础设施的尝试。技术上,RSL 协议定义了出版商可以为其内容设定的具体许可条款,这包括 AI 公司是否需要定制许可或采用知识共享(Creative Commons)条款。参与的网页将把条款纳入其 “robots.txt” 文件,以便轻松识别哪些数据受哪些条款保护。

在法律层面,RSL 团队建立了一个名为 RSL Collective 的集体许可组织,旨在为出版商谈判条款并收取版税,类似于音乐行业的 ASCAP 或电影行业的 MPLC。目前,已经有许多知名出版商加入了这一集体,包括 Yahoo、Reddit 和 Medium 等。

尽管如此,确定 AI 模型具体使用哪些训练数据以计算版税的挑战依然存在。对于实时获取网络数据的产品,如谷歌的 AI 搜索摘要,数据使用的追踪相对简单,但如果训练过程未被记录,确认特定文档是否被某个大语言模型(LLM)使用就变得困难重重。

尽管存在这些挑战,RSL 的创建者们相信 AI 公司能够应对。“他们在之前的某些授权协议中已经需要能够报告数据使用情况,因此这并不是不可能的,”RSL 的另一位联合创始人 Doug Leeds 表示。“只要足够好,就能让人们得到应有的报酬。”

最后,RSL 的未来能否成功,关键在于 AI 公司是否愿意接受这一新体系。随着越来越多的 AI 行业领袖呼吁建立这样的系统,RSL 团队希望他们能够信守承诺。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。