感谢IT之家网友 乌蝇哥的左手、lemon_meta 的线索投递!
三名作者 Brian Keene、Abdi Nazemian 和 Stewart O’Nan 声称,自己的作品被收录在一个包含约 196640 本书籍的数据集内,这些书籍帮助训练 NeMo 模拟普通书面语言,但这个数据集因“被举报侵犯版权”在去年 10 月被撤下。(IT之家注:该数据集原本被托管在 Hugging Face 网站上)
作者们在 3 月 8 日晚提交给旧金山联邦法院的一份集体诉讼提案中表示,英伟达“承认”其在该数据集上训练了 NeMo,侵犯了他们的版权。
报道称,NeMo 平台的大语言模型在过去三年中,训练工作受益于这些受版权保护的作品。诉讼涉及的作品包括三名作者在 2008 年、2019 年、2007 年出版的长篇小说,包含在一个名为“The Pile”的数据中,这一数据集又包含名为“Books3”的书籍合集。
当前科技公司在训练模型时使用受版权保护内容的诉讼案与日俱增,在此之前,《纽约时报》起诉微软及其合作方 OpenAI 未经许可使用其文章训练大型语言模型,并指控其侵犯版权。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
未经允许不得转载:新聚网 » 因使用受版权保护书籍训练 AI 平台,英伟达被三名作者起诉

新聚网
哈佛大学开源 AI 训练数据集“Institutional Books 1.0”,涵盖馆藏 98.3 万本图书
Android XR 智能眼镜 XREAL Project Aura 重要参数公布:双芯驱动,70+° FoV
全球首个儿科大模型在北京荣华医院落地,诊断准确率优于主治医师平均水平
小米米家前开盖旅行箱 18 英寸开启众筹,369 元
共建韩国最大 AI 数据中心、容纳 6 万个 GPU,亚马逊 AWS 与 SK 集团合作
OpenAI Codex 人工智能编程工具推出新功能:可一次生成多个方案
性能提升 90%,Anthropic 首次公开多智能体系统构建全流程





