感谢IT之家网友 Diixx、咩咩洋 的线索投递!
该媒体披露的内部邮件、电子邮件、Slack 对话以及相关文件显示,英伟达从 YouTube 等多个来源收集视频素材,用于扩充训练 AI 的数据集。
该媒体披露的对话显示参与该项目的员工曾提出质疑,认为擅自使用 YouTube 视频以及研究目的编译的数据集,在法律层面可能会存在问题。
不过项目经理的回复是,这种收集模式已经获得了公司最高层的许可,可以使用这些内容训练 AI,并认为“完全符合版权法的文字描述和精神”。
一位英伟达员工透露,公司要求员工收集 YouTube、Netflix 等视频源的视频,用于训练英伟达的 Omniverse 3D 生成器、自动驾驶系统和“数字人类”(Digital Human)产品。
IT之家援引该媒体报道,该项目内部称其为 Cosmos 项目,为了规避 YouTube 的检测,英伟达使用具有轮换 IP 地址的虚拟机下载内容以避免被封禁。
英伟达员工写到:“我们在使用 AWS ,重新启动实例会分配一个新的公共 IP,所以到目前为止这不是问题。”
相关阅读:
-
《科技巨头被曝未经授权用 YouTube 内容训练 AI,苹果、英伟达在列》
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
未经允许不得转载:新聚网 » 英伟达被曝未经许可抓取 YouTube、Netflix 平台视频用于训练 AI

新聚网
哈佛大学开源 AI 训练数据集“Institutional Books 1.0”,涵盖馆藏 98.3 万本图书
Android XR 智能眼镜 XREAL Project Aura 重要参数公布:双芯驱动,70+° FoV
全球首个儿科大模型在北京荣华医院落地,诊断准确率优于主治医师平均水平
小米米家前开盖旅行箱 18 英寸开启众筹,369 元
共建韩国最大 AI 数据中心、容纳 6 万个 GPU,亚马逊 AWS 与 SK 集团合作
OpenAI Codex 人工智能编程工具推出新功能:可一次生成多个方案
性能提升 90%,Anthropic 首次公开多智能体系统构建全流程





