7月17日消息,据媒体报道,包括NVIDIA、苹果、Salesforce和Anthropic在内的多家科技巨头,被曝光涉嫌违规使用数据,用于训练其AI模型。
这些公司被发现使用了超过173536个YouTube视频的字幕数据,而这些数据的获取并未得到视频创作者的许可。
这些公司所使用的数据集名为“YouTube Subtitles”,由非营利组织EleutherAI创建,该数据集包含了来自超过48000个频道的视频文本。
其中不乏知名教育机构和媒体公司的内容,例如可汗学院、麻省理工学院、哈佛大学等,此外,一些广受欢迎的YouTube创作者,如MrBeast等的视频也被包括在内。
此前,EleutherAI发布了名为“Pile”的数据汇编,其中的大部分数据集都是对公众开放的,包括YouTube Subtitles。
不过值得注意的是,苹果在使用Pile数据集训练OpenELM模型时,并未直接下载数据,因此在技术层面上,是EleutherAI违反了YouTube的使用条款。
YouTube明确禁止未经授权从平台获取素材,同时这些数据不仅用于训练AI,还可能涉及到版权和隐私问题。
创作者们也对此表示震惊和不满,因为他们并未被告知自己的作品被用于商业目的,更遑论从中获得任何补偿。
发布日期: 2024-08-22
发布日期: 2024-09-06
发布日期: 2024-11-08
发布日期: 2024-04-18
发布日期: 2024-02-18
发布日期: 2024-04-30
发布日期: 2024-07-03
发布日期: 2024-04-08
发布日期: 2024-12-20
发布日期: 2024-12-20
发布日期: 2024-12-20
发布日期: 2024-12-20
发布日期: 2024-12-20
寻找更多销售、技术和解决方案的信息?
广州绿测电子科技有限公司(简称:绿测科技)成立于2015年11月,是一家专注于耕耘测试与测量行业的技术开发公司。绿测科技以“工程师的测试管家”的理念向广大客户提供专业的管家服务。绿测科技的研发部及工厂设立于广州番禺区,随着公司业务的发展,先后在广西南宁、深圳、广州南沙、香港等地设立了机构。绿测科技经过深耕测试与测量领域多年,组建了一支经验丰富的团队,可为广大客户提供品质过硬的产品及测试技术服务等支持。
技术工程师
销售经理
020-22042442
广东公司:冯经理
020-2204 2442-9-822
广西公司:何经理
020-2204 2442-9-880