OpenAI、谷歌双标玩得溜:训练大模型用他人数据,却决不允许自身数据外流 热资讯
编辑:杜伟、梓文
(资料图片仅供参考)
你的就是我的,我的还是我的。
在生成式 AI 盛行的全新时代,大型科技公司在使用在线内容时正在奉行「照我说的做,而不是做我所做的」策略。在一定程度上,这种策略可以说是一种双标以及话语权的滥用。
同时,随着大语言模型(LLM)成为 AI 发展的主流趋势,无论是大型还是初创公司,都在不遗余力地开发自己的大模型。其中训练数据是大模型能力好坏的重要前提。
近日,根据 Insider 的报道,微软支持的 OpenAI、谷歌及其支持的 Anthropic 多年来一直在使用其他网站或公司的在线内容来训练他们的生成式 AI 模型。这些都是在没有征求具体许可的情况下完成的,并将构成一场酝酿中的法律斗争的一部分,决定了网络的未来以及版权法在这一新时代的应用方式。
这些大型科技公司可能会争辩说他们是合理使用,是否真的如此有待商榷。但是他们却不会让自己的内容被用来训练其他 AI 模型。所以不禁要问,为什么这些大型科技公司却能在训练大模型时使用其他公司的在线内容呢?
这些公司很聪明,但也非常虚伪
大型科技公司使用他人在线内容却不允许他人使用自己的,这种说法是否有确切证据,这可以从他们一些产品的服务和使用条款中看出端倪。
首先来看 Claude,它是 Anthropic 推出的类似于 ChatGPT 的 AI 助手。该系统可以完成摘要总结、搜索、协助创作、问答、编码等任务。前段时间再次升级,将上下文 token 扩展到了 100k,处理速度大大加快。
Claude 的服务条款是这样的。你不得以下列方式(这里列举出部分)访问或使用本服务,如果这些限制的任何一项与可接受使用政策不一致或不明确,则以后者依从为先:
开发与我们的服务竞争的任何产品或服务,包括开发或训练任何 AI 或机器学习算法或模型
未经条款允许,从我们的服务中抓取、爬取或以任何其他方式获取数据或信息
Claude 服务条款地址:/s/9f502c93-cb5c-4571-b205-1e479da61794/#terms
同样地,谷歌的生成式 AI 使用条款也是如此,「你不得使用本服务来开发机器学习模型或相关技术。」
谷歌生成式 AI 使用条款地址:/terms/generative-ai
OpenAI 的使用条款又怎样呢?与谷歌类似,「你不得使用本服务的输出来开发与 OpenAI 竞争的模型。」
OpenAI 使用条款地址:/policies/terms-of-use
这些公司很聪明,他们知道高质量的内容对于训练新的 AI 模型至关重要,所以不允许别人用这样的方式使用他们的输出也是合情合理的。但他们却无所顾忌地利用他人数据来训练自己的模型,这又该如何解释呢?
目前,OpenAI、谷歌和 Anthropic 拒绝了 Insider 的置评请求,并且没有做出任何回应。
Reddit、推特和其他公司:受够了
实际上,其他公司意识到正在发生的事情时并不高兴。今年 4 月,多年来一直被用于 AI 模型训练的 Reddit 计划开始对其数据的访问收费。
Reddit 首席执行官 Steve Huffman 表示,「Reddit 的数据语料库非常有价值,因此我们不能把这些价值免费提供给世界上最大的公司。」
同样今年 4 月,马斯克指责 OpenAI 的主要支持者微软非法使用 Twitter 的数据来训练 AI 模型。「诉讼时间到」,他在推特上写道。
不过在回复 Insider 的置评时,微软表示「这个前提有太多的错误,我甚至不知道从何说起。」
OpenAI 首席执行官 Sam Altman 试图通过探索尊重版权的全新 AI 模型来深化这个问题。据 Axios 报道,他于近期表示,「我们正在尝试开发新的模式,如果 AI 系统使用了你的内容,或者使用了你的风格,你就会因此获得报酬。」
Sam Altman
出版商(包括 Insider)都会是既得利益获得者。此外,包括美国新闻集团在内的一些出版商已经在推动科技公司付费使用其内容训练 AI 模型。
目前 AI 模型的训练方式「打破」了网络
有前微软高管表示这一定有问题。微软老将、著名软件开发者 Steven Sinofsky 认为,目前 AI 模型的训练方式「打破」了网络。
Steven Sinofsky
他在推特上写道,「过去,爬取数据是用来换取点击率的。但现在只是用来训练一个模型,没有给创作者、版权所有者带来任何价值。」
也许,随着更多公司的觉醒,生成式 AI 时代这一不均衡的数据使用方式会很快被改变。
原文链接:/openai-google-anthropic-ai-training-models-content-data-use-2023-6
©THE END
转载请联系本公众号获得授权
投稿或寻求报道:content@
关键词:
您可能也感兴趣:
今日热点
为您推荐
资讯:硅兔首发|前苹果、特斯拉高管推出下一代智能电动房车Pebble,获千万美元融资
天天热文:东阳光:控股子公司狮溪煤业取得采矿许可证
华熙生物: 截至2023年6月20日,公司股东人数为42,215户
排行
最近更新
- OpenAI、谷歌双标玩得溜:训练大模型用他人数据,却决不允许...
- 918套!鄂尔多斯这里的保障性住房在建项目最新进展→
- 端午假期首日北京全市公园共接待游客98万人次_天天微速讯
- 据说这是大观园的原型?解锁恭王府游玩彩蛋 | 夜叉探馆 世...
- 北京市2023年养老金上调方案及补发时间最新消息 北京市养老...
- “爱上美术馆”回归!暑期青少年美育成长计划启动
- 猪油和猪肉哪个含铁高?|当前热文
- 长坡社区:又到粽味飘香时,“廉粽”文化庆端午_每日精选
- 供应不足导致仿制品泛滥 诺和诺德(NVO.US)起诉涉嫌销售盗版...
- 英镑/美元今日货币走势分析(2023年6月21日)|最新快讯
- 环球速讯:“3小时高铁圈”,“圈”出几多精彩?
- 银行六日办理业务吗
- 国家外汇管理局局长潘功胜会见淡马锡董事长林文兴
- 高考成绩是怎么得来的?_当前关注
- 辽宁队考察第四外援,徐杰要和朱芳雨打拳击,高诗岩签约三年...
- 花呗无力偿还怎么处理?慢慢还可以吗?-世界新要闻
- 基金最新调研公司名单曝光 环球报道
- 世界冠军马龙牵手顾家家居,赋能“一体化整家”战略转型-环球...
- 稳增长政策措施陆续推出 下半年经济企稳回升可期
- 全球滚动:石榴快播|第十三届“喀交会”与“文博会首届新疆展...
- 每日快看:怎样删除c盘的垃圾文件win7(怎样删除c盘的垃圾文件)
- 市州观察丨甘孜县实现“病理诊断不出县”-天天速看
- 天天实时:红楼梦重阳节礼物,5楼6楼吃菊花的寓意和说法?
- 最近肠胃不好吃什么_当前热议
- 1.投资虚拟币如果赚了钱。2.第二个环节一般渠道是通过交易所...
- 千纸鹤寓意什么意思
- 6月中旬开始,运势抽中上上签的3大生肖,事业高升桃花盛开,...
- 全球观天下!周末,微风徐徐,潇洒放手,泪眼朦胧,步入婚姻...
- 世界最资讯丨只要冷战,就意味着你永远失去的星座
- 世界视讯!古蒂:对姆巴佩来说,他是时候表明自己想来皇马了
今日要闻
- 陵水综合行政执法局举办专题培训班|全球热点评
- 【高端访谈】确保农民工工资争议案件优先受理、快调速裁——人力资源社会保障部调解仲裁管理司负责人谈速裁庭建设专项行动_通讯
- “四季‘焉’火 燃情‘耆’航”红酒烧烤音乐节举办 世界时讯
- 车险违规“冲规模” 监管出手遏制恶性竞争苗头
- 【全球独家】河南高考后近视手术量“井喷” 选择“摘镜”这些细节要注意
- 当前简讯:纵横股份(688070):持股5%以上股东减持股份进展公告
- 天天观点:戴黄金手镯有什么好处
- 周迅离婚后首度接受采访,离婚对她的影响大吗? 每日快报
- 进入第三年的“沪惠保”,可持续性会有变化吗?首席承保这么回应_焦点热议
- 天天新消息丨热度不减!南京成端午假期热门目的地,订单量同比增长956%