OpenAI、谷歌双标玩得溜：训练大模型用他人数据，却决不允许自身数据外流今年618，注定是试剂小米14 定档双十一，安卓旗舰与iPhone终有一战跑偏一定是四轮定位问题吗？NVIDIA推送536.09驱动更新：闪屏问题获得修复QQ音乐豪华绿钻续费价格上调：连续包年158元你续费吗？苹果语音助手功能将重大升级：Hey Siri成历史产品经理的瓶颈：设计私域运营工具做用户增长特斯拉Model S/X最新动态引荐给7000元/购车增权益3个月独立画3DS MAX 自带电脑上班不合格就“充公”？公司回应每年全球收专利费12亿美元！华为连续5年中国申请专利领先 5G必要专利全球第一最多领1600元！北京发放新一批消费券：手机、电脑等都能用电影《亲爱的》原型杜小华河南寻子DNA鉴定结果比对失败Rays TE37 Ultra M-SPEC，F8X M3/4 古铜色现货买特斯拉一定要找人介绍！特斯拉限时福利：7千元+3年超充

OpenAI、谷歌双标玩得溜：训练大模型用他人数据，却决不允许自身数据外流今年618，注定是试剂小米14 定档双十一，安卓旗舰与iPhone终有一战跑偏一定是四轮定位问题吗？NVIDIA推送536.09驱动更新：闪屏问题获得修复QQ音乐豪华绿钻续费价格上调：连续包年158元你续费吗？苹果语音助手功能将重大升级：Hey Siri成历史产品经理的瓶颈：设计私域运营工具做用户增长特斯拉Model S/X最新动态引荐给7000元/购车增权益3个月独立画3DS MAX 自带电脑上班不合格就“充公”？公司回应每年全球收专利费12亿美元！华为连续5年中国申请专利领先 5G必要专利全球第一最多领1600元！北京发放新一批消费券：手机、电脑等都能用电影《亲爱的》原型杜小华河南寻子DNA鉴定结果比对失败Rays TE37 Ultra M-SPEC，F8X M3/4 古铜色现货买特斯拉一定要找人介绍！特斯拉限时福利：7千元+3年超充

机器之心校对

编辑：杜伟、梓文

你的就是我的，我的还是我的。

在生成式 AI 盛行的全新时代，小型信息技术子公司在采用新浪网文本时正在奉行「照我说的做，而不是做我所做的」思路。在很大程度上，这种思路能说是一种瓦万以及定价权的误用。

同时，随着大语言数学模型（LLM）成为 AI 发展的主流趋势，无论是小型还是孵化器子公司，都在不失时机地合作开发他们的大数学模型。其中体能训练统计数据是大数学模型能力好坏的重要前提。

近日，根据 Insider 的报道，谷歌全力支持的 OpenAI、Google及其全力支持的 Anthropic 多年来一直在采用其它网站或子公司的新浪网文本来体能训练她们的生成式 AI 数学模型。那些都是在没有征询具体许可的情况下顺利完成的，并将构成一场酝酿中的法律斗争的一部分，决定了网络的未来以及DMCA在这一新时代的应用形式。

那些小型信息技术子公司可能会争论说她们是合理采用，与否真的如此有待深究。但是她们却不会让他们的文本被用来体能训练其它 AI 数学模型。所以不禁要问，为什么那些小型信息技术子公司却能在体能训练大数学模型时采用其它子公司的新浪网文本呢？

那些子公司很聪明，但也非常伪善

小型信息技术子公司采用别人新浪网文本却不允许别人采用他们的，这种说法与否有确切证据，这能从她们一些商品的服务和采用条文中看出败象。

首先来看 Claude，它是 Anthropic 推出的近似于 ChatGPT 的 AI 副手。该系统能顺利完成全文总结、搜索、协助创作、概要、代码等任务。前几日再次升级，将上下文 token 扩展到了 100k，反应速度大大加快。

Claude 的服务项目条文是这样的。你不得以下列形式（这里列出出部分）访问或采用本服务项目，如果那些限制的任何人一项与可接受采用政策不一致或不明确，则以后者遵从为重：

合作开发与我们的服务项目竞争的任何人商品或服务项目，包括合作开发或体能训练任何人 AI 或机器学习演算法或数学模型

Claude 服务项目条文地址：https://vault.pactsafe.io/s/9f502c93-cb5c-4571-b205-1e479da61794/legal.html#terms

同样地，Google的生成式 AI 采用条文也是如此，「你不得采用本服务项目来合作开发机器学习数学模型或相关技术。」

Google生成式 AI 采用条文地址：https://policies.google.com/terms/generative-ai

OpenAI 的采用条款又怎样呢？与Google类似，「你不得采用本服务项目的输出来合作开发与 OpenAI 竞争的数学模型。」

OpenAI 采用条文地址：https://openai.com/policies/terms-of-use

那些公司很聪明，她们知道高质量的文本对于体能训练新的 AI 数学模型至关重要，所以不允许别人用这样的形式采用她们的输出也是合情合理的。但她们却无所顾忌地利用别人统计数据来体能训练他们的数学模型，这又该如何解释呢？