发布日期:2025-10-23 16:40 点击次数:150
近日,清华物理系传奇特奖得主 Yao Shunyu(姚顺宇)已离开 Anthropic,加入 Google DeepMind。
从 2024 年 10 月加入,到 2025 年 9 月离开,入职仅一年,姚顺宇为何要离开?
他在个人博客中提及,40% 的原因是反对 Anthropic 最新发言中将中国称为"敌对国家",另外 60% 因素源于无法公开的内部信息判断。
在海外的华人大拿里,有几个知名的" Yao Shunyu "。
前述所提及的,是物理学出身的姚顺宇,2024 年毕业到加州伯克利做了几个月博士后,于当年 10 月加入了 Anthropic,从量子计算的研究正式转向了人工智能。在 Anthropic 期间,他参与将 Claude 从 3.7 提升到 4.5。
" Anthropic,与你共事很棒,但没有你我会更好。"在回顾自己过往一年从业经历的博文中,姚顺宇最后"霸气"总结道。

为何频频与华开战?
在姚顺宇公开博文中,明确点出了自己离开的缘由:Anthropic 愈演愈烈的"反华"气质。
2025 年以来,Anthropic 在业务扩张和资本层面可以说是一路高歌猛进,但其官方政策明确将中国相关资本与市场排除在外。
9 月 5 日,Anthropic 官方发布公告《更新对不支持地区的销售限制》,宣布立即停止向多数股权由中国资本持有的公司或其子公司提供 Claude 服务。
Anthropic 在公告中不仅明确表示中国等国是"敌对国家",也明确对于中资占比超过 50% 的实体一律禁止使用服务。这直接波及了部分新加坡、香港等地的中资子公司。
就在宣布"断供"前两天,Anthropic 宣布完成 130 亿美元(约合人民币 928 亿元)的 F 轮融资,投后估值为 1830 亿美元(约合人民币 1.3 万亿元),是半年前的三倍。
其创始人和 CEO 达里奥 · 阿莫迪(Dario Amodei),曾经是 OpenAI 研究团队灵魂人物之一,还是百度的深度学习实验室早期员工。
在此前决绝断供前,他就多次呼吁对华实施算力管控,以及于今年 1 月直接发万字博文质疑,称 DeepSeek- V3 模型不可能用 600 万美元的低成本训练而成。
一方面,达里奥的"贬损"源于对自身技术路线的维护:DeepSeek 在推理模型上的创新对 Anthropic 坚持的 Scaling Law(缩放定律)和预训练模型主导的技术路径构成了挑战。
更大的危机感则源于以 DeepSeek 为代表采用的"蒸馏"技术,让大模型厂商能够站在"教师"模型肩膀上,以更快速度、更低成本训练自己的模型。
对 Anthropic 来说,与其被动"资敌",不如从源头上掐断可能性,以放弃一部分短期收入为代价,来维护其技术壁垒。
Anthropic 从一开始就将企业级服务 API 销售作为其主要收入来源,在 Claude 3.5 推出之后,将商业的重心迁移到 AI 编程上,进而推出了独立编程产品 Claude Code。
在海外,公认第一梯队的 AI Coding(AI 编程)产品几乎只有两个最佳选择,即 Anthropic 旗下的 Claude,或者谷歌旗下的 Gemini。
在国内,中国的科技巨头正在公开使用最擅长编程的 Claude 的模型能力,推出它们自己的 AI 编程产品:
字节跳动的 Trae,国际版集成了 Claude 4 和 GPT-5 等主流模型,国内版则集成了豆包和 DeepSeek;腾讯的 CodeBuddy,面向所有用户开放使用,无需邀请码;阿里的 Qoder 不仅接入了 Claude、GPT、Gemini 等最新大模型,并围绕上下文工程能力进行了全方位升级,官方宣称其 AI 编程能力已比肩 Claude 4.0。
在主动疏远中国市场的同时,Anthropic 也积极"开源"其他国际市场。例如,宣布将于 2026 年在印度班加罗尔设立办事处,因为印度已成为其 Claude 模型的第二大消费市场,尤其在编程方面表现出强劲需求。
继实施"断供"后,达里奥的对华封禁言论频出。9 月 17 日,在一场人工智能峰会(AI+ DC Summit)上,达里奥宣称,美国在芯片领域的主导地位,可能是其目前仍对中国拥有的"唯一优势",应当予以"保护"。
"将这些芯片卖给中国,无异于拿我们国家的未来做赌注。"达里奥谈到英伟达公司推出多款对华"减配特供版"芯片的新闻时无理评价道。
2025 年以来,美国政府对华技术封锁持续加码,硅谷科技公司在此政策下也进一步收紧了对中国的技术出口和商业合作——主要的封锁迹象就集中在芯片设计软件(EDA)的全面断供、将更多中国科技企业列入"实体清单",连续扩大 AI 出口管制清单,试图遏制中国 AI 等领域的发展。
悄然打响的技术暗战
面对此禁令,不少大模型厂商都嗅到了国产替代机会,一场技术暗战已然打响。
有行业人士告诉凤凰网科技,"率先出战的正是‘御三家’,即阿里通义千问、DeepSeek 和 Kimi "。
9 月的云栖大会上,阿里一口气拿出了 7 个大模型,尤其是新版旗舰模型 Qwen3-Max 能力继续提升;9 月 5 日 Anthropic 断供当天,"六小龙"之一的 Kimi 火速更新了 K2-0905,在兼容性,输出速度,编程能力,上下文长度等模型能力上都进行了升级,随后几日更是宣布高速版 API 限时半价,承接 Claude 用户的意图昭然若揭。
"其实 Kimi 很早就看准了 Coding 的方向,和 Claude 在过往的一些技术演进上也有一定的路径相似。代码也好,审美也罢,好像大家都感觉 Kimi 在朝 Claude 这个方向前进。"有接近 Kimi 的行业人士对凤凰网科技评价道,"毕竟 Kimi 这次也只对比了 Claude 4,感觉就是追着打。"

DeepSeek 在海外的影响力自不必说,在很长一段时间内,都是海外企业热议的中国科技企业代表。过去几个月,其两度"小更新",在优化编码能力的同时,还在持续降低 API 价格。
除此之外,多家不同类型的国产大模型,都有意合力围攻。
同为"六小龙"的智谱为 Claude API 用户提供"一键搬家"服务,并将为新用户提供 2000 万 Tokens 免费体验,其为开发者打造的 GLM-4.5 编码专属包月套餐,价格仅为 Claude 的七分之一。
商汤科技的"日日新 SenseNova ",也为原 Claude 用户提供了快速切换服务,附赠 5000 万 Tokens 的体验包,并提供了 API 迁移专属的顾问和培训业务;京东云表示,推出 Claude Code 接入京东云 JoyBuilder 大模型服务方案,以及 JoyCode+JoyBuilder 大模型的智能编程解决方案,帮助开发者平稳过渡。
不过,在 Claude 禁令带来的窗口期中,国内大模型厂商面临的"内卷"压力也并不小。
开源模型公司提供 API 服务,不仅会被卷入厂商间"一折更比一折狠"的价格战,更要面对各大云厂商们低价打包它们自己的开源模型——阿里云、腾讯云们完全可以将任何一个流行的开源模型以远低于官方 API 的价格提供服务,以此来"截胡"客户。
就像在 Kimi K2 发布后,不仅海外平台各大 AI 和云平台都部署上线了该模型,就连 Perplexity CEO 也在社交媒体表示,基于 K2 的良好表现,公司后续可能会利用其进行后训练。
因此,开源玩家如何不仅仅"为他人做嫁衣",陷入商业化泥潭中,也成了必答题。
就像 Anthropic 对华"断供"两周后,AWS 宣布在亚马逊 Bedrock 上线阿里巴巴的 Qwen3 系列和 DeepSeek V3.1 ——这是一次史无前例的"开放",毕竟,某种程度上亚马逊和阿里云同为云厂商对手。
AWS 上架竞争对手的模型,是在构建一个更强大的护城河。其 CEO Matt Garman 就在最近的采访中明确表示:"我们不认为会有一个模型能适应所有场景。"
如果客户在 AWS 上可以找到市面上几乎所有主流模型时,就无需迁移到其他平台。AWS 也便能沉淀其客户资源,稳固平台优势。
AWS 的选择其实也说明了一个问题,在这场全球 AI 角逐的竞赛中,中国企业早已占据核心位置,这是越来越多华人 AI 科学家的底气来源。
另一位 AI 大拿、曾任 OpenAI 研究员的姚顺雨也在近期考虑加入国产大模型团队。