近日,清華物理系傳奇特獎得主 Yao Shunyu(姚順宇)已離開Anthropic,加入 Google DeepMind。
從2024年10月加入,到2025年9月離開,入職僅一年,姚順宇為何要離開?
他在個人博客中提及,40%的原因是反對Anthropic最新發言中將中國稱為“敵對國家”,另外60%因素源于無法公開的內部信息判斷。
在海外的華人大拿里,有幾個知名的“Yao Shunyu”。
前述所提及的,是物理學出身的姚順宇,2024年畢業到加州伯克利做了幾個月博士后,于當年10月加入了Anthropic,從量子計算的研究正式轉向了人工智能。在 Anthropic期間,他參與將 Claude從 3.7提升到 4.5。
“Anthropic,與你共事很棒,但沒有你我會更好。”在回顧自己過往一年從業經歷的博文中,姚順宇最后“霸氣”總結道。

為何頻頻與華開戰?
在姚順宇公開博文中,明確點出了自己離開的緣由:Anthropic愈演愈烈的“反華”氣質。
2025年以來,Anthropic在業務擴張和資本層面可以說是一路高歌猛進,但其官方政策明確將中國相關資本與市場排除在外。
9月5日,Anthropic官方發布公告《更新對不支持地區的銷售限制》,宣布立即停止向多數股權由中國資本持有的公司或其子公司提供Claude服務。
Anthropic在公告中不僅明確表示中國等國是“敵對國家”,也明確對于中資占比超過50%的實體一律禁止使用服務。這直接波及了部分新加坡、香港等地的中資子公司。
就在宣布“斷供”前兩天,Anthropic宣布完成 130億美元(約合人民幣928億元)的F輪融資,投后估值為1830億美元(約合人民幣1.3萬億元),是半年前的三倍。
其創始人和 CEO達里奧·阿莫迪(Dario Amodei),曾經是 OpenAI研究團隊靈魂人物之一,還是百度的深度學習實驗室早期員工。
在此前決絕斷供前,他就多次呼吁對華實施算力管控,以及于今年1月直接發萬字博文質疑,稱DeepSeek- V3模型不可能用600萬美元的低成本訓練而成。

一方面,達里奧的“貶損”源于對自身技術路線的維護:DeepSeek在推理模型上的創新對Anthropic堅持的Scaling Law(縮放定律)和預訓練模型主導的技術路徑構成了挑戰。
更大的危機感則源于以DeepSeek為代表采用的“蒸餾”技術,讓大模型廠商能夠站在“教師”模型肩膀上,以更快速度、更低成本訓練自己的模型。
對Anthropic來說,與其被動“資敵”,不如從源頭上掐斷可能性,以放棄一部分短期收入為代價,來維護其技術壁壘。
Anthropic從一開始就將企業級服務API銷售作為其主要收入來源,在 Claude 3.5推出之后,將商業的重心遷移到 AI編程上,進而推出了獨立編程產品 Claude Code。
在海外,公認第一梯隊的AI Coding(AI編程)產品幾乎只有兩個最佳選擇,即Anthropic旗下的Claude,或者谷歌旗下的Gemini。
而在國內,中國的科技巨頭正在公開使用最擅長編程的 Claude的模型能力,推出它們自己的 AI編程產品:字節跳動的Trae,國際版集成了 Claude 4和 GPT-5等主流模型,國內版則集成了豆包和DeepSeek;騰訊的 CodeBuddy,面向所有用戶開放使用,無需邀請碼;阿里的 Qoder不僅接入了 Claude、GPT、Gemini等最新大模型,并圍繞上下文工程能力進行了全方位升級,官方宣稱其 AI編程能力已比肩 Claude 4.0。
在主動疏遠中國市場的同時,Anthropic也積極“開源”其他國際市場。例如,宣布將于2026年在印度班加羅爾設立辦事處,因為印度已成為其Claude模型的第二大消費市場,尤其在編程方面表現出強勁需求。
繼實施“斷供”后,達里奧的對華封禁言論頻出。9月17日,在一場人工智能峰會(AI+ DC Summit)上,達里奧宣稱,美國在芯片領域的主導地位,可能是其目前仍對中國擁有的“唯一優勢”,應當予以“保護”。
“將這些芯片賣給中國,無異于拿我們國家的未來做賭注。”達里奧談到英偉達公司推出多款對華“減配特供版”芯片的新聞時無理評價道。
2025年以來,美國政府對華技術封鎖持續加碼,硅谷科技公司在此政策下也進一步收緊了對中國的技術出口和商業合作——主要的封鎖跡象就集中在芯片設計軟件(EDA)的全面斷供、將更多中國科技企業列入“實體清單”,連續擴大 AI出口管制清單,試圖遏制中國AI等領域的發展。

悄然打響的技術暗戰
面對此禁令,不少大模型廠商都嗅到了國產替代機會,一場技術暗戰已然打響。
有行業人士告訴鳳凰網科技,“率先出戰的正是‘御三家’,即阿里通義千問、DeepSeek和Kimi”。
9月的云棲大會上,阿里一口氣拿出了7個大模型,尤其是新版旗艦模型Qwen3-Max能力繼續提升;9月5日Anthropic斷供當天,“六小龍”之一的Kimi火速更新了K2-0905,在兼容性,輸出速度,編程能力,上下文長度等模型能力上都進行了升級,隨后幾日更是宣布高速版API限時半價,承接Claude用戶的意圖昭然若揭。
“其實Kimi很早就看準了Coding的方向,和Claude在過往的一些技術演進上也有一定的路徑相似。代碼也好,審美也罷,好像大家都感覺Kimi在朝Claude這個方向前進。”有接近Kimi的行業人士對鳳凰網科技評價道,“畢竟Kimi這次也只對比了Claude 4,感覺就是追著打。”

DeepSeek在海外的影響力自不必說,在很長一段時間內,都是海外企業熱議的中國科技企業代表。過去幾個月,其兩度“小更新”,在優化編碼能力的同時,還在持續降低API價格。
除此之外,多家不同類型的國產大模型,都有意合力圍攻。
同為“六小龍”的智譜為Claude API用戶提供“一鍵搬家”服務,并將為新用戶提供2000萬Tokens免費體驗,其為開發者打造的GLM-4.5編碼專屬包月套餐,價格僅為Claude的七分之一。
商湯科技的“日日新SenseNova”,也為原Claude用戶提供了快速切換服務,附贈5000萬Tokens的體驗包,并提供了API遷移專屬的顧問和培訓業務;京東云表示,推出Claude Code接入京東云JoyBuilder大模型服務方案,以及JoyCode+JoyBuilder大模型的智能編程解決方案,幫助開發者平穩過渡。
不過,在Claude禁令帶來的窗口期中,國內大模型廠商面臨的“內卷”壓力也并不小。
開源模型公司提供API服務,不僅會被卷入廠商間“一折更比一折狠”的價格戰,更要面對各大云廠商們低價打包它們自己的開源模型——阿里云、騰訊云們完全可以將任何一個流行的開源模型以遠低于官方API的價格提供服務,以此來“截胡”客戶。
就像在Kimi K2發布后,不僅海外平臺各大AI和云平臺都部署上線了該模型,就連Perplexity CEO也在社交媒體表示,基于K2的良好表現,公司后續可能會利用其進行后訓練。
因此,開源玩家如何不僅僅“為他人做嫁衣”,陷入商業化泥潭中,也成了必答題。
就像Anthropic對華“斷供”兩周后,AWS宣布在亞馬遜Bedrock上線阿里巴巴的Qwen3系列和DeepSeek V3.1——這是一次史無前例的“開放”,畢竟,某種程度上亞馬遜和阿里云同為云廠商對手。
AWS上架競爭對手的模型,是在構建一個更強大的護城河。其CEO Matt Garman就在最近的采訪中明確表示:“我們不認為會有一個模型能適應所有場景。”
如果客戶在AWS上可以找到市面上幾乎所有主流模型時,就無需遷移到其他平臺。AWS也便能沉淀其客戶資源,穩固平臺優勢。AWS的選擇其實也說明了一個問題,在這場全球AI角逐的競賽中,中國企業早已占據核心位置,這是越來越多華人AI科學家的底氣來源。鳳凰網科技此前了解到,另一位AI大拿、曾任OpenAI研究員的姚順雨也在近期考慮加入國產大模型團隊。