2025 年 11 月,姚順雨穿著休閑短褲、踩著拖鞋出現(xiàn)在騰訊的一場(chǎng)內(nèi)部會(huì)上。這位 27 歲的 OpenAI 前研究員、提出過(guò) ReAct 范式的技術(shù)天才剛被騰訊以重金招入麾下不久。
入職后,他的一項(xiàng)重要任務(wù)是幫騰訊找到混元大模型長(zhǎng)期表現(xiàn)欠佳的原因,并將情況直接上報(bào)給集團(tuán)總裁劉熾平;姚順雨細(xì)致地檢查每一個(gè)環(huán)節(jié),不時(shí)和同事、實(shí)習(xí)生交流至半夜——這些是他的前任們很少會(huì)做的。很快他成為了騰訊大語(yǔ)言模型的一號(hào)位。
“混元的評(píng)測(cè)出了大問(wèn)題。” 一位在場(chǎng)人士轉(zhuǎn)述姚順雨在會(huì)上發(fā)言,意思是模型過(guò)度追逐在榜單上的成績(jī),將打榜的語(yǔ)料放入訓(xùn)練集以致數(shù)據(jù)被污染,盡管模型很會(huì)答題,在真實(shí)場(chǎng)景里的表現(xiàn)卻不穩(wěn)定。他希望團(tuán)隊(duì)以后不要打榜,也不要盯著榜單做事。會(huì)上,混元的相關(guān)負(fù)責(zé)人也提到了模型過(guò)去在數(shù)據(jù)、預(yù)訓(xùn)練、infra 上的問(wèn)題。
過(guò)去兩年多,這家中國(guó)市值最高、掌握著最大流量入口的互聯(lián)網(wǎng)公司,在 AI 上的節(jié)奏相對(duì)謹(jǐn)慎——無(wú)論是投入力度,還是組織與產(chǎn)品推進(jìn)速度,都落后于阿里巴巴與字節(jié)跳動(dòng)。直到 2025 年,這種狀態(tài)開(kāi)始改變:高薪招攬技術(shù)人才、大規(guī)模重組模型與 AI 產(chǎn)品團(tuán)隊(duì)、持續(xù)向 “元寶” 傾斜資源。姚順雨的到來(lái),成為這一系列變化中最明確的拐點(diǎn)。
“把以前的節(jié)奏和慣性徹底打亂,才是回到正軌的第一步。” 一位混元大模型人士說(shuō)。
騰訊在重振旗鼓,阿里則想試圖定義 AI 敘事。
阿里提出了一個(gè)新概念:通云哥——通義實(shí)驗(yàn)室、阿里云與平頭哥,即 AI、云計(jì)算和芯片三位一體發(fā)展。阿里認(rèn)為自己是中國(guó)為數(shù)不多擁有全棧式 AI 能力——從芯片、大模型、云服務(wù)到產(chǎn)品的科技公司。這也是 Google 講的故事。
三大互聯(lián)網(wǎng)巨頭中,阿里的主業(yè)賺錢(qián)效率最低。據(jù)報(bào)道,今年前三季度字節(jié)跳動(dòng)的凈利潤(rùn)在 400 億美元左右;同期,騰訊與阿里的凈利潤(rùn)為 300 億美與 100 億美元左右(自然年口徑)。但這沒(méi)有影響它投入的決心。
一位知情人士透露,阿里正考慮將未來(lái)三年投入到 AI 基建與云計(jì)算上的 3800 億元提升至 4800 億。在國(guó)內(nèi),阿里有自研的芯片真武 810E;在海外,它也在 “用一輛輛卡車(chē)來(lái)運(yùn)采購(gòu)的 GPU。” 一位知情人士說(shuō)。最激進(jìn)的時(shí)候,“連 RTX 4090 這類(lèi)消費(fèi)級(jí)顯卡也大量買(mǎi)入,用來(lái)搭建推理集群、補(bǔ)充推理吞吐。”
2025 年 12 月,千問(wèn) App、螞蟻旗下的靈光、阿福每天的拉新投放費(fèi)用都在 1000 萬(wàn)元以上;千問(wèn) App 的單日投放峰值一度達(dá)到 1500 萬(wàn)元。
對(duì)字節(jié)跳動(dòng)來(lái)說(shuō),“AI 是一件能影響整個(gè)世界的機(jī)會(huì)。” 一位接近字節(jié)跳動(dòng)高層人士說(shuō)。從 TopBuzz、TikTok 到 TikTok Shop,成立以后這家公司一直在尋找這樣的機(jī)會(huì),“越接近世界中心的事情探索價(jià)值才越大。”
相比騰訊與阿里分別在模型與產(chǎn)品上有劣勢(shì),字節(jié)跳動(dòng)的能力更綜合。豆包在 2025 年底成為了國(guó)內(nèi)第一個(gè)日活躍用戶(hù)數(shù)破億的 AI 產(chǎn)品;豆包大模型的日均 Token 處理量達(dá)到 63 萬(wàn)億,半年增長(zhǎng)超 200%。
2023 年,字節(jié)跳動(dòng)創(chuàng)始人張一鳴曾說(shuō),當(dāng)下這個(gè)時(shí)代的操作系統(tǒng)級(jí)機(jī)會(huì)就是 AI + 計(jì)算。
2026 年字節(jié)會(huì)全面加速 AI 業(yè)務(wù)的全球化,東南亞等地區(qū)是重點(diǎn),美國(guó)暫時(shí)不會(huì)進(jìn)入。據(jù)了解,字節(jié)的目標(biāo)是在大模型上至少成為全球第三。截至 2025 年底,豆包的海外版本 Dola 全球日活躍用戶(hù)數(shù)突破 1000 萬(wàn)。
中國(guó)的這一輪大模型熱潮始于 2023 年。在明星創(chuàng)業(yè)公司最受關(guān)注的早期階段,互聯(lián)網(wǎng)巨頭們并不算顯眼。三家選擇了不同的路徑:騰訊更重視 AI 的應(yīng)用落地,因此相對(duì)低調(diào)地等待模型能力成熟;阿里將大模型推向開(kāi)源,押注于做大生態(tài),從而為云業(yè)務(wù)打開(kāi)增量空間;字節(jié)跳動(dòng)起步較晚,只能通過(guò)飽和式投入,盡快補(bǔ)齊技術(shù)短板。
直到 2025 年初, DeepSeek 為整個(gè)行業(yè)重新畫(huà)了一條起跑線(xiàn),巨頭活躍了起來(lái),戰(zhàn)場(chǎng)有了硝煙的味道。
2026 年春節(jié)成為了這場(chǎng)戰(zhàn)爭(zhēng)的引爆點(diǎn)。