- +1
DeepSeek V4炸場背后:有人在內(nèi)斗,有人在接力
作者:后廠村
編輯:提莫隊(duì)長
當(dāng)硅谷閉源陣營陷入“博弈”的內(nèi)斗泥沼,中國大模型正在用另一種方式撕開缺口。
4月24日,期待已久的DeepSeek-V4預(yù)覽版正式發(fā)布并同步開源,DeepSeek-V4分為Pro與Flash兩個(gè)版本,均支持百萬(1M)token超長上下文。同樣在這周,Kimi不約而同地發(fā)布了最新模型K2.6,把Agent能力從“單點(diǎn)調(diào)用”升級為“集群協(xié)同”。

一周誕生了兩個(gè)萬億參數(shù)的開源模型,不僅讓全球開源領(lǐng)域的目光集體聚焦中國,更悄然勾勒出中美AI賽道截然不同的發(fā)展底色——當(dāng)美國AI頭部企業(yè)陷入愈演愈烈的內(nèi)斗,而中國的開源AI似乎已經(jīng)跑通了一條協(xié)同進(jìn)化的道路。
01
同周開源,分工明確互不內(nèi)卷
就在DeepSeek V4引發(fā)風(fēng)暴的同一周,月之暗面發(fā)布Kimi K2.6并開源,提升了Agent集群能力:支持300個(gè)Agent并行,可自主拆解和完成長周期的復(fù)雜工程任務(wù)。這與DeepSeek形成了鮮明的路線互補(bǔ)。

DeepSeek主攻“深度推理、長文本理解、算力效率”,Kimi猛攻“多Agent集群、長周期任務(wù)執(zhí)行、復(fù)雜工程落地”,兩條路徑各自跑通閉環(huán),共同擴(kuò)大了中國開源模型的全球輻射范圍。
但是,兩家AI公司的這種“默契”真的是巧合嗎?
真正的細(xì)節(jié)藏在技術(shù)報(bào)告里。
最典型的就是兩個(gè)關(guān)鍵技術(shù)的互相引用。
DeepSeek V3提出的MLA(多頭潛在注意力)技術(shù),是它最核心的架構(gòu)創(chuàng)新之一,能通過壓縮KV緩存,大幅降低大模型的推理成本——要知道,推理成本是大模型落地的最大門檻之一,MLA技術(shù)直接讓DeepSeek的推理效率提升一個(gè)檔次。而Kimi在K2系列模型中,選擇沿用MLA架構(gòu),靠著這項(xiàng)技術(shù),成功壓縮了KV緩存體積,為Agent能力的落地掃清了障礙。
反過來,Kimi率先大規(guī)模驗(yàn)證的Muon優(yōu)化器,解決了萬億參數(shù)大模型訓(xùn)練不穩(wěn)定、效率低的行業(yè)難題——實(shí)現(xiàn)了“同等訓(xùn)練量下效率翻倍”,相當(dāng)于把50萬億token用出了100萬億的效果。而DeepSeek V4的技術(shù)報(bào)告里,直接把Muon優(yōu)化器寫進(jìn)了訓(xùn)練方案。
簡單說,DeepSeek的MLA幫Kimi降低了推理成本;Kimi的Muon幫DeepSeek降低了訓(xùn)練成本。
你用我的架構(gòu),我用你的優(yōu)化器。沒有糾紛,不用授權(quán)。這就是中國開源AI的獨(dú)有的正向循環(huán)模式——與硅谷企業(yè)將技術(shù)視為護(hù)城河的理念不同,在這兩家公司身上,以開源的態(tài)度協(xié)同共進(jìn)的發(fā)展模式才是真正的護(hù)城河。
02
閉源必內(nèi)斗
說到這里,就不得不提OpenAI和Anthropic的斗爭史了。
早從ChatGPT誕生開始,OpenAI和Anthropic就注定是“死對頭”——Anthropic的核心團(tuán)隊(duì)大多來自O(shè)penAI,因?yàn)槔砟畈缓铣鲎吆?,直接對?biāo)OpenAI做閉源模型,雙方在技術(shù)、人才、資本上展開全方位競爭。
從2023年到2026年,Anthropic的ARR幾乎每年都在以10倍的速度增長,步步緊逼OpenAI;到了2026年4月,據(jù)傳Anthropic公布的300億美元年化收入體量已反超OpenAI。OpenAI靠微軟的資金和算力壟斷高端市場,Anthropic則靠谷歌的投資夾縫求生,兩者之間沒有任何技術(shù)共享,反而互相封鎖、互相拆臺(tái),甚至不惜通過訴訟爭奪技術(shù)專利。
在這種“雙雄打擂臺(tái)”的態(tài)勢下,OpenAI近期甚至被曝出內(nèi)部備忘錄,明確將對方鎖定為直接競爭對手,嚴(yán)防死守。
為什么會(huì)這樣?核心就是閉源路線的本質(zhì)——技術(shù)是“護(hù)城河”,是賺錢的工具,一旦共享,就會(huì)失去競爭優(yōu)勢。閉源模型的盈利模式,決定了它們必須是“絕對競爭”的關(guān)系,蛋糕就這么大,你多吃一口,我就少吃一口,根本沒有互助共贏的可能。
然而,中國AI軍團(tuán)面臨的宏觀環(huán)境截然不同。在算力受限、高端芯片被海外“卡脖子”的底色下,中國企業(yè)若繼續(xù)內(nèi)耗,無異于自絕前路。
因此,DeepSeek和Kimi果斷選擇了擁抱開源——把蛋糕做大、合力突圍。
在這個(gè)AI從“訓(xùn)練為王”轉(zhuǎn)向“推理決勝”的年代,中國AI選擇的路線極具戰(zhàn)略遠(yuǎn)見:用頂尖的開源模型擊穿閉源廠商的高昂定價(jià)權(quán),通過近乎同水平的智能表現(xiàn)與大打折扣的價(jià)格,迅速占領(lǐng)全球開發(fā)者市場。
03
“兄弟”殊途同歸
DeepSeek走的是“工程適配”路線,V4首發(fā)適配華為昇騰芯片,工程團(tuán)隊(duì)硬生生把整個(gè)技術(shù)棧從CUDA遷移到華為CANN框架,從算子庫、通信原語到內(nèi)存管理,幾乎每一層都重新實(shí)現(xiàn),還完成了寒武紀(jì)芯片的Day 0適配,代碼全部開源,用實(shí)際行動(dòng)證明:國產(chǎn)芯片也能跑萬億參數(shù)的旗艦大模型。
連英偉達(dá)CEO黃仁勛都曾坦言,“如果DeepSeek先在華為平臺(tái)發(fā)布,對我們來說非??膳隆?,如今這句話已然成真。
Kimi則走的是“架構(gòu)創(chuàng)新”路線,為了適配國產(chǎn)芯片,它掏出了“殺手锏”:一是Kimi Linear混合注意力架構(gòu),把線性注意力和全注意力以3:1的比例混合,在長上下文推理中,解碼速度提升最高達(dá)6倍,KV緩存減少75%。讓RDMA高速網(wǎng)絡(luò)從“必選項(xiàng)”變成“可選項(xiàng)”。
二是PrFaaS技術(shù),把推理的預(yù)填充和解碼階段徹底解耦,調(diào)度到不同的國產(chǎn)異構(gòu)硬件上,讓算力強(qiáng)的國產(chǎn)卡做預(yù)填充,帶寬強(qiáng)的國產(chǎn)卡做解碼,相比傳統(tǒng)同構(gòu)PD部署,實(shí)測吞吐量提升54%,P90延遲降低64%,徹底打破了“大模型推理必須綁定高端GPU”的魔咒。
一個(gè)從工程層面驗(yàn)證國產(chǎn)芯片的承載能力,一個(gè)從架構(gòu)層面優(yōu)化國產(chǎn)芯片的運(yùn)行效率,可以說,兩家公司在用不同的方式,共同推動(dòng)“中國芯片+中國模型”的生態(tài)落地,讓英偉達(dá)不再是中國AI的唯一選擇。
04
總結(jié):
當(dāng)DeepSeek在V4公告中寫下“從現(xiàn)在開始,1M上下文將是標(biāo)配”,當(dāng)Kimi在K2.6的測試中讓智能體自主連續(xù)運(yùn)行了整整五天,中國AI已經(jīng)悄然越過了以參數(shù)論英雄的蠻荒期。
這不僅意味著中國企業(yè)在復(fù)雜的全球AI棋局中,找到了繞過算力封鎖的解題鑰匙,更深遠(yuǎn)的意義在于,隨著國產(chǎn)算力的大規(guī)模放量以及中國開源大模型在全球占比份額的迅速攀升,一種嶄新的世界AI多極化格局已見雛形。當(dāng)一個(gè)行業(yè)的壁壘從封鎖變成效率,從閉源的神秘變成開源的普惠,真正的風(fēng)暴才剛剛開始。
本文為澎湃號作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場,澎湃新聞僅提供信息發(fā)布平臺(tái)。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2026 上海東方報(bào)業(yè)有限公司




