DeepSeek V4炸場背后：有人在內(nèi)斗，有人在接力

2026-04-28 08:20

來源：澎湃新聞·澎湃號·湃客

聽全文

作者：后廠村

編輯：提莫隊(duì)長

當(dāng)硅谷閉源陣營陷入“博弈”的內(nèi)斗泥沼，中國大模型正在用另一種方式撕開缺口。

4月24日，期待已久的DeepSeek-V4預(yù)覽版正式發(fā)布并同步開源，DeepSeek-V4分為Pro與Flash兩個(gè)版本，均支持百萬（1M）token超長上下文。同樣在這周，Kimi不約而同地發(fā)布了最新模型K2.6，把Agent能力從“單點(diǎn)調(diào)用”升級為“集群協(xié)同”。

一周誕生了兩個(gè)萬億參數(shù)的開源模型，不僅讓全球開源領(lǐng)域的目光集體聚焦中國，更悄然勾勒出中美AI賽道截然不同的發(fā)展底色——當(dāng)美國AI頭部企業(yè)陷入愈演愈烈的內(nèi)斗，而中國的開源AI似乎已經(jīng)跑通了一條協(xié)同進(jìn)化的道路。

同周開源，分工明確互不內(nèi)卷

就在DeepSeek V4引發(fā)風(fēng)暴的同一周，月之暗面發(fā)布Kimi K2.6并開源，提升了Agent集群能力：支持300個(gè)Agent并行，可自主拆解和完成長周期的復(fù)雜工程任務(wù)。這與DeepSeek形成了鮮明的路線互補(bǔ)。

DeepSeek主攻“深度推理、長文本理解、算力效率”，Kimi猛攻“多Agent集群、長周期任務(wù)執(zhí)行、復(fù)雜工程落地”，兩條路徑各自跑通閉環(huán)，共同擴(kuò)大了中國開源模型的全球輻射范圍。

但是，兩家AI公司的這種“默契”真的是巧合嗎？

真正的細(xì)節(jié)藏在技術(shù)報(bào)告里。

最典型的就是兩個(gè)關(guān)鍵技術(shù)的互相引用。

DeepSeek V3提出的MLA（多頭潛在注意力）技術(shù)，是它最核心的架構(gòu)創(chuàng)新之一，能通過壓縮KV緩存，大幅降低大模型的推理成本——要知道，推理成本是大模型落地的最大門檻之一，MLA技術(shù)直接讓DeepSeek的推理效率提升一個(gè)檔次。而Kimi在K2系列模型中，選擇沿用MLA架構(gòu)，靠著這項(xiàng)技術(shù)，成功壓縮了KV緩存體積，為Agent能力的落地掃清了障礙。

反過來，Kimi率先大規(guī)模驗(yàn)證的Muon優(yōu)化器，解決了萬億參數(shù)大模型訓(xùn)練不穩(wěn)定、效率低的行業(yè)難題——實(shí)現(xiàn)了“同等訓(xùn)練量下效率翻倍”，相當(dāng)于把50萬億token用出了100萬億的效果。而DeepSeek V4的技術(shù)報(bào)告里，直接把Muon優(yōu)化器寫進(jìn)了訓(xùn)練方案。

簡單說，DeepSeek的MLA幫Kimi降低了推理成本；Kimi的Muon幫DeepSeek降低了訓(xùn)練成本。

你用我的架構(gòu)，我用你的優(yōu)化器。沒有糾紛，不用授權(quán)。這就是中國開源AI的獨(dú)有的正向循環(huán)模式——與硅谷企業(yè)將技術(shù)視為護(hù)城河的理念不同，在這兩家公司身上，以開源的態(tài)度協(xié)同共進(jìn)的發(fā)展模式才是真正的護(hù)城河。

閉源必內(nèi)斗

說到這里，就不得不提OpenAI和Anthropic的斗爭史了。

早從ChatGPT誕生開始，OpenAI和Anthropic就注定是“死對頭”——Anthropic的核心團(tuán)隊(duì)大多來自O(shè)penAI，因?yàn)槔砟畈缓铣鲎吆?，直接對?biāo)OpenAI做閉源模型，雙方在技術(shù)、人才、資本上展開全方位競爭。

從2023年到2026年，Anthropic的ARR幾乎每年都在以10倍的速度增長，步步緊逼OpenAI；到了2026年4月，據(jù)傳Anthropic公布的300億美元年化收入體量已反超OpenAI。OpenAI靠微軟的資金和算力壟斷高端市場，Anthropic則靠谷歌的投資夾縫求生，兩者之間沒有任何技術(shù)共享，反而互相封鎖、互相拆臺(tái)，甚至不惜通過訴訟爭奪技術(shù)專利。

在這種“雙雄打擂臺(tái)”的態(tài)勢下，OpenAI近期甚至被曝出內(nèi)部備忘錄，明確將對方鎖定為直接競爭對手，嚴(yán)防死守。

為什么會(huì)這樣？核心就是閉源路線的本質(zhì)——技術(shù)是“護(hù)城河”，是賺錢的工具，一旦共享，就會(huì)失去競爭優(yōu)勢。閉源模型的盈利模式，決定了它們必須是“絕對競爭”的關(guān)系，蛋糕就這么大，你多吃一口，我就少吃一口，根本沒有互助共贏的可能。

然而，中國AI軍團(tuán)面臨的宏觀環(huán)境截然不同。在算力受限、高端芯片被海外“卡脖子”的底色下，中國企業(yè)若繼續(xù)內(nèi)耗，無異于自絕前路。

因此，DeepSeek和Kimi果斷選擇了擁抱開源——把蛋糕做大、合力突圍。

在這個(gè)AI從“訓(xùn)練為王”轉(zhuǎn)向“推理決勝”的年代，中國AI選擇的路線極具戰(zhàn)略遠(yuǎn)見：用頂尖的開源模型擊穿閉源廠商的高昂定價(jià)權(quán)，通過近乎同水平的智能表現(xiàn)與大打折扣的價(jià)格，迅速占領(lǐng)全球開發(fā)者市場。

“兄弟”殊途同歸

DeepSeek走的是“工程適配”路線，V4首發(fā)適配華為昇騰芯片，工程團(tuán)隊(duì)硬生生把整個(gè)技術(shù)棧從CUDA遷移到華為CANN框架，從算子庫、通信原語到內(nèi)存管理，幾乎每一層都重新實(shí)現(xiàn)，還完成了寒武紀(jì)芯片的Day 0適配，代碼全部開源，用實(shí)際行動(dòng)證明：國產(chǎn)芯片也能跑萬億參數(shù)的旗艦大模型。

連英偉達(dá)CEO黃仁勛都曾坦言，“如果DeepSeek先在華為平臺(tái)發(fā)布，對我們來說非?？膳隆?，如今這句話已然成真。

Kimi則走的是“架構(gòu)創(chuàng)新”路線，為了適配國產(chǎn)芯片，它掏出了“殺手锏”：一是Kimi Linear混合注意力架構(gòu)，把線性注意力和全注意力以3:1的比例混合，在長上下文推理中，解碼速度提升最高達(dá)6倍，KV緩存減少75%。讓RDMA高速網(wǎng)絡(luò)從“必選項(xiàng)”變成“可選項(xiàng)”。

二是PrFaaS技術(shù)，把推理的預(yù)填充和解碼階段徹底解耦，調(diào)度到不同的國產(chǎn)異構(gòu)硬件上，讓算力強(qiáng)的國產(chǎn)卡做預(yù)填充，帶寬強(qiáng)的國產(chǎn)卡做解碼，相比傳統(tǒng)同構(gòu)PD部署，實(shí)測吞吐量提升54%，P90延遲降低64%，徹底打破了“大模型推理必須綁定高端GPU”的魔咒。

一個(gè)從工程層面驗(yàn)證國產(chǎn)芯片的承載能力，一個(gè)從架構(gòu)層面優(yōu)化國產(chǎn)芯片的運(yùn)行效率，可以說，兩家公司在用不同的方式，共同推動(dòng)“中國芯片+中國模型”的生態(tài)落地，讓英偉達(dá)不再是中國AI的唯一選擇。

總結(jié)：

當(dāng)DeepSeek在V4公告中寫下“從現(xiàn)在開始，1M上下文將是標(biāo)配”，當(dāng)Kimi在K2.6的測試中讓智能體自主連續(xù)運(yùn)行了整整五天，中國AI已經(jīng)悄然越過了以參數(shù)論英雄的蠻荒期。

這不僅意味著中國企業(yè)在復(fù)雜的全球AI棋局中，找到了繞過算力封鎖的解題鑰匙，更深遠(yuǎn)的意義在于，隨著國產(chǎn)算力的大規(guī)模放量以及中國開源大模型在全球占比份額的迅速攀升，一種嶄新的世界AI多極化格局已見雛形。當(dāng)一個(gè)行業(yè)的壁壘從封鎖變成效率，從閉源的神秘變成開源的普惠，真正的風(fēng)暴才剛剛開始。

特別聲明

本文為澎湃號作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布，僅代表該作者或機(jī)構(gòu)觀點(diǎn)，不代表澎湃新聞的觀點(diǎn)或立場，澎湃新聞僅提供信息發(fā)布平臺(tái)。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

我要舉報(bào)

#DeepSeek-V4