終于來(lái)了！DeepSeekV4預(yù)覽版本正式發(fā)布：Agent、世界知識(shí)和推理性能在開源領(lǐng)域領(lǐng)先

澎湃新聞?dòng)浾?范佳來(lái)

2026-04-24 11:21

來(lái)源：澎湃新聞

? 10%公司 >

聽全文

“不誘于譽(yù)，不恐于誹，率道而行，端然正己?！?/p>

在DeepSeekV4預(yù)覽版本上線當(dāng)天，DeepSeek官方團(tuán)隊(duì)表示：“感謝每一位用戶的信任與支持，大家的肯定、建議和期許，是我們不竭探索、持續(xù)進(jìn)步的動(dòng)力，也讓我們始終堅(jiān)守初心，專注于不懈的創(chuàng)新?！?/p>

DeepSeek表示：“我們將始終秉持長(zhǎng)期主義的原則理念，在嘗試與思考中踏實(shí)前行，努力向?qū)崿F(xiàn)AGI的目標(biāo)不斷靠近?！?/p>

這些表態(tài)，似乎也是對(duì)近期傳言的回應(yīng)。4月24日，澎湃新聞?dòng)浾攉@悉，外界關(guān)注的全新系列模型DeepSeek-V4的預(yù)覽版本正式上線并同步開源。DeepSeek-V4擁有百萬(wàn)字超長(zhǎng)上下文，在Agent能力、世界知識(shí)和推理性能上均實(shí)現(xiàn)國(guó)內(nèi)與開源領(lǐng)域的領(lǐng)先。模型按大小分為兩個(gè)版本：

API服務(wù)已同步更新，通過(guò)修改model_name為deepseek-v4-pro或deepseek-v4-flash即可調(diào)用。

相比前代模型，DeepSeek-V4-Pro的Agent能力顯著增強(qiáng)。在AgenticCoding評(píng)測(cè)中，V4-Pro已達(dá)到當(dāng)前開源模型最佳水平，并在其他Agent相關(guān)評(píng)測(cè)中同樣表現(xiàn)優(yōu)異。目前DeepSeek-V4已成為公司內(nèi)部員工使用的AgenticCoding模型，據(jù)評(píng)測(cè)反饋使用體驗(yàn)優(yōu)于Sonnet4.5，交付質(zhì)量接近Opus4.6非思考模式，但仍與Opus4.6思考模式存在一定差距。

DeepSeek-V4-Pro在世界知識(shí)測(cè)評(píng)中，大幅領(lǐng)先其他開源模型，僅稍遜于頂尖閉源模型Gemini-Pro-3.1。

在數(shù)學(xué)、STEM、競(jìng)賽型代碼的測(cè)評(píng)中，DeepSeek-V4-Pro超越當(dāng)前所有已公開評(píng)測(cè)的開源模型，取得了比肩世界頂級(jí)閉源模型的優(yōu)異成績(jī)。

相比DeepSeek-V4-Pro，DeepSeek-V4-Flash在世界知識(shí)儲(chǔ)備方面稍遜一籌，但展現(xiàn)出了接近的推理能力。而由于模型參數(shù)和激活更小，相較之下V4-Flash能夠提供更加快捷、經(jīng)濟(jì)的API服務(wù)。在Agent測(cè)評(píng)中，DeepSeek-V4-Flash在簡(jiǎn)單任務(wù)上與DeepSeek-V4-Pro旗鼓相當(dāng)，但在高難度任務(wù)上仍有差距。

值得注意的是，DeepSeek-V4開創(chuàng)了一種全新的注意力機(jī)制，在token維度進(jìn)行壓縮，結(jié)合DSA稀疏注意力（DeepSeekSparseAttention），實(shí)現(xiàn)了全球領(lǐng)先的長(zhǎng)上下文能力，并且相比于傳統(tǒng)方法大幅降低了對(duì)計(jì)算和顯存的需求。從現(xiàn)在開始，1M（一百萬(wàn)）上下文將是DeepSeek所有官方服務(wù)的標(biāo)配。

DeepSeek-V4針對(duì)ClaudeCode、OpenClaw、OpenCode、CodeBuddy等主流的Agent產(chǎn)品進(jìn)行了適配和優(yōu)化，在代碼任務(wù)、文檔生成任務(wù)等方面表現(xiàn)均有提升。

目前，DeepSeekAPI 已同步上線 V4-Pro 與 V4-Flash，支持 OpenAIChatCompletions 接口與 Anthropic 接口。訪問(wèn)新模型時(shí)，base_url 不變,model 參數(shù)需要改為deepseek-v4-pro 或deepseek-v4-flash。

DeepSeek官方提供的模型價(jià)格

V4-Pro與V4-Flash最大上下文長(zhǎng)度為1M，均同時(shí)支持非思考模式與思考模式，其中思考模式支持reasoning_effort 參數(shù)設(shè)置思考強(qiáng)度（high/max）。對(duì)于復(fù)雜的Agent場(chǎng)景建議使用思考模式，并設(shè)置強(qiáng)度為max。

DeepSeek在去年春節(jié)的現(xiàn)象級(jí)走紅，曾一度被捧上神壇，不過(guò)，伴隨國(guó)產(chǎn)AI的競(jìng)速加劇，來(lái)自智譜、MiniMax、Kimi等大模型公司的迅速迭代，DeepSeek正在面臨激烈競(jìng)爭(zhēng)。

近期，DeepSeek被首次開啟外部融資、人才流失等眾多外界聲音困擾，此前4月18日，澎湃新聞?dòng)浾邚亩辔粍?chuàng)投圈人士處證實(shí)，DeepSeek正在開啟其首次外部融資。此前據(jù)外媒報(bào)道，DeepSeek目標(biāo)估值超過(guò)100億美元，據(jù)外媒援引知情人士透露，DeepSeek已開始與投資人接觸，計(jì)劃融資至少3億美元以補(bǔ)充資金儲(chǔ)備，應(yīng)對(duì)成本日益高昂的AI軍備大賽。

根據(jù)澎湃新聞?dòng)浾卟稍L梳理，去年以來(lái)，DeepSeek已經(jīng)流失多位核心成員，其中大部分為“95后”青年科學(xué)家：

4月12日，自動(dòng)駕駛公司元戎啟行對(duì)外確認(rèn)，DeepSeek多模態(tài)模型核心貢獻(xiàn)者阮翀已加盟公司出任首席科學(xué)家，DeepSeek第一代大語(yǔ)言模型（LLM）核心作者王炳宣，近期宣布加盟騰訊；DeepSeek-OCR系列核心作者魏浩然也在今年春節(jié)前后離職，但尚未披露正式入職哪家大廠。4月16日，前DeepSeek核心研究員郭達(dá)雅被曝加盟字節(jié)跳動(dòng)，去年11月12日，前DeepSeek核心研究員羅福莉官宣加盟小米。在基座大模型（LLM）、智能體（Agent）、文本識(shí)別（OCR）、多模態(tài)等多方面領(lǐng)域，DeepSeek均有核心人才流失。

4月8日，在最新版本中，DeepSeek輸入框上方新增“快速模式”與“專家模式”，網(wǎng)頁(yè)顯示，快速模式適合日常對(duì)話，即時(shí)響應(yīng)，支持圖片和文件中的文字識(shí)別；專家模式擅長(zhǎng)復(fù)雜問(wèn)題，這也是DeepSeek在官網(wǎng)頁(yè)面首次引入分層模式。

相關(guān)動(dòng)態(tài)，讓DeepSeek更新V4的懸念成為大家討論的熱點(diǎn)，當(dāng)時(shí)澎湃新聞?dòng)浾咴?jīng)報(bào)道，DeepSeek大概率在今年4月正式上線V4版本，DeepSeek內(nèi)部人士也曾向記者表示：非常期待。

責(zé)任編輯：李躍群

圖片編輯：沈軻

澎湃新聞報(bào)料：021-962866

澎湃新聞，未經(jīng)授權(quán)不得轉(zhuǎn)載

我要舉報(bào)

#DeepSeek-V4