- +1
終于來了!DeepSeekV4預覽版本正式發(fā)布:Agent、世界知識和推理性能在開源領域領先
“不誘于譽,不恐于誹,率道而行,端然正己?!?/p>
在DeepSeekV4預覽版本上線當天,DeepSeek官方團隊表示:“感謝每一位用戶的信任與支持,大家的肯定、建議和期許,是我們不竭探索、持續(xù)進步的動力,也讓我們始終堅守初心,專注于不懈的創(chuàng)新。”
DeepSeek表示:“我們將始終秉持長期主義的原則理念,在嘗試與思考中踏實前行,努力向?qū)崿F(xiàn)AGI的目標不斷靠近?!?/p>
這些表態(tài),似乎也是對近期傳言的回應。4月24日,澎湃新聞記者獲悉,外界關注的全新系列模型DeepSeek-V4的預覽版本正式上線并同步開源。DeepSeek-V4擁有百萬字超長上下文,在Agent能力、世界知識和推理性能上均實現(xiàn)國內(nèi)與開源領域的領先。模型按大小分為兩個版本:
API服務已同步更新,通過修改model_name為deepseek-v4-pro或deepseek-v4-flash即可調(diào)用。
相比前代模型,DeepSeek-V4-Pro的Agent能力顯著增強。在AgenticCoding評測中,V4-Pro已達到當前開源模型最佳水平,并在其他Agent相關評測中同樣表現(xiàn)優(yōu)異。目前DeepSeek-V4已成為公司內(nèi)部員工使用的AgenticCoding模型,據(jù)評測反饋使用體驗優(yōu)于Sonnet4.5,交付質(zhì)量接近Opus4.6非思考模式,但仍與Opus4.6思考模式存在一定差距。
DeepSeek-V4-Pro在世界知識測評中,大幅領先其他開源模型,僅稍遜于頂尖閉源模型Gemini-Pro-3.1。
在數(shù)學、STEM、競賽型代碼的測評中,DeepSeek-V4-Pro超越當前所有已公開評測的開源模型,取得了比肩世界頂級閉源模型的優(yōu)異成績。
相比DeepSeek-V4-Pro,DeepSeek-V4-Flash在世界知識儲備方面稍遜一籌,但展現(xiàn)出了接近的推理能力。而由于模型參數(shù)和激活更小,相較之下V4-Flash能夠提供更加快捷、經(jīng)濟的API服務。在Agent測評中,DeepSeek-V4-Flash在簡單任務上與DeepSeek-V4-Pro旗鼓相當,但在高難度任務上仍有差距。
值得注意的是,DeepSeek-V4開創(chuàng)了一種全新的注意力機制,在token維度進行壓縮,結合DSA稀疏注意力(DeepSeekSparseAttention),實現(xiàn)了全球領先的長上下文能力,并且相比于傳統(tǒng)方法大幅降低了對計算和顯存的需求。從現(xiàn)在開始,1M(一百萬)上下文將是DeepSeek所有官方服務的標配。
DeepSeek-V4針對ClaudeCode、OpenClaw、OpenCode、CodeBuddy等主流的Agent產(chǎn)品進行了適配和優(yōu)化,在代碼任務、文檔生成任務等方面表現(xiàn)均有提升。
目前,DeepSeekAPI 已同步上線 V4-Pro 與 V4-Flash,支持 OpenAIChatCompletions 接口與 Anthropic 接口。訪問新模型時,base_url 不變,model 參數(shù)需要改為deepseek-v4-pro 或deepseek-v4-flash。

DeepSeek官方提供的模型價格
V4-Pro與V4-Flash最大上下文長度為1M,均同時支持非思考模式與思考模式,其中思考模式支持reasoning_effort 參數(shù)設置思考強度(high/max)。對于復雜的Agent場景建議使用思考模式,并設置強度為max。
DeepSeek在去年春節(jié)的現(xiàn)象級走紅,曾一度被捧上神壇,不過,伴隨國產(chǎn)AI的競速加劇,來自智譜、MiniMax、Kimi等大模型公司的迅速迭代,DeepSeek正在面臨激烈競爭。
近期,DeepSeek被首次開啟外部融資、人才流失等眾多外界聲音困擾,此前4月18日,澎湃新聞記者從多位創(chuàng)投圈人士處證實,DeepSeek正在開啟其首次外部融資。此前據(jù)外媒報道,DeepSeek目標估值超過100億美元,據(jù)外媒援引知情人士透露,DeepSeek已開始與投資人接觸,計劃融資至少3億美元以補充資金儲備,應對成本日益高昂的AI軍備大賽。
根據(jù)澎湃新聞記者采訪梳理,去年以來,DeepSeek已經(jīng)流失多位核心成員,其中大部分為“95后”青年科學家:
4月12日,自動駕駛公司元戎啟行對外確認,DeepSeek多模態(tài)模型核心貢獻者阮翀已加盟公司出任首席科學家,DeepSeek第一代大語言模型(LLM)核心作者王炳宣,近期宣布加盟騰訊;DeepSeek-OCR系列核心作者魏浩然也在今年春節(jié)前后離職,但尚未披露正式入職哪家大廠。4月16日,前DeepSeek核心研究員郭達雅被曝加盟字節(jié)跳動,去年11月12日,前DeepSeek核心研究員羅福莉官宣加盟小米。在基座大模型(LLM)、智能體(Agent)、文本識別(OCR)、多模態(tài)等多方面領域,DeepSeek均有核心人才流失。
4月8日,在最新版本中,DeepSeek輸入框上方新增“快速模式”與“專家模式”,網(wǎng)頁顯示,快速模式適合日常對話,即時響應,支持圖片和文件中的文字識別;專家模式擅長復雜問題,這也是DeepSeek在官網(wǎng)頁面首次引入分層模式。
相關動態(tài),讓DeepSeek更新V4的懸念成為大家討論的熱點,當時澎湃新聞記者曾經(jīng)報道,DeepSeek大概率在今年4月正式上線V4版本,DeepSeek內(nèi)部人士也曾向記者表示:非常期待。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務許可證:31120170006
增值電信業(yè)務經(jīng)營許可證:滬B2-2017116
? 2014-2026 上海東方報業(yè)有限公司




