- +1
終于來(lái)了!DeepSeekV4預(yù)覽版本正式發(fā)布:Agent、世界知識(shí)和推理性能在開源領(lǐng)域領(lǐng)先
“不誘于譽(yù),不恐于誹,率道而行,端然正己?!?/p>
在DeepSeekV4預(yù)覽版本上線當(dāng)天,DeepSeek官方團(tuán)隊(duì)表示:“感謝每一位用戶的信任與支持,大家的肯定、建議和期許,是我們不竭探索、持續(xù)進(jìn)步的動(dòng)力,也讓我們始終堅(jiān)守初心,專注于不懈的創(chuàng)新?!?/p>
DeepSeek表示:“我們將始終秉持長(zhǎng)期主義的原則理念,在嘗試與思考中踏實(shí)前行,努力向?qū)崿F(xiàn)AGI的目標(biāo)不斷靠近?!?/p>
這些表態(tài),似乎也是對(duì)近期傳言的回應(yīng)。4月24日,澎湃新聞?dòng)浾攉@悉,外界關(guān)注的全新系列模型DeepSeek-V4的預(yù)覽版本正式上線并同步開源。DeepSeek-V4擁有百萬(wàn)字超長(zhǎng)上下文,在Agent能力、世界知識(shí)和推理性能上均實(shí)現(xiàn)國(guó)內(nèi)與開源領(lǐng)域的領(lǐng)先。模型按大小分為兩個(gè)版本:
API服務(wù)已同步更新,通過(guò)修改model_name為deepseek-v4-pro或deepseek-v4-flash即可調(diào)用。
相比前代模型,DeepSeek-V4-Pro的Agent能力顯著增強(qiáng)。在AgenticCoding評(píng)測(cè)中,V4-Pro已達(dá)到當(dāng)前開源模型最佳水平,并在其他Agent相關(guān)評(píng)測(cè)中同樣表現(xiàn)優(yōu)異。目前DeepSeek-V4已成為公司內(nèi)部員工使用的AgenticCoding模型,據(jù)評(píng)測(cè)反饋使用體驗(yàn)優(yōu)于Sonnet4.5,交付質(zhì)量接近Opus4.6非思考模式,但仍與Opus4.6思考模式存在一定差距。
DeepSeek-V4-Pro在世界知識(shí)測(cè)評(píng)中,大幅領(lǐng)先其他開源模型,僅稍遜于頂尖閉源模型Gemini-Pro-3.1。
在數(shù)學(xué)、STEM、競(jìng)賽型代碼的測(cè)評(píng)中,DeepSeek-V4-Pro超越當(dāng)前所有已公開評(píng)測(cè)的開源模型,取得了比肩世界頂級(jí)閉源模型的優(yōu)異成績(jī)。
相比DeepSeek-V4-Pro,DeepSeek-V4-Flash在世界知識(shí)儲(chǔ)備方面稍遜一籌,但展現(xiàn)出了接近的推理能力。而由于模型參數(shù)和激活更小,相較之下V4-Flash能夠提供更加快捷、經(jīng)濟(jì)的API服務(wù)。在Agent測(cè)評(píng)中,DeepSeek-V4-Flash在簡(jiǎn)單任務(wù)上與DeepSeek-V4-Pro旗鼓相當(dāng),但在高難度任務(wù)上仍有差距。
值得注意的是,DeepSeek-V4開創(chuàng)了一種全新的注意力機(jī)制,在token維度進(jìn)行壓縮,結(jié)合DSA稀疏注意力(DeepSeekSparseAttention),實(shí)現(xiàn)了全球領(lǐng)先的長(zhǎng)上下文能力,并且相比于傳統(tǒng)方法大幅降低了對(duì)計(jì)算和顯存的需求。從現(xiàn)在開始,1M(一百萬(wàn))上下文將是DeepSeek所有官方服務(wù)的標(biāo)配。
DeepSeek-V4針對(duì)ClaudeCode、OpenClaw、OpenCode、CodeBuddy等主流的Agent產(chǎn)品進(jìn)行了適配和優(yōu)化,在代碼任務(wù)、文檔生成任務(wù)等方面表現(xiàn)均有提升。
目前,DeepSeekAPI 已同步上線 V4-Pro 與 V4-Flash,支持 OpenAIChatCompletions 接口與 Anthropic 接口。訪問(wèn)新模型時(shí),base_url 不變,model 參數(shù)需要改為deepseek-v4-pro 或deepseek-v4-flash。

DeepSeek官方提供的模型價(jià)格
V4-Pro與V4-Flash最大上下文長(zhǎng)度為1M,均同時(shí)支持非思考模式與思考模式,其中思考模式支持reasoning_effort 參數(shù)設(shè)置思考強(qiáng)度(high/max)。對(duì)于復(fù)雜的Agent場(chǎng)景建議使用思考模式,并設(shè)置強(qiáng)度為max。
DeepSeek在去年春節(jié)的現(xiàn)象級(jí)走紅,曾一度被捧上神壇,不過(guò),伴隨國(guó)產(chǎn)AI的競(jìng)速加劇,來(lái)自智譜、MiniMax、Kimi等大模型公司的迅速迭代,DeepSeek正在面臨激烈競(jìng)爭(zhēng)。
近期,DeepSeek被首次開啟外部融資、人才流失等眾多外界聲音困擾,此前4月18日,澎湃新聞?dòng)浾邚亩辔粍?chuàng)投圈人士處證實(shí),DeepSeek正在開啟其首次外部融資。此前據(jù)外媒報(bào)道,DeepSeek目標(biāo)估值超過(guò)100億美元,據(jù)外媒援引知情人士透露,DeepSeek已開始與投資人接觸,計(jì)劃融資至少3億美元以補(bǔ)充資金儲(chǔ)備,應(yīng)對(duì)成本日益高昂的AI軍備大賽。
根據(jù)澎湃新聞?dòng)浾卟稍L梳理,去年以來(lái),DeepSeek已經(jīng)流失多位核心成員,其中大部分為“95后”青年科學(xué)家:
4月12日,自動(dòng)駕駛公司元戎啟行對(duì)外確認(rèn),DeepSeek多模態(tài)模型核心貢獻(xiàn)者阮翀已加盟公司出任首席科學(xué)家,DeepSeek第一代大語(yǔ)言模型(LLM)核心作者王炳宣,近期宣布加盟騰訊;DeepSeek-OCR系列核心作者魏浩然也在今年春節(jié)前后離職,但尚未披露正式入職哪家大廠。4月16日,前DeepSeek核心研究員郭達(dá)雅被曝加盟字節(jié)跳動(dòng),去年11月12日,前DeepSeek核心研究員羅福莉官宣加盟小米。在基座大模型(LLM)、智能體(Agent)、文本識(shí)別(OCR)、多模態(tài)等多方面領(lǐng)域,DeepSeek均有核心人才流失。
4月8日,在最新版本中,DeepSeek輸入框上方新增“快速模式”與“專家模式”,網(wǎng)頁(yè)顯示,快速模式適合日常對(duì)話,即時(shí)響應(yīng),支持圖片和文件中的文字識(shí)別;專家模式擅長(zhǎng)復(fù)雜問(wèn)題,這也是DeepSeek在官網(wǎng)頁(yè)面首次引入分層模式。
相關(guān)動(dòng)態(tài),讓DeepSeek更新V4的懸念成為大家討論的熱點(diǎn),當(dāng)時(shí)澎湃新聞?dòng)浾咴?jīng)報(bào)道,DeepSeek大概率在今年4月正式上線V4版本,DeepSeek內(nèi)部人士也曾向記者表示:非常期待。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2026 上海東方報(bào)業(yè)有限公司




