中文字幕国产91无码|AV成人手机在线|av成人先锋在线|911无码在线国产人人操|91蜜桃视频精品免费在线|极品美女A∨片在线看|日韩在线成人视频日韩|电影三级成人黄免费影片|超碰97国产在线|国产成人精品色情免费视频

  • +1

DeepSeek V3.1再更新:緩解中英文混雜,智能體輸出更穩(wěn)定

澎湃新聞記者 范佳來
2025-09-23 10:25
來源:澎湃新聞
? 10%公司 >
聽全文
字號

DeepSeek-V3.1已更新至DeepSeek-V3.1-Terminus版本。

9月22日晚間,據(jù)DeepSeek介紹,此次更新在保持模型原有能力的基礎上,針對用戶反饋的問題進行了改進,包括:語言一致性:緩解中英文混雜、偶發(fā)異常字符等情況。在Agent(智能體)能力方面,進一步優(yōu)化Code Agent與Search Agent的表現(xiàn),DeepSeek-V3.1-Terminus的輸出效果相比前一版本更加穩(wěn)定。

目前,官方App、網(wǎng)頁端、小程序與DeepSeek API模型均已同步更新為DeepSeek-V3.1-Terminus。不過,記者看到這款大模型名為Terminus,意思是“終極版”,或許這也是V3.1最后一次更新。外界觀望下一次大版本更新到底是V4還是R2的到來。

在公開的基準測試成績中,V3.1-Terminus整體較V3.1有所提升,不過其中部分分數(shù)也有下滑,不過在“人類最后考試”(Humanity’s Last Exam)基準上進步較為突出,分數(shù)從 15.9大幅提升至21.7,根據(jù)官網(wǎng)數(shù)據(jù),這一成績僅次于 Grok 4(25.4)和GPT-5(25.3),并略微超越 Gemini 2.5 Pro(21.6)。

值得注意的是,DeepSeek在中英文混雜方面的改進尤為受到歡迎。澎湃新聞記者在社交媒體上看到,不少用戶點贊:“中英文混雜問題在思考時間很長的時候確實會出現(xiàn),遇到過幾次,還在想這是什么問題,這下子正好給解決了?!?/p>

資深AI投資人郭濤向澎湃新聞記者分析稱,本次DeepSeek-V3.1-Terminus版本更新聚焦工程化落地與場景適配,核心突破體現(xiàn)在兩大核心競爭提升:一方面,通過語義層降噪技術顯著改善語言一致性,有效抑制中英文混雜、異常字符等干擾,提升文本生成純凈度;另一方面,深度重構Agent執(zhí)行框架,針對Code Agent的語法解析精度、Search Agent的信息檢索召回率進行專項優(yōu)化,使智能體輸出穩(wěn)定性提升。

此次全渠道(App/網(wǎng)頁/小程序/API)同步升級,展現(xiàn)國產(chǎn)大模型從算法創(chuàng)新向工程可靠性演進的關鍵跨越,標志著國產(chǎn)模型在復雜任務處理、多模態(tài)協(xié)同等工業(yè)化應用層面邁出重要一步,為后續(xù)垂直領域深度賦能奠定更堅實基礎。

作為國產(chǎn)大模型的風向標,DeepSeek的動態(tài)都廣泛被外界關注。

此前9月18日,梁文鋒帶著DeepSeek-R1的研究,登上最新一期國際頂級期刊《自然》(Nature)封面。

今年1月份,國產(chǎn)大模型公司深度求索(DeepSeek)在預印本平臺arxiv公布論文《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》,創(chuàng)始人梁文鋒位于署名之列。

《自然》雜志指出,如此總結DeepSeek-R1帶來的進步:如果訓練出的大模型能夠規(guī)劃解決問題所需的步驟,那么它們往往能夠更好地解決問題。這種“推理”與人類處理更復雜問題的方式類似,但這對人工智能有極大挑戰(zhàn),需要人工干預來添加標簽和注釋。

DeepSeek的研究人員揭示了他們?nèi)绾文軌蛟跇O少的人工輸入下訓練一個模型,并使其進行推理。DeepSeek-R1模型采用強化學習進行訓練。在這種學習中,模型正確解答數(shù)學問題時會獲得高分獎勵,答錯則會受到懲罰。

DeepSeek團隊也首次對外回應“蒸餾”相關質(zhì)疑。論文中表示,對于深度求索V3基礎版(DeepSeek-V3-Base)的訓練數(shù)據(jù)僅使用普通網(wǎng)頁和電子書,未納入任何合成數(shù)據(jù),“不過,我們注意到部分網(wǎng)頁包含大量由OpenAI模型生成的答案,這可能會讓基礎模型間接地從其他強大模型獲取知識。但在預訓練冷卻階段,我們并未刻意加入由OpenAI生成的合成數(shù)據(jù);該階段使用的所有數(shù)據(jù)都是通過網(wǎng)絡爬取自然獲取的。預訓練數(shù)據(jù)集包含大量與數(shù)學和代碼相關的內(nèi)容,這表明深度求索V3基礎版接觸到大量的推理軌跡數(shù)據(jù)?!?/p>

今年1月20日,中國AI初創(chuàng)公司深度求索(DeepSeek)推出大模型DeepSeek-R1引爆AI行業(yè),作為一款開源模型,R1在數(shù)學、代碼、自然語言推理等任務上的性能能夠比肩OpenAIo1模型正式版,并采用MIT許可協(xié)議,支持免費商用、任意修改和衍生開發(fā)等。春節(jié)假期后,國內(nèi)多個行業(yè)龍頭公司均宣布接入DeepSeek。

伴隨AI大模型行業(yè)的日新月異,DeepSeek已經(jīng)更新出R1以外的新版本,但萬眾期待的R2尚未面世。此前8月21日DeepSeek正式發(fā)布DeepSeek-V3.1,稱其為“邁向Agent(智能體)時代的第一步”。

    責任編輯:孫扶
    圖片編輯:樂浴峰
    澎湃新聞報料:021-962866
    澎湃新聞,未經(jīng)授權不得轉(zhuǎn)載
    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網(wǎng)安備31010602000299號

            互聯(lián)網(wǎng)新聞信息服務許可證:31120170006

            增值電信業(yè)務經(jīng)營許可證:滬B2-2017116

            ? 2014-2026 上海東方報業(yè)有限公司