阿里除夕開源千問3.5：性能媲美Gemini 3 Pro，實現(xiàn)原生多模態(tài)模型代際躍遷

澎湃新聞記者胡含嫣范佳來

2026-02-16 21:02

來源：澎湃新聞

聽全文

2月16日除夕當(dāng)天，阿里巴巴開源全新一代大模型千問Qwen3.5-Plus，性能媲美Gemini 3 Pro。千問3.5實現(xiàn)了底層模型架構(gòu)的全面革新，此次發(fā)布的Qwen3.5-Plus版本總參數(shù)為3970億，激活僅170億，以小勝大，性能超過萬億參數(shù)的Qwen3-Max模型，部署顯存占用降低60%，推理效率大幅提升，最大推理吞吐量可提升至19倍。Qwen3.5-Plus的API價格每百萬Token低至0.8元，僅為Gemini 3 Pro的1/18。

據(jù)介紹，與前幾代的千問大語言模型不同，千問3.5實現(xiàn)了從純文本模型到原生多模態(tài)模型的代際躍遷。千問3預(yù)訓(xùn)練在純文本Tokens上進行，而千問3.5則基于視覺和文本混合token上預(yù)訓(xùn)練，并大幅新增中英文、多語言、STEM和推理等數(shù)據(jù)，以不到40%的參數(shù)量獲得超萬億的Qwen3-Max基座模型的頂尖性能：千問3.5在MMLU-Pro知識推理評測中得分87.8分，超越GPT-5.2；在博士級難題GPQA測評中斬獲88.4分，高于Claude 4.5；在指令遵循IFBench以76.5分刷新所有模型紀(jì)錄；而在通用Agent評測BFCL-V4、搜索Agent評測Browsecomp等基準(zhǔn)中，千問3.5表現(xiàn)均超越Gemini 3 Pro、GPT-5.2。

千問3.5性能躍升的背后，是對Transformer經(jīng)典架構(gòu)的重大創(chuàng)新突破。

圖注：千問3.5推理效率大幅提升

此外，基于頂級視覺能力，千問3.5也實現(xiàn)了從Agent框架到Agent應(yīng)用的新突破。千問3.5可自主操作手機與電腦，高效完成日常任務(wù)，在移動端支持更多主流APP與指令，在PC端可處理更復(fù)雜的多步驟操作，如跨應(yīng)用數(shù)據(jù)整理、自動化流程執(zhí)行等，顯著提升操作效率。

同時，千問團隊構(gòu)建了一個可擴展的Agent異步強化學(xué)習(xí)框架，端到端可加速3到5倍，并將插件式智能體Agent支持?jǐn)U展至百萬級規(guī)模。

和阿里發(fā)布于2025年9月的最強基礎(chǔ)模型Qwen3-Max相比，通過訓(xùn)練穩(wěn)定優(yōu)化以及多token預(yù)測等系列技術(shù)，Qwen3.5性能與Qwen3-Max模型持平，并進一步提升了推理效率：在常用的32K上下文場景中，千問3.5推理吞吐量可提升8.6倍；在256K超長上下文情況下，Qwen3.5推理吞吐量最大提升至19倍，推理效率大幅提升。

目前，千問APP、PC端已第一時間接入Qwen3.5-Plus模型。阿里很快將繼續(xù)開源不同尺寸、不同功能的千問3.5系列模型，性能更強的旗艦?zāi)Ｐ蚎wen3.5-Max不久也將發(fā)布。

最近春節(jié)檔AI大戰(zhàn)愈發(fā)激烈，不僅僅是多家AI應(yīng)用“撒錢”吸引用戶，多個國產(chǎn)大模型也頻頻上新。

字節(jié)跳動旗下AI視頻生成模型Seedance2.0憑借多模態(tài)輸入、文本/圖片生成電影級視頻等出色能力引爆網(wǎng)絡(luò)，吸引全球關(guān)注。馬斯克轉(zhuǎn)發(fā)評論Seedance 2.0相關(guān)推文，并表示：模型發(fā)展速度太快（It's happening fast），導(dǎo)演賈樟柯在社交平臺發(fā)文表示：“Seedance 2.0確實厲害，我準(zhǔn)備用它做個短片。”

“目前在AI視頻生成領(lǐng)域，Seedance可謂是遙遙領(lǐng)先?！睒I(yè)內(nèi)人士向澎湃新聞記者介紹，“在技術(shù)能力上，它確實已經(jīng)超過Sora（OpenAI旗下視頻大模型）和Google Veo3.1、NanoBanana（谷歌旗下圖像視頻大模型），這是國產(chǎn)大模型第一次在真正意義上做到世界第一，具有標(biāo)志性意義?！?/p>

2月14日，字節(jié)跳動宣布推出豆包大模型2.0（Doubao-Seed-2.0）系列。豆包2.0針對大規(guī)模生產(chǎn)環(huán)境的使用需求進行系統(tǒng)性優(yōu)化，旨在更好地完成真實世界的復(fù)雜任務(wù)。

在技術(shù)細(xì)節(jié)上，豆包方面披露，在語言模型基礎(chǔ)能力上，豆包2.0 Pro旗艦版取得IMO、CMO數(shù)學(xué)競賽和ICPC編程競賽金牌成績，也超越了Gemini 3 Pro在Putnam基準(zhǔn)測試上的表現(xiàn)，數(shù)學(xué)和推理能力達到世界頂尖水平。

阿里千問C端事業(yè)群總裁吳嘉披露，2月6日，阿里千問APP“春節(jié)30億大免單”正式上線，發(fā)起奶茶攻勢，請全國人民用AI一句話免費點奶茶，在阿里歷史上的春節(jié)活動中投入最大。第一天的實際訂單達到1500萬單，是原來預(yù)計的15倍，一度火到用戶無法下單，2月14日，千問啟動第二波免單活動，將AI大戰(zhàn)推向高潮。

吳嘉表示，千問做這件事的初衷，并不是為了和誰卷，從來沒有想過內(nèi)卷，真正想的是讓AI融進老百姓的日常生活場景中，“這是未來一定會發(fā)生的事情?！彼麍孕胚@一波的AI應(yīng)用，中國一定會走在世界的最前列，模型則會在各家之間的你追我趕中，不斷往前發(fā)展。

2月12日，智譜正式上線并開源其新一代旗艦?zāi)Ｐ虶LM-5，這個新模型正是此前在全球模型服務(wù)平臺OpenRouter登頂熱度榜首、引發(fā)圈內(nèi)瘋狂猜測的神秘模型“Pony Alpha”。

2月13日，MiniMax正式上線新一代文本模型MiniMax M2.5，在編程能力方面，M2.5在權(quán)威榜單SWE-Bench Verified得分80.2%、Multi-SWE-Bench得分51.3%，較上一代顯著提升。

2月13日，據(jù)DeepSeek官方披露，DeepSeek網(wǎng)頁/ APP正在測試新的長文本模型結(jié)構(gòu)，支持1M上下文，其API 服務(wù)不變，仍為V3.2，僅支持128K上下文。也被外界認(rèn)為，DeepSeek或?qū)⒃诮衲甏汗?jié)再次“炸場”發(fā)布新模型，復(fù)刻去年春節(jié)現(xiàn)象級轟動。

責(zé)任編輯：是冬冬

圖片編輯：李晶昀

澎湃新聞報料：021-962866

澎湃新聞，未經(jīng)授權(quán)不得轉(zhuǎn)載

我要舉報

#阿里 #千問