- +1
阿里除夕開源千問3.5:性能媲美Gemini 3 Pro, 實現(xiàn)原生多模態(tài)模型代際躍遷
2月16日除夕當(dāng)天,阿里巴巴開源全新一代大模型千問Qwen3.5-Plus,性能媲美Gemini 3 Pro。千問3.5實現(xiàn)了底層模型架構(gòu)的全面革新,此次發(fā)布的Qwen3.5-Plus版本總參數(shù)為3970億,激活僅170億,以小勝大,性能超過萬億參數(shù)的Qwen3-Max模型,部署顯存占用降低60%,推理效率大幅提升,最大推理吞吐量可提升至19倍。Qwen3.5-Plus的API價格每百萬Token低至0.8元,僅為Gemini 3 Pro的1/18。
據(jù)介紹,與前幾代的千問大語言模型不同,千問3.5實現(xiàn)了從純文本模型到原生多模態(tài)模型的代際躍遷。千問3預(yù)訓(xùn)練在純文本Tokens上進行,而千問3.5則基于視覺和文本混合token上預(yù)訓(xùn)練,并大幅新增中英文、多語言、STEM和推理等數(shù)據(jù),以不到40%的參數(shù)量獲得超萬億的Qwen3-Max基座模型的頂尖性能:千問3.5在MMLU-Pro知識推理評測中得分87.8分,超越GPT-5.2;在博士級難題GPQA測評中斬獲88.4分,高于Claude 4.5;在指令遵循IFBench以76.5分刷新所有模型紀(jì)錄;而在通用Agent評測BFCL-V4、搜索Agent評測Browsecomp等基準(zhǔn)中,千問3.5表現(xiàn)均超越Gemini 3 Pro、GPT-5.2。
千問3.5性能躍升的背后,是對Transformer經(jīng)典架構(gòu)的重大創(chuàng)新突破。

圖注:千問3.5推理效率大幅提升
此外,基于頂級視覺能力,千問3.5也實現(xiàn)了從Agent框架到Agent應(yīng)用的新突破。千問3.5可自主操作手機與電腦,高效完成日常任務(wù),在移動端支持更多主流APP與指令,在PC端可處理更復(fù)雜的多步驟操作,如跨應(yīng)用數(shù)據(jù)整理、自動化流程執(zhí)行等,顯著提升操作效率。
同時,千問團隊構(gòu)建了一個可擴展的Agent異步強化學(xué)習(xí)框架,端到端可加速3到5倍,并將插件式智能體Agent支持?jǐn)U展至百萬級規(guī)模。
和阿里發(fā)布于2025年9月的最強基礎(chǔ)模型Qwen3-Max相比,通過訓(xùn)練穩(wěn)定優(yōu)化以及多token預(yù)測等系列技術(shù),Qwen3.5性能與Qwen3-Max模型持平,并進一步提升了推理效率:在常用的32K上下文場景中,千問3.5推理吞吐量可提升8.6倍;在256K超長上下文情況下,Qwen3.5推理吞吐量最大提升至19倍,推理效率大幅提升。
目前,千問APP、PC端已第一時間接入Qwen3.5-Plus模型。阿里很快將繼續(xù)開源不同尺寸、不同功能的千問3.5系列模型,性能更強的旗艦?zāi)P蚎wen3.5-Max不久也將發(fā)布。
最近春節(jié)檔AI大戰(zhàn)愈發(fā)激烈,不僅僅是多家AI應(yīng)用“撒錢”吸引用戶,多個國產(chǎn)大模型也頻頻上新。
字節(jié)跳動旗下AI視頻生成模型Seedance2.0憑借多模態(tài)輸入、文本/圖片生成電影級視頻等出色能力引爆網(wǎng)絡(luò),吸引全球關(guān)注。馬斯克轉(zhuǎn)發(fā)評論Seedance 2.0相關(guān)推文,并表示:模型發(fā)展速度太快(It's happening fast),導(dǎo)演賈樟柯在社交平臺發(fā)文表示:“Seedance 2.0確實厲害,我準(zhǔn)備用它做個短片。”
“目前在AI視頻生成領(lǐng)域,Seedance可謂是遙遙領(lǐng)先?!睒I(yè)內(nèi)人士向澎湃新聞記者介紹,“在技術(shù)能力上,它確實已經(jīng)超過Sora(OpenAI旗下視頻大模型)和Google Veo3.1、NanoBanana(谷歌旗下圖像視頻大模型),這是國產(chǎn)大模型第一次在真正意義上做到世界第一,具有標(biāo)志性意義?!?/p>
2月14日,字節(jié)跳動宣布推出豆包大模型2.0(Doubao-Seed-2.0)系列。豆包2.0針對大規(guī)模生產(chǎn)環(huán)境的使用需求進行系統(tǒng)性優(yōu)化,旨在更好地完成真實世界的復(fù)雜任務(wù)。
在技術(shù)細(xì)節(jié)上,豆包方面披露,在語言模型基礎(chǔ)能力上,豆包2.0 Pro旗艦版取得IMO、CMO數(shù)學(xué)競賽和ICPC編程競賽金牌成績,也超越了Gemini 3 Pro在Putnam基準(zhǔn)測試上的表現(xiàn),數(shù)學(xué)和推理能力達到世界頂尖水平。
阿里千問C端事業(yè)群總裁吳嘉披露,2月6日,阿里千問APP“春節(jié)30億大免單”正式上線,發(fā)起奶茶攻勢,請全國人民用AI一句話免費點奶茶,在阿里歷史上的春節(jié)活動中投入最大。第一天的實際訂單達到1500萬單,是原來預(yù)計的15倍,一度火到用戶無法下單,2月14日,千問啟動第二波免單活動,將AI大戰(zhàn)推向高潮。
吳嘉表示,千問做這件事的初衷,并不是為了和誰卷,從來沒有想過內(nèi)卷,真正想的是讓AI融進老百姓的日常生活場景中,“這是未來一定會發(fā)生的事情?!彼麍孕胚@一波的AI應(yīng)用,中國一定會走在世界的最前列,模型則會在各家之間的你追我趕中,不斷往前發(fā)展。
2月12日,智譜正式上線并開源其新一代旗艦?zāi)P虶LM-5,這個新模型正是此前在全球模型服務(wù)平臺OpenRouter登頂熱度榜首、引發(fā)圈內(nèi)瘋狂猜測的神秘模型“Pony Alpha”。
2月13日,MiniMax正式上線新一代文本模型MiniMax M2.5,在編程能力方面,M2.5在權(quán)威榜單SWE-Bench Verified得分80.2%、Multi-SWE-Bench得分51.3%,較上一代顯著提升。
2月13日,據(jù)DeepSeek官方披露,DeepSeek網(wǎng)頁/ APP正在測試新的長文本模型結(jié)構(gòu),支持1M上下文,其API 服務(wù)不變,仍為V3.2,僅支持128K上下文。也被外界認(rèn)為,DeepSeek或?qū)⒃诮衲甏汗?jié)再次“炸場”發(fā)布新模型,復(fù)刻去年春節(jié)現(xiàn)象級轟動。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2026 上海東方報業(yè)有限公司




