- +1
阿里千問最強(qiáng)推理模型問世:采用全新測(cè)試時(shí)擴(kuò)展機(jī)制,性能比肩GPT-5.2

阿里正式發(fā)布千問最強(qiáng)AI(人工智能)模型。
1月26日晚間,阿里正式發(fā)布預(yù)告已久的千問旗艦推理模型Qwen3-Max-Thinking。據(jù)介紹,該模型創(chuàng)下數(shù)項(xiàng)權(quán)威評(píng)測(cè)全球新紀(jì)錄,性能媲美GPT-5.2、Gemini 3 Pro,成為迄今為止最接近國際頂尖模型的國內(nèi)最強(qiáng)AI大模型。通義團(tuán)隊(duì)還為其引入了兩項(xiàng)核心創(chuàng)新:自適應(yīng)工具調(diào)用能力和測(cè)試時(shí)擴(kuò)展技術(shù)(Test-Time Scaling)。
從參數(shù)來看,千問新模型總參數(shù)超萬億(1T),預(yù)訓(xùn)練數(shù)據(jù)量高達(dá)36T Tokens,是目前阿里規(guī)模最大、能力最強(qiáng)的千問推理模型。該模型進(jìn)行了更大規(guī)模的強(qiáng)化學(xué)習(xí)后訓(xùn)練,并通過推理技術(shù)的系列創(chuàng)新,最終完成模型性能的大幅飛躍。
此前,預(yù)覽版Qwen3-Max-Thinking已斬獲數(shù)學(xué)推理AIME 25和HMMT 25的國內(nèi)首個(gè)雙滿分。在此基礎(chǔ)上,阿里通義團(tuán)隊(duì)進(jìn)行了更大規(guī)模的強(qiáng)化學(xué)習(xí)后訓(xùn)練,全面提升了正式版Qwen3-Max-Thinking性能。
在多項(xiàng)關(guān)鍵性能基準(zhǔn)測(cè)試中,千問表現(xiàn)超過了GPT-5.2、Claude Opus 4.5和Gemini 3 Pro等頂尖模型,刷新科學(xué)知識(shí)(GPQA Diamond)、數(shù)學(xué)推理(IMO-AnswerBench)、代碼編程(LiveCodeBench)等多項(xiàng)關(guān)鍵性能基準(zhǔn)測(cè)試的全球紀(jì)錄。

千問在多項(xiàng)關(guān)鍵性能基準(zhǔn)測(cè)試中的表現(xiàn)。來源:阿里云
據(jù)介紹,在關(guān)鍵的模型推理能力提升中,千問新模型采用了一種全新的測(cè)試時(shí)擴(kuò)展機(jī)制。業(yè)界普遍的推理時(shí)計(jì)算,只會(huì)簡(jiǎn)單增加并行推理路徑,重復(fù)推導(dǎo)已知結(jié)論,造成冗余推理效率低下;而千問采用的這一新機(jī)制,可對(duì)此前推理的結(jié)果進(jìn)行“經(jīng)驗(yàn)提取”式的提煉,并據(jù)此進(jìn)行多輪自我迭代,在相同的上下文中實(shí)現(xiàn)更高效的推理計(jì)算,獲得更智能的推理結(jié)果。
此外,Qwen3-Max-Thinking還大幅增強(qiáng)了自主調(diào)用工具的原生Agent能力。具體而言,通義團(tuán)隊(duì)對(duì)模型進(jìn)一步在大量多樣化任務(wù)上進(jìn)行了基于規(guī)則獎(jiǎng)勵(lì)與模型獎(jiǎng)勵(lì)的聯(lián)合強(qiáng)化學(xué)習(xí)訓(xùn)練。模型能夠自主選用搜索、個(gè)性化記憶和代碼解釋器等三個(gè)核心的Agent工具功能,提供和專業(yè)人士一樣水平的回答。同時(shí),模型幻覺也大為降低。
目前,普通用戶可以通過千問PC端和網(wǎng)頁端試用模型,開發(fā)者可在QwenChat上免費(fèi)體驗(yàn)Qwen3-Max-Thinking模型,企業(yè)可通過阿里云百煉獲取新模型API服務(wù)。據(jù)了解,千問APP也即將接入新模型,所有用戶都可免費(fèi)體驗(yàn)。
阿里Qwen大模型的研發(fā)始于2022年,已經(jīng)成為全球排名第一的開源大模型。大模型Qwen3-Max發(fā)布于2025年9月,是通義千問家族中最大、最強(qiáng)的基礎(chǔ)模型。
26日當(dāng)天,阿里巴巴美股(NYSE:BABA)跌1.07%收于每股171.38美元,總市值4091億美元;港股(9988.HK)27日盤前漲超2%。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2026 上海東方報(bào)業(yè)有限公司




