- +1
周伯文:缺乏專業(yè)推理能力是當下前沿模型的一大短板
“科學發(fā)現(xiàn)是AI的下一個前沿陣地,大規(guī)模深度推理將賦能科學發(fā)現(xiàn),科學發(fā)現(xiàn)亦將反哺推理能力的進化?!鄙虾H斯ぶ悄軐嶒炇抑魅?、首席科學家周伯文日前在第四十屆人工智能協(xié)會年會(AAAI 2026)發(fā)布特邀報告。周伯文表示,當前我們已身處通用人工智能的前夕,但仍缺失通專融合的智能,亟需推動科學智能從1.0向2.0迭代演進,即從AI4S邁向AGI4S。
AGI必須打破通專二元對立
人工智能的發(fā)展歷程并非線性堆疊,而是呈現(xiàn)出明顯的階段性躍遷?;仡橝I發(fā)展的歷史坐標,有助于厘清當前所處的位置及未來的方向。
早在1996年涉足AI研究之初,周伯文便開始思考智能的本質,在擔任IBM人工智能基礎研究院院長期間便提出了通往通用人工智能的戰(zhàn)略路線圖,將AI發(fā)展分為三個關鍵階段:ANI(狹義人工智能)、ABI(廣義人工智能)與AGI。
在周伯文看來,ANI在2016年已趨于成熟,而通往AGI的必經之路并非直接躍遷,而是必須率先實現(xiàn)具備跨領域泛化能力的ABI。這一跨越需要技術范式的根本性變革,最少包括從有監(jiān)督學習轉向自監(jiān)督學習、從人類分割任務級聯(lián)式系統(tǒng)轉向端到端架構、從判別式工具進化為生成式助手。ChatGPT的問世第一次驗證了人工智能系統(tǒng)同時達成這三方面變革,實質上宣告了ABI階段的到來。這一歷史性突破驗證了規(guī)模法則(Scaling Law)的有效性,通過擴大Transformer架構并將“下一個詞預測”作為優(yōu)化目標,人類首次實現(xiàn)了對世界知識的壓縮。
Scaling Law賦予大語言模型廣泛的泛化能力(ABI),通往AGI的下一步,不僅僅是計算量的堆疊,“通專融合”是一條可探索的路徑,其核心思想是動態(tài)實行融合人類認知思維的“系統(tǒng)1”(直覺式快思考)和“系統(tǒng)2”(邏輯式慢思考),以應對各種現(xiàn)實世界的任務。
過去70年,AI的發(fā)展長期在“專業(yè)性”與“通用性”兩個維度上分別進展。以AlphaFold為代表的早期系統(tǒng)是極致的“專家”,在特定領域超越人類卻缺乏遷移能力;而當前的大語言模型則是博聞廣識的“通才”,雖具廣度但在處理復雜專業(yè)任務時往往難以企及專家深度和缺失關鍵細節(jié)。
周伯文表示,真正的AGI必須打破這種二元對立,構建一種能夠動態(tài)融合系統(tǒng)1與系統(tǒng)2的智能架構,即在保持通用認知基座的同時,能夠在任意特定任務上通過持續(xù)學習與深度推理實現(xiàn)專家級的專精。上海AI實驗室提出的智者SAGE技術架構便是旨在彌合廣泛泛化與深度專精鴻溝的統(tǒng)一認知生態(tài)系統(tǒng)。
過度依賴現(xiàn)有模型可能阻礙創(chuàng)新
人工智能的下一個前沿領域是什么?周伯文認為是科學發(fā)現(xiàn)(Scientific Discovery, SD)?!俺丝茖W智能(AI for Science, AI4S)所承諾的治愈癌癥等諸多益處之外,科學發(fā)現(xiàn)更是推理智能的終極考驗,因此也是AI探索的絕對前沿?!彼硎?,科學發(fā)現(xiàn)是已知與未知之間復雜的相互作用,涵蓋了從假設生成、實驗驗證到理論總結的全過程。
這對AI提出了三重挑戰(zhàn):一是已知的未知,典型的如組合爆炸,比如分子設計或材料科學的搜索空間高達量級,遠超傳統(tǒng)遍歷能力;二是未知的未知,科學探索本質上是對分布外知識的泛化,是對模型創(chuàng)造力的真正考驗;三是稀疏與延遲獎勵,科學實驗的周期長、反饋慢,是對強化學習算法的嚴峻測試。
盡管以AlphaFold為代表的AI for Science(AI4S)技術在蛋白質折疊、氣象預測等特定領域取得了里程碑式成就,但近期《Nature》發(fā)表的研究指出,過度依賴現(xiàn)有深度學習模型可能局限新知識的探索邊界,甚至在某種程度上阻礙創(chuàng)新。
周伯文表示,擅長處理數(shù)據(jù)充足、定義明確任務的傳統(tǒng)深度學習,如果僅作為工具存在,難以應對科學發(fā)現(xiàn)中“未知的未知”。系統(tǒng)性的評估進一步揭示了當前前沿模型的短板。上海人工智能實驗室聯(lián)合來自10個不同科學領域的100位科學家設計了評估體系,結果顯示,前沿模型在通用科學推理任務中得分可達50分(滿分為100分),但在專項文獻檢索、具體實驗方案設計等各類專業(yè)推理任務中,得分驟降至15-30分。
這種明顯的木桶效應表明,科學發(fā)現(xiàn)全周期的效能正受制于專業(yè)推理能力的薄弱環(huán)節(jié)。因此,整合通用推理與專業(yè)能力,進而推動科學智能從AI4S向AGI4S迭代成為必然選擇。從AI4S邁向AGI4S,這一升級旨在推動研究者、研究工具與研究對象的協(xié)同演進。通過AGI促進三者相互作用、協(xié)同演進、螺旋式上升,將創(chuàng)造出真正革命的工具,推動科研范式變革。
周伯文表示,當前我們已身處通用人工智能的前夕,但仍缺失通專融合的智能,亟需推動科學智能從1.0向2.0迭代演進,即從AI4S邁向AGI4S。他認為,可深度專業(yè)化通用模型(Specializable Generalist)是實現(xiàn)AGI的可行路徑,其關鍵挑戰(zhàn)與思路在于,專家化模型在訓練過程中需要低成本、能規(guī)模化的密集反饋,能夠持續(xù)不斷地學習與主動探索,并具備為同一個問題提供多視角、多種解決方案的能力。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網新聞信息服務許可證:31120170006
增值電信業(yè)務經營許可證:滬B2-2017116
? 2014-2026 上海東方報業(yè)有限公司




