- +1
圖靈測(cè)試誕生70年,機(jī)器像人類一樣思考過(guò)時(shí)了么?
作者 | 張依依
1950 年,艾倫·圖靈在《思維》雜志上發(fā)表了其著名論文《計(jì)算機(jī)器與智能》。其中,他提出一個(gè)影響深遠(yuǎn)的問(wèn)題:機(jī)器能思考么?
論文中給出的驗(yàn)證方法是,假設(shè)一個(gè)游戲中有三個(gè)角色,兩名人類,其余一個(gè)是計(jì)算機(jī)。由人類擔(dān)任的評(píng)估員,分別向另兩位提出若干開(kāi)放式的問(wèn)題,如果根據(jù)回答他無(wú)法判斷哪一名是真的人類,那么這個(gè)計(jì)算機(jī)就被認(rèn)為通過(guò)測(cè)試,它就像人類一樣智能。
這就是圖靈的模仿游戲,即如今廣為人知的圖靈測(cè)試。
圖片: 維基百科在它誕生之后的數(shù)十年里,圖靈測(cè)試成為人工智能領(lǐng)域北極星般的存在,科研人員紛紛以其為航標(biāo)而苦心鉆研。上世紀(jì) 60 年代和 70 年代最早的聊天機(jī)器人 ELIZA 和 PARRY, 都是圍繞著通過(guò)測(cè)試的目的而設(shè)計(jì)的。
隨著 AI 技術(shù)的發(fā)展,之后也有許多其他測(cè)試出世,但沒(méi)有一個(gè)能夠與之齊名?!皥D靈測(cè)試展現(xiàn)出極致的簡(jiǎn)單和優(yōu)雅,這讓它在過(guò)去 70 年中長(zhǎng)盛不衰?!?DataRobot 數(shù)據(jù)科學(xué)副總裁扎克·麥耶說(shuō)。
直至今日,亞馬遜智能助理 Alexa 的首席科學(xué)家羅希特·普拉薩德表示,他仍然時(shí)常被媒體、行業(yè)領(lǐng)袖和其他行業(yè)人士追著問(wèn):“ Alexa 什么時(shí)候能通過(guò)圖靈測(cè)試呢?”
近日,普拉薩德撰文整體回應(yīng)了這個(gè)問(wèn)題。他認(rèn)為,是時(shí)候拋棄這個(gè) 70 年來(lái)鞭策人心的傳說(shuō),為人工智能設(shè)立一個(gè)新的挑戰(zhàn)了。
01////
圖靈的神壇
事實(shí)上,在圖靈提出模仿游戲時(shí),人工智能(AI)的概念還尚不存在。直到六年之后,在美國(guó)達(dá)特茅斯大學(xué)的一場(chǎng)研討會(huì)上,它才由計(jì)算機(jī)科學(xué)家約翰·麥卡錫定義,為的是將其與控制論區(qū)分開(kāi)來(lái)。
Forbes 指出,圖靈測(cè)試的巧妙在于,人們不必要去定義什么是“智能”。他將“能否思考”這個(gè)抽象的問(wèn)題,引入了一個(gè)更精準(zhǔn),也看似更實(shí)用的場(chǎng)景。
它也為試圖參與科技進(jìn)步的普通人提供了某種談資。在圖靈 1950 年的論文中,他樂(lè)觀地估計(jì),到 2000 年,計(jì)算機(jī)就將精通模仿游戲,一個(gè)普通的人類評(píng)估員在五分鐘的提問(wèn)后,只有不到 70% 的機(jī)會(huì)作出正確的人機(jī)識(shí)別。
1990 年,紐約商人休·羅布納宣布為第一個(gè)通過(guò)測(cè)試的計(jì)算機(jī)程序頒發(fā) 10 萬(wàn)美元的獎(jiǎng)金。之后,羅布納獎(jiǎng)成為一年一度的“節(jié)目”,參賽者們前赴后繼地將編出的程序提交給圖靈測(cè)試檢驗(yàn)。
#4:能跟我說(shuō)說(shuō)你的夢(mèng)境么?
#8:你覺(jué)得特朗普怎么樣?
#12:烤面包需要準(zhǔn)備什么?
#17:我試圖用鑰匙打開(kāi)鎖,但是有人用口香糖填滿了鑰匙孔,我沒(méi)法把它弄出來(lái)。我弄不出去的是什么東西?
#18:獎(jiǎng)杯沒(méi)法放在棕色的手提箱里因?yàn)樗×?。是什么東西太小了?
(羅布納獎(jiǎng)測(cè)試 2017 部分試題)
但結(jié)果都不盡如人意。2014 年,一個(gè)名為尤金的俄羅斯機(jī)器人越過(guò)了這條 70% 的基準(zhǔn)線,這是有史以來(lái)第一次。在測(cè)試現(xiàn)場(chǎng),有 33% 的裁判對(duì)尤金是人類這點(diǎn)深信不疑。但這被普遍認(rèn)為不具說(shuō)服力,因?yàn)椴门袛?shù)很少,無(wú)法可靠地反映出結(jié)果,也沒(méi)有超過(guò)羅布納后來(lái)設(shè)下的 50% 的判斷錯(cuò)誤率。
而且有“作弊”的嫌疑。隨著時(shí)間的推移,為了通過(guò)圖靈測(cè)試,機(jī)器人使用的策略發(fā)生了變化。最初的障礙僅僅是理解評(píng)委們提出的問(wèn)題,后來(lái)則是試圖以更“像人”的方式回答這些問(wèn)題。近年來(lái),挑戰(zhàn)者開(kāi)始顧左右而言它,通過(guò)向評(píng)委發(fā)起反問(wèn),或模擬情緒和打字錯(cuò)誤,來(lái)變得更像人類。
比如,尤金的策略就是以一個(gè) 13 歲男孩的角色出現(xiàn)?!拔覀兊南敕ㄊ牵谟冉鸬哪挲g,他可以假裝自己無(wú)所不知,但實(shí)際表現(xiàn)出對(duì)于一些事物的無(wú)知也是合理的。”尤金的創(chuàng)造者這樣表示。
艾倫·圖靈的塑像。圖片: 維基共享資源02////
過(guò)時(shí)的測(cè)試
在 AI 領(lǐng)域,目前最讓人興奮的模型之一,是舊金山人工智能公司 OpenAI 開(kāi)發(fā)的 GPT-3。它被認(rèn)為是人工智能的一個(gè)巨大飛躍。它可以生成小說(shuō)、詩(shī)歌、新聞稿、代碼、音樂(lè)甚至笑話。但它仍然無(wú)法通過(guò)圖靈測(cè)試。
這也顯示出,開(kāi)發(fā)者們?nèi)缃癫辉傥▓D靈測(cè)試是尊。無(wú)人駕駛汽車、語(yǔ)音處理和圖像識(shí)別等先進(jìn)技術(shù)的出現(xiàn),這些 70 年前無(wú)法想象的進(jìn)步,都使通過(guò)測(cè)試本身變得不再那么重要。
普拉薩德指出,圖靈測(cè)試對(duì) AI 的高速計(jì)算和信息查找能力幾乎不屑一顧。甚至于很多時(shí)候,機(jī)器需要特意放慢速度,增加停頓,“假裝思考”,來(lái)模仿人類。事實(shí)上,它們的檢索速度要遠(yuǎn)高于人類。
而圖靈測(cè)試也僅限于文本交流,意味著它只能在對(duì)話的層面體現(xiàn)智能。
如今的 AI 在聽(tīng)、看和感受等方面都獲得了拓展。這些都是為了滿足一些更實(shí)用的需求,比如智能家居,語(yǔ)音控制。而“模仿人類”的能力本身,也為人類的未來(lái)制造出更多潛在的問(wèn)題,比如說(shuō)用于實(shí)施釣魚(yú)攻擊的自動(dòng)詐騙機(jī)器人,模仿人類用戶的網(wǎng)絡(luò)機(jī)器人水軍,散布假消息的假賬號(hào)。
普拉薩德認(rèn)為, AI 需要新的基準(zhǔn)測(cè)試,它所追求的目標(biāo)應(yīng)該遠(yuǎn)超普通人類的能力?!八粌H能展現(xiàn)出類似人類的智力屬性——包括常識(shí)、自我監(jiān)督和語(yǔ)言表達(dá),還能完成快速搜索、歷史回溯和替代人類做任務(wù)等機(jī)器的屬性?!?/p>
因此,在 Alexa 的設(shè)計(jì)中,機(jī)器人是更偏重于任務(wù)導(dǎo)向的。即便是對(duì)話機(jī)器人,目的也是幫助人類促進(jìn)學(xué)習(xí)、舒緩身心或是提供消遣。比如在對(duì)話時(shí),機(jī)器人優(yōu)先考慮的是適時(shí)表現(xiàn)出一些幽默感和同理心,而不是假裝自己是人類。
而對(duì)于人類智力的理解,在過(guò)去 70 年中也在不斷進(jìn)步?!白詮膱D靈測(cè)試以來(lái),人類實(shí)際上已經(jīng)通過(guò) fMRI (功能性磁共振成像)發(fā)現(xiàn)了更多關(guān)于我們自身思想和智力的秘密。” DataRobot 首席營(yíng)銷專員本 · 泰勒說(shuō)?!叭绻f(shuō)圖靈測(cè)試是我們的登月計(jì)劃,那現(xiàn)在就來(lái)籌劃一下火星計(jì)劃吧。”
“圖靈測(cè)試并不是一個(gè)糟糕的測(cè)試,但它并不真正衡量智力。” Octane AI 的聯(lián)合創(chuàng)始人本·帕爾解釋道,“我們需要更清晰的知覺(jué)和自我意識(shí)測(cè)試。也許還需要幾十年甚至更長(zhǎng)的時(shí)間,我們才能擁有一臺(tái)真正有知覺(jué)的機(jī)器?!?/p>
慕尼黑的網(wǎng)絡(luò)開(kāi)發(fā)人員 Valentin Vieriu 的 AI 藝術(shù)項(xiàng)目,在其網(wǎng)站上會(huì)無(wú)限生成 AI 畫(huà)作。圖片:art42.net
但無(wú)可否認(rèn)的是,圖靈測(cè)試仍然擁有某種魅力,它極大地激發(fā)了科技界的想象力,讓從業(yè)者們收獲創(chuàng)造的激情。
蘋(píng)果公司聯(lián)合創(chuàng)始人史蒂夫·沃茲尼亞克提出的測(cè)試也同樣有趣,他提議,讓一個(gè)機(jī)器人試圖進(jìn)入你家,找到廚房,并幫你做一杯咖啡。除此之外,還有的測(cè)試試圖讓機(jī)器人觀看電視節(jié)目并提出有意義的問(wèn)題,有的則通過(guò)創(chuàng)造藝術(shù)的能力來(lái)進(jìn)行評(píng)判 AI 的創(chuàng)造力。對(duì)這些考驗(yàn)的求索都在不斷拓寬人們對(duì)機(jī)器能力想象的邊界。
“我相信在本世紀(jì)末,文字使用和通識(shí)教育將進(jìn)步到一種程度,那就是人們可以盡情談?wù)摃?huì)思考的機(jī)器,而不被駁斥?!痹谡撐闹校瑘D靈提出過(guò)這樣的設(shè)想。那至少,在圖靈測(cè)試蒙上時(shí)代灰塵的現(xiàn)在,這個(gè)期盼已經(jīng)成真。
原標(biāo)題:《圖靈測(cè)試誕生 70 年,讓機(jī)器像人類一樣思考過(guò)時(shí)了么?》
本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場(chǎng),澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問(wèn)http://renzheng.thepaper.cn。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2026 上海東方報(bào)業(yè)有限公司




