圖靈測(cè)試誕生70年，機(jī)器像人類一樣思考過(guò)時(shí)了么？

2021-05-17 21:24

來(lái)源：澎湃新聞·澎湃號(hào)·湃客

聽(tīng)全文

作者 | 張依依

1950 年，艾倫·圖靈在《思維》雜志上發(fā)表了其著名論文《計(jì)算機(jī)器與智能》。其中，他提出一個(gè)影響深遠(yuǎn)的問(wèn)題：機(jī)器能思考么？

論文中給出的驗(yàn)證方法是，假設(shè)一個(gè)游戲中有三個(gè)角色，兩名人類，其余一個(gè)是計(jì)算機(jī)。由人類擔(dān)任的評(píng)估員，分別向另兩位提出若干開(kāi)放式的問(wèn)題，如果根據(jù)回答他無(wú)法判斷哪一名是真的人類，那么這個(gè)計(jì)算機(jī)就被認(rèn)為通過(guò)測(cè)試，它就像人類一樣智能。

這就是圖靈的模仿游戲，即如今廣為人知的圖靈測(cè)試。

圖片: 維基百科

在它誕生之后的數(shù)十年里，圖靈測(cè)試成為人工智能領(lǐng)域北極星般的存在，科研人員紛紛以其為航標(biāo)而苦心鉆研。上世紀(jì) 60 年代和 70 年代最早的聊天機(jī)器人 ELIZA 和 PARRY，都是圍繞著通過(guò)測(cè)試的目的而設(shè)計(jì)的。

隨著 AI 技術(shù)的發(fā)展，之后也有許多其他測(cè)試出世，但沒(méi)有一個(gè)能夠與之齊名?！皥D靈測(cè)試展現(xiàn)出極致的簡(jiǎn)單和優(yōu)雅，這讓它在過(guò)去 70 年中長(zhǎng)盛不衰?！?DataRobot 數(shù)據(jù)科學(xué)副總裁扎克·麥耶說(shuō)。

直至今日，亞馬遜智能助理 Alexa 的首席科學(xué)家羅希特·普拉薩德表示，他仍然時(shí)常被媒體、行業(yè)領(lǐng)袖和其他行業(yè)人士追著問(wèn)：“ Alexa 什么時(shí)候能通過(guò)圖靈測(cè)試呢？”

近日，普拉薩德撰文整體回應(yīng)了這個(gè)問(wèn)題。他認(rèn)為，是時(shí)候拋棄這個(gè) 70 年來(lái)鞭策人心的傳說(shuō)，為人工智能設(shè)立一個(gè)新的挑戰(zhàn)了。

01////

圖靈的神壇

事實(shí)上，在圖靈提出模仿游戲時(shí)，人工智能（AI）的概念還尚不存在。直到六年之后，在美國(guó)達(dá)特茅斯大學(xué)的一場(chǎng)研討會(huì)上，它才由計(jì)算機(jī)科學(xué)家約翰·麥卡錫定義，為的是將其與控制論區(qū)分開(kāi)來(lái)。

Forbes 指出，圖靈測(cè)試的巧妙在于，人們不必要去定義什么是“智能”。他將“能否思考”這個(gè)抽象的問(wèn)題，引入了一個(gè)更精準(zhǔn)，也看似更實(shí)用的場(chǎng)景。

它也為試圖參與科技進(jìn)步的普通人提供了某種談資。在圖靈 1950 年的論文中，他樂(lè)觀地估計(jì)，到 2000 年，計(jì)算機(jī)就將精通模仿游戲，一個(gè)普通的人類評(píng)估員在五分鐘的提問(wèn)后，只有不到 70% 的機(jī)會(huì)作出正確的人機(jī)識(shí)別。

1990 年，紐約商人休·羅布納宣布為第一個(gè)通過(guò)測(cè)試的計(jì)算機(jī)程序頒發(fā) 10 萬(wàn)美元的獎(jiǎng)金。之后，羅布納獎(jiǎng)成為一年一度的“節(jié)目”，參賽者們前赴后繼地將編出的程序提交給圖靈測(cè)試檢驗(yàn)。

#4：能跟我說(shuō)說(shuō)你的夢(mèng)境么？

#8：你覺(jué)得特朗普怎么樣？

#12：烤面包需要準(zhǔn)備什么？

#17：我試圖用鑰匙打開(kāi)鎖，但是有人用口香糖填滿了鑰匙孔，我沒(méi)法把它弄出來(lái)。我弄不出去的是什么東西?

#18：獎(jiǎng)杯沒(méi)法放在棕色的手提箱里因?yàn)樗×?。是什么東西太小了？

（羅布納獎(jiǎng)測(cè)試 2017 部分試題）

但結(jié)果都不盡如人意。2014 年，一個(gè)名為尤金的俄羅斯機(jī)器人越過(guò)了這條 70% 的基準(zhǔn)線，這是有史以來(lái)第一次。在測(cè)試現(xiàn)場(chǎng)，有 33% 的裁判對(duì)尤金是人類這點(diǎn)深信不疑。但這被普遍認(rèn)為不具說(shuō)服力，因?yàn)椴门袛?shù)很少，無(wú)法可靠地反映出結(jié)果，也沒(méi)有超過(guò)羅布納后來(lái)設(shè)下的 50% 的判斷錯(cuò)誤率。

而且有“作弊”的嫌疑。隨著時(shí)間的推移，為了通過(guò)圖靈測(cè)試，機(jī)器人使用的策略發(fā)生了變化。最初的障礙僅僅是理解評(píng)委們提出的問(wèn)題，后來(lái)則是試圖以更“像人”的方式回答這些問(wèn)題。近年來(lái)，挑戰(zhàn)者開(kāi)始顧左右而言它，通過(guò)向評(píng)委發(fā)起反問(wèn)，或模擬情緒和打字錯(cuò)誤，來(lái)變得更像人類。

比如，尤金的策略就是以一個(gè) 13 歲男孩的角色出現(xiàn)?！拔覀兊南敕ㄊ牵谟冉鸬哪挲g，他可以假裝自己無(wú)所不知，但實(shí)際表現(xiàn)出對(duì)于一些事物的無(wú)知也是合理的。”尤金的創(chuàng)造者這樣表示。

艾倫·圖靈的塑像。圖片: 維基共享資源

02////

過(guò)時(shí)的測(cè)試

在 AI 領(lǐng)域，目前最讓人興奮的模型之一，是舊金山人工智能公司 OpenAI 開(kāi)發(fā)的 GPT-3。它被認(rèn)為是人工智能的一個(gè)巨大飛躍。它可以生成小說(shuō)、詩(shī)歌、新聞稿、代碼、音樂(lè)甚至笑話。但它仍然無(wú)法通過(guò)圖靈測(cè)試。

這也顯示出，開(kāi)發(fā)者們?nèi)缃癫辉傥▓D靈測(cè)試是尊。無(wú)人駕駛汽車、語(yǔ)音處理和圖像識(shí)別等先進(jìn)技術(shù)的出現(xiàn)，這些 70 年前無(wú)法想象的進(jìn)步，都使通過(guò)測(cè)試本身變得不再那么重要。

普拉薩德指出，圖靈測(cè)試對(duì) AI 的高速計(jì)算和信息查找能力幾乎不屑一顧。甚至于很多時(shí)候，機(jī)器需要特意放慢速度，增加停頓，“假裝思考”，來(lái)模仿人類。事實(shí)上，它們的檢索速度要遠(yuǎn)高于人類。

而圖靈測(cè)試也僅限于文本交流，意味著它只能在對(duì)話的層面體現(xiàn)智能。

如今的 AI 在聽(tīng)、看和感受等方面都獲得了拓展。這些都是為了滿足一些更實(shí)用的需求，比如智能家居，語(yǔ)音控制。而“模仿人類”的能力本身，也為人類的未來(lái)制造出更多潛在的問(wèn)題，比如說(shuō)用于實(shí)施釣魚(yú)攻擊的自動(dòng)詐騙機(jī)器人，模仿人類用戶的網(wǎng)絡(luò)機(jī)器人水軍，散布假消息的假賬號(hào)。

普拉薩德認(rèn)為， AI 需要新的基準(zhǔn)測(cè)試，它所追求的目標(biāo)應(yīng)該遠(yuǎn)超普通人類的能力?！八粌H能展現(xiàn)出類似人類的智力屬性——包括常識(shí)、自我監(jiān)督和語(yǔ)言表達(dá)，還能完成快速搜索、歷史回溯和替代人類做任務(wù)等機(jī)器的屬性?！?/p>

因此，在 Alexa 的設(shè)計(jì)中，機(jī)器人是更偏重于任務(wù)導(dǎo)向的。即便是對(duì)話機(jī)器人，目的也是幫助人類促進(jìn)學(xué)習(xí)、舒緩身心或是提供消遣。比如在對(duì)話時(shí)，機(jī)器人優(yōu)先考慮的是適時(shí)表現(xiàn)出一些幽默感和同理心，而不是假裝自己是人類。

而對(duì)于人類智力的理解，在過(guò)去 70 年中也在不斷進(jìn)步?！白詮膱D靈測(cè)試以來(lái)，人類實(shí)際上已經(jīng)通過(guò) fMRI （功能性磁共振成像）發(fā)現(xiàn)了更多關(guān)于我們自身思想和智力的秘密。” DataRobot 首席營(yíng)銷專員本 · 泰勒說(shuō)?！叭绻f(shuō)圖靈測(cè)試是我們的登月計(jì)劃，那現(xiàn)在就來(lái)籌劃一下火星計(jì)劃吧。”

“圖靈測(cè)試并不是一個(gè)糟糕的測(cè)試，但它并不真正衡量智力。” Octane AI 的聯(lián)合創(chuàng)始人本·帕爾解釋道，“我們需要更清晰的知覺(jué)和自我意識(shí)測(cè)試。也許還需要幾十年甚至更長(zhǎng)的時(shí)間，我們才能擁有一臺(tái)真正有知覺(jué)的機(jī)器?！?/p>慕尼黑的網(wǎng)絡(luò)開(kāi)發(fā)人員 Valentin Vieriu 的 AI 藝術(shù)項(xiàng)目，在其網(wǎng)站上會(huì)無(wú)限生成 AI 畫(huà)作。圖片：art42.net

但無(wú)可否認(rèn)的是，圖靈測(cè)試仍然擁有某種魅力，它極大地激發(fā)了科技界的想象力，讓從業(yè)者們收獲創(chuàng)造的激情。

蘋(píng)果公司聯(lián)合創(chuàng)始人史蒂夫·沃茲尼亞克提出的測(cè)試也同樣有趣，他提議，讓一個(gè)機(jī)器人試圖進(jìn)入你家，找到廚房，并幫你做一杯咖啡。除此之外，還有的測(cè)試試圖讓機(jī)器人觀看電視節(jié)目并提出有意義的問(wèn)題，有的則通過(guò)創(chuàng)造藝術(shù)的能力來(lái)進(jìn)行評(píng)判 AI 的創(chuàng)造力。對(duì)這些考驗(yàn)的求索都在不斷拓寬人們對(duì)機(jī)器能力想象的邊界。

“我相信在本世紀(jì)末，文字使用和通識(shí)教育將進(jìn)步到一種程度，那就是人們可以盡情談?wù)摃?huì)思考的機(jī)器，而不被駁斥?！痹谡撐闹校瑘D靈提出過(guò)這樣的設(shè)想。那至少，在圖靈測(cè)試蒙上時(shí)代灰塵的現(xiàn)在，這個(gè)期盼已經(jīng)成真。

原標(biāo)題：《圖靈測(cè)試誕生 70 年，讓機(jī)器像人類一樣思考過(guò)時(shí)了么？》

閱讀原文

特別聲明

本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布，僅代表該作者或機(jī)構(gòu)觀點(diǎn)，不代表澎湃新聞的觀點(diǎn)或立場(chǎng)，澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問(wèn)http://renzheng.thepaper.cn。

我要舉報(bào)

#圖靈測(cè)試 #圖靈 #人工智能