- +1
看播客|從認(rèn)知科學(xué)出發(fā),AI科學(xué)家聊凡人之軀和機(jī)器的競(jìng)賽
【編者按】當(dāng)機(jī)器寫下第一行詩(shī),我們對(duì)自己大腦的認(rèn)識(shí)也開始改變。這幾周,商業(yè)機(jī)會(huì)和失業(yè)恐懼同時(shí)成為熱議GPT 時(shí)的關(guān)鍵詞。但這個(gè)領(lǐng)域的科學(xué)家或許有著不太一樣的思考:例如當(dāng)機(jī)器認(rèn)知在飛躍,我們對(duì)人類自己的認(rèn)知是否也有新認(rèn)識(shí)。
“聲東擊西”播客與在智能語(yǔ)言模型領(lǐng)域耕耘多年的專家、中國(guó)人民大學(xué)高瓴人工智能學(xué)院長(zhǎng)聘副教授宋睿華,從人腦的認(rèn)知過程出發(fā),探討人類與人工智能在理解世界過程上的異同、能力上的邊界,進(jìn)而解釋為什么在AI時(shí)代,我們需要更多向內(nèi)在、向真實(shí)世界探索來(lái)培育人的獨(dú)特性,更好地與AI共處。
“用有限的語(yǔ)法創(chuàng)造出無(wú)限的句子”不再獨(dú)屬于人類語(yǔ)言
聲東擊西:六年前您就已經(jīng)在讓人工智能寫詩(shī)了,人類史上第一本人工智能詩(shī)集《陽(yáng)光失了玻璃窗》,就是用您團(tuán)隊(duì)的核心技術(shù)開發(fā)的,對(duì)么?
睿華:詩(shī)其實(shí)是一個(gè)古老的話題,很早的時(shí)候大家就會(huì)用不同的語(yǔ)言模型寫詩(shī),因?yàn)榇蠹矣X得詩(shī)既是人類智慧、情緒的體現(xiàn),同時(shí)它又可以允許新用法的產(chǎn)生,在詞的拼湊上,哪怕做一點(diǎn)小小的設(shè)計(jì)也會(huì)產(chǎn)生奇妙的結(jié)果。
我2017年的作品,人工智能詩(shī)集《陽(yáng)光失了玻璃窗》,是在RNN(遞歸神經(jīng)網(wǎng)絡(luò))的模型的基礎(chǔ)上完成的,比現(xiàn)在 ChatGPT用的Transformer技術(shù)要早一代。Transformer強(qiáng)大之處在于可以輸入2.5萬(wàn)個(gè)字,它可以往前看很遠(yuǎn)很遠(yuǎn)。

《陽(yáng)光失了玻璃窗》
以前用搜索引擎,可能只能輸入短短10來(lái)個(gè)關(guān)鍵字就很了不起了,并不是因?yàn)槲覀儾荒軌蜃屵@個(gè)輸入框更大,是當(dāng)時(shí)的技術(shù)沒有辦法理解你那么多的要求。關(guān)鍵字越多,要在文檔里找到包含這些關(guān)鍵字的文檔的概率就越小。
ChatGPT會(huì)讓我們反思自己到底是怎么理解語(yǔ)言的。認(rèn)知科學(xué)家也都研究這個(gè)問題,大家可能原先有很多想法,看到 GPT4的效果之后需要再做一次更新了。
人的理解并沒有那么復(fù)雜,我們好像并不是在先知道了是什么語(yǔ)法、詞性,然后又經(jīng)過了很復(fù)雜的分析,才知道了意義。我跟你們?cè)诹奶斓臅r(shí)候,似乎都沒有計(jì)劃過我下一個(gè)字要說什么,但是就說出來(lái)了。因?yàn)槟銈冊(cè)谖业闹車?,作為我的環(huán)境,我就很清楚自己下一個(gè)字要說什么,它是流出來(lái)的。這就是人的智能,說下一個(gè)字的概率非常準(zhǔn)。
曹蔚:喬姆斯基開創(chuàng)了生成語(yǔ)法學(xué),他認(rèn)為人類語(yǔ)言的獨(dú)特性是在于它能在有限語(yǔ)法下創(chuàng)造出無(wú)限的句子。但其實(shí)現(xiàn)在 GPT已經(jīng)擁有了這個(gè)能力。你在翻譯《Louder Than Words》的時(shí)候,認(rèn)為人理解語(yǔ)言其實(shí)不僅僅是學(xué)習(xí)符號(hào),而是通過語(yǔ)言去想象,對(duì)自己身處這個(gè)情景的體驗(yàn),也就是具身模擬??梢越忉屢幌率裁词蔷呱砟M嗎?
睿華:書里一開篇,編造了一個(gè)北極熊鼻子的故事,說以前的水手發(fā)現(xiàn)北極熊在捕捉海豹的時(shí)候,會(huì)捂著鼻子往前走。其實(shí)在書后面會(huì)告訴大家這個(gè)事情根本沒有被證實(shí),是一個(gè)編的故事。
但是語(yǔ)言很厲害,哪怕是沒有發(fā)生的事情,你也能想象出來(lái)。所以他就用這個(gè)例子告訴大家,當(dāng)你聽到比如北極熊愛吃海豹肉,你腦海里就有白色的北極熊,以及一個(gè)模糊的海豹,說到愛吃的時(shí)候你還可能會(huì)有一種想流口水的感覺。
后面馬上就有一句話說,北極熊可以完美地將自己隱身于周遭的冰天雪地。這句話其實(shí)要有一點(diǎn)邏輯才能明白是什么意思。因?yàn)樾枰莱WR(shí)里北極熊是白的、冰天雪地是白的,隱身是指前景和后景的顏色很像的時(shí)候,你不容易發(fā)現(xiàn)它。
這些其實(shí)都不是那么容易理解。那AI怎么辦?AI沒有眼睛,不知道北極熊是白的,也不知道北極是白的,它該怎么知道隱身是什么意思呢?所以具身智能就呼之欲出。
認(rèn)知學(xué)上,在1990年的時(shí)候就有很多人發(fā)現(xiàn),如果我們把文字只當(dāng)成符號(hào),然后像字典那樣去理解語(yǔ)言的話,會(huì)走進(jìn)死胡同,有很多問題解釋不清楚。他們就提出了一種假說,在人類理解語(yǔ)言的時(shí)候,也許不光是語(yǔ)言的區(qū)域在起作用,有可能是在調(diào)動(dòng)視覺、聽覺、感覺和一切其他的器官在一起模擬這個(gè)場(chǎng)景。
聲東擊西:這當(dāng)中有幾個(gè)前提,喬姆斯基說的生成語(yǔ)法學(xué),通過語(yǔ)法來(lái)掌握語(yǔ)言,傳遞意義,沒有辦法解釋很多問題。宋睿華老師贊同認(rèn)知神經(jīng)科學(xué)關(guān)于具身模擬給我們的語(yǔ)言帶來(lái)意義的邏輯。同時(shí)您也提到, GPT 這樣的技術(shù)出現(xiàn)之后,我們對(duì)于人腦是怎么理解世界,機(jī)器怎么理解世界的問題有了反思。所以,這兩種理解的差別在哪里?
睿華:做機(jī)器學(xué)習(xí)的人都會(huì)思考以人為目標(biāo)。大家經(jīng)常會(huì)說人類學(xué)習(xí)的泛化性很好,意思是我只簡(jiǎn)單地看幾個(gè)話筒,我就可以知道其他話筒,哪怕長(zhǎng)得顏色形狀不一樣,顏色不一樣,好像抓住了這個(gè)東西的本質(zhì),能夠應(yīng)對(duì)變化。那么一個(gè)好的模型應(yīng)該泛化性很好,不光能夠記住自己見到的東西,還能夠應(yīng)對(duì)自己沒見過的東西。
今天大家會(huì)覺得這件事情好像對(duì)GPT4很容易,因?yàn)樗臄?shù)據(jù)的空間太大了。以前都是一個(gè)小小的數(shù)據(jù)上建立了一個(gè)模型,然后用在大量的數(shù)據(jù)上,但現(xiàn)在是所有網(wǎng)上的文字都被讀過了,我們很難找出了這個(gè)圈的數(shù)據(jù)。
AI可以對(duì)現(xiàn)存的知識(shí)掌握得很好,但是不能發(fā)明一個(gè)新知識(shí)。今天GPT4,你考不住它也不用害怕,它能不能創(chuàng)造出新值是更加難的部分。
網(wǎng)紅與平臺(tái):AI能完成大部分工作任務(wù),但工作不只是任務(wù)
聲東擊西:OpenAI那篇討論哪些職業(yè)會(huì)被替代的論文您看了嗎?
睿華:沒有,其實(shí)我覺得替代這件事情大家有點(diǎn)太緊張了。我周圍的朋友,其實(shí)很多的時(shí)候他是在利用他的強(qiáng)大的語(yǔ)言能力,去幫他潤(rùn)色論文,去幫他寫一個(gè)email,寫一個(gè)招聘廣告。他一鍵就幫你生成了一個(gè)稿子,你再稍微填一下你的內(nèi)容就好了。這些都是非常好的一些成果。
GPT會(huì)吸收網(wǎng)上大多數(shù)人的看法總結(jié)給你看,但是他不會(huì)去質(zhì)疑其中可能大部分人想錯(cuò)的地方。很多批判思考大家并沒有寫到網(wǎng)上去,以及就是有時(shí)候真理掌握在少數(shù)人手里。你用這種統(tǒng)計(jì)的方法,你找出來(lái)最大概率的一些觀點(diǎn),可能中規(guī)中矩,但并不一定帶來(lái)一些新的思考。
聲東擊西:OpenAI那篇論文當(dāng)中還有說到用科學(xué)的方法去探索一個(gè)事情的能力是不能替代的。
睿華:科技是在前沿,去找大家還沒探索過的東西,網(wǎng)上就找不到這種存量的知識(shí),所以他就很難去替代這一部分。
曹蔚:AI可以完成很多任務(wù),我們的工作當(dāng)然也是由各種任務(wù)構(gòu)成的,但是我們工作最終的要求不是完成任務(wù),而是要去達(dá)到一些結(jié)果。
我們?cè)u(píng)估的是結(jié)果的好壞,以及我們?nèi)タ催@些結(jié)果是不是真的能解決問題和推動(dòng)事情的發(fā)展。我做這個(gè)任務(wù)之后它能實(shí)現(xiàn)的結(jié)果是什么,以及我到底選擇什么任務(wù)去做,我覺得這個(gè)其實(shí)是真正工作里面重要的能力。
GPT在一些地方可能比人類去做這些任務(wù)會(huì)更節(jié)省時(shí)間。那我們要得到的一個(gè)反思是,我可以借助更好的工具。我可以選擇使用工具去節(jié)省我的工作時(shí)間,提升工作效率。
另外一方面它也促使我們?nèi)祟惾タ紤],現(xiàn)有的方法已經(jīng)可以被AI替代,那我有沒有更好的方法去做這個(gè)事?我其實(shí)可以改變方法,不一定要再做這些任務(wù)。
睿華:越早用越好。早用的話是有一個(gè)差的,就是別人還認(rèn)為這個(gè)任務(wù)會(huì)花很長(zhǎng)時(shí)間的時(shí)候,你卻用了這個(gè)工具,花了很短的時(shí)間。
AI也將擁有具身模擬的能力嗎?
聲東擊西:AI下一步的發(fā)展方向是什么?
睿華:大家現(xiàn)在都開始關(guān)注多模態(tài)這個(gè)方向。就是說把文字和視覺、聽覺融合起來(lái)去做一些事情。而且可能要進(jìn)一步追求藝術(shù)性,現(xiàn)在雖然(AI的產(chǎn)出)基本符合語(yǔ)義了,之后會(huì)有更高的追求,大家的標(biāo)準(zhǔn)也在不斷提高。
我這里還想分享一個(gè)故事,有一次我兒子拿著我們家陽(yáng)臺(tái)上一塊方形的、青灰色的瓷磚,表面還有些粗糙的那種,一個(gè)勁地跟我說,媽媽這是我的豬,我的豬可乖了。
我當(dāng)時(shí)就很納悶,我就問他說,你跟我說說這個(gè)瓷磚跟豬有什么共同點(diǎn),你說出3條來(lái),媽媽就認(rèn)。他就想了一會(huì)兒跟我說,第一它們皮膚都很粗糙。我一看,哇,確實(shí)挺像;第二它們都很懶,它不動(dòng);第三是什么我還給忘了,反正他就真說出來(lái)3條,讓人挺驚喜的。
人對(duì)于這種八竿子打不著的東西能找到共通之處,其實(shí)是人們進(jìn)行創(chuàng)作或者創(chuàng)新的很重要的能力。然后我就拿這個(gè)題目去問GPT,一塊瓷磚和一只豬有什么共同點(diǎn)?GPT不知道,很難得地問垮了他。
但小朋友能看到、能體會(huì)到,他的大腦中是有這種多模態(tài)的聯(lián)系的。他就覺得不動(dòng)其實(shí)也可以作為小豬和瓷磚的共同點(diǎn),這就是一種具身模擬。
所以未來(lái)OpenAI一定會(huì)做,現(xiàn)在其實(shí)已經(jīng)在做了。
聲東擊西:那當(dāng)更多感官的數(shù)據(jù)接入之后,我們是可以期待說AI會(huì)有更加顛覆我們想象的飛躍嗎?
睿華:就看這個(gè)數(shù)據(jù)能不能夠收集到那么多。
聲東擊西:喬姆斯基在寫文章批評(píng)OpenAI和GPT這個(gè)路線的時(shí)候說,GPT其實(shí)沒有在更好地模擬人腦,您怎么看?
睿華:我不同意這樣的說法。老一代的人會(huì)比較在乎GPT有沒有真正的“理解”,總覺得這個(gè)理解是一定要像他設(shè)想的那樣到達(dá)語(yǔ)法層面,然后回答他的那些問題。但是今天GPT4可能還沒想到背后的隱喻,但它一樣能回答出來(lái)。它甚至可以在一個(gè)新的場(chǎng)景里回答出來(lái),這個(gè)就是它做到了理解。
我覺得我們要有一根弦去想說,是不是這個(gè)路線不一定是對(duì)的路線,還有沒有其它的可能性,它還缺什么?這個(gè)是一定要思考的,但不能拒絕承認(rèn)GPT4在今天展示出來(lái)的這種能力。
聲東擊西:那您現(xiàn)在還帶學(xué)生嗎?AI會(huì)給教學(xué)帶來(lái)什么樣的轉(zhuǎn)變?關(guān)于怎么教、教什么。
睿華:我經(jīng)常跟我的學(xué)生說,你們不要以為這個(gè)領(lǐng)域是靠大佬們創(chuàng)造出來(lái)的,其實(shí)最厲害的人就是你們現(xiàn)在這個(gè)年紀(jì)的人,你們是主流的用戶,你們的需求就是我們科學(xué)界需要解決的那些需求。
所以多從自身的需求去出發(fā),去想一想,有什么東西不理想,然后把它作為你的研究題目。
關(guān)于教育,GPT也給我們帶來(lái)很多的思考。比如不應(yīng)該讓學(xué)生們?nèi)ゴ罅康赜洃?、背誦,而是要讓他們有critical thinking的能力,讓他們有創(chuàng)造出現(xiàn)有知識(shí)之外的東西的能力。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2026 上海東方報(bào)業(yè)有限公司




