中文字幕国产91无码|AV成人手机在线|av成人先锋在线|911无码在线国产人人操|91蜜桃视频精品免费在线|极品美女A∨片在线看|日韩在线成人视频日韩|电影三级成人黄免费影片|超碰97国产在线|国产成人精品色情免费视频

  • +1

研究表明:AI聊天機(jī)器人在創(chuàng)造性思維任務(wù)上超越大部分人類

趙熙熙/中國科學(xué)報(bào)
2023-09-15 07:59
未來2% >
聽全文
字號(hào)

當(dāng)前AI對(duì)話機(jī)器人的創(chuàng)意能力已與人類相當(dāng)。但作者也指出,他們只評(píng)價(jià)了涉及創(chuàng)造性評(píng)估的單項(xiàng)任務(wù)的表現(xiàn)。

《科學(xué)報(bào)告》9月14日發(fā)表的一項(xiàng)研究指出,大型語言模型(LLM)人工智能(AI)對(duì)話機(jī)器人在創(chuàng)造性思維任務(wù)上能夠超越大部分人類。該任務(wù)要求受試者想出日常用品的替代用途,這是發(fā)散性思維的一個(gè)例子。不過,得分最高的人類受試者依然能超過對(duì)話機(jī)器人的最佳答案。

發(fā)散性思維通常是指與創(chuàng)造性相關(guān)的一類思維過程,需要為特定任務(wù)想出各種不同創(chuàng)意或?qū)Σ?。發(fā)散性思維一般通過替代用途任務(wù)(AUT)進(jìn)行評(píng)估,受試者被要求在短時(shí)間內(nèi)想出某個(gè)日常用品的其他用途,越多越好。受試者的回答從4個(gè)類別進(jìn)行打分:流利度、靈活性、原創(chuàng)性和精細(xì)度。

在這項(xiàng)研究中,ChatGPT3、ChatGPT4和Copy.Ai完成了4個(gè)物品,即繩子、盒子、鉛筆、蠟燭的AUT,芬蘭圖爾庫大學(xué)的Mika Koivisto和挪威卑爾根大學(xué)的Simone Grassini隨后將其與人類的答案進(jìn)行了比較。

研究人員根據(jù)語義距離即回答與物品原始用途的相關(guān)度,和創(chuàng)造性回答的原創(chuàng)性打分。他們用一個(gè)計(jì)算方法在0~2的范圍里量化語義距離,同時(shí)讓不知道作答者身份的人類打分者在1~5的范圍里客觀評(píng)價(jià)創(chuàng)造性。

平均而言,對(duì)話機(jī)器人的回答在語義距離(0.95相對(duì)于0.91)和創(chuàng)造性(2.91相對(duì)于2.47)的得分上顯著高于人類的回答。人類回答在這兩項(xiàng)的得分差距更大——最低分遠(yuǎn)低于AI的回答,但最高分普遍比AI高。最佳人類回答在8個(gè)評(píng)分項(xiàng)中的7項(xiàng)都超過了所有對(duì)話機(jī)器人的最佳回答。

這項(xiàng)研究結(jié)果表明,當(dāng)前AI對(duì)話機(jī)器人的創(chuàng)意能力已與人類相當(dāng)。但作者也指出,他們只評(píng)價(jià)了涉及創(chuàng)造性評(píng)估的單項(xiàng)任務(wù)的表現(xiàn)。作者認(rèn)為,今后的研究或探索如何將AI融入創(chuàng)造性過程來提升人類表現(xiàn)。

相關(guān)論文信息:

https://doi.org/10.1038/s41598-023-40858-3

    責(zé)任編輯:吳躍偉
    圖片編輯:沈軻
    澎湃新聞報(bào)料:021-962866
    澎湃新聞,未經(jīng)授權(quán)不得轉(zhuǎn)載
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號(hào)

            滬公網(wǎng)安備31010602000299號(hào)

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116

            ? 2014-2026 上海東方報(bào)業(yè)有限公司