百川智能創(chuàng)始人王小川：明年中國會有若干大模型超級應(yīng)用產(chǎn)生

澎湃新聞記者邵文

2023-10-31 16:29

來源：澎湃新聞

? 未來2% >

聽全文

·“今年年底之前，國內(nèi)會有幾家公司能夠做到GPT-3.5的水平，到明年也有信心能夠達到GPT-4的水平，但是達到不是超越?！?/u>

·“OpenAI正在研究把1000萬顆GPU連在一起做大模型的技術(shù)。GPT-3.5用了4000顆GPU，做GPT-4是25000顆，英偉達一年生產(chǎn)能力只有100萬顆?！?/u>

10月31日，百川智能創(chuàng)始人兼首席執(zhí)行官王小川在云棲大會上演講。

10月31日，百川智能創(chuàng)始人兼首席執(zhí)行官王小川在杭州舉辦的云棲大會上表示，“我非常堅定地相信，明年中國會有若干款超級應(yīng)用產(chǎn)生?！?/p>

今年4月，作為前搜狗公司CEO的王小川高調(diào)宣布押注大模型，創(chuàng)立AI大模型公司“百川智能”，旨在打造中國版OpenAI。在完成天使輪融資時，百川智能估值超過5億美元。在10月17日完成A1輪融資后，成立不到半年時間的百川智能躋身獨角獸。

在此次會議上，王小川首次對外闡釋了百川智能做大模型的理念，“理想上慢一步，落地上快三步?！蓖跣〈ń榻B，百川智能成立半年發(fā)布了7款大模型，包括日前推出的Baichuan2-192K大模型，其上下文窗口長度達192K（GPT-4支持32K上下文窗口，實測約2.5萬字），能夠處理約35萬個漢字。

王小川判斷，今年年底之前，國內(nèi)會有幾家公司能夠做到GPT-3.5的水平，到明年也有信心能夠達到GPT-4的水平，但是達到不是超越。

談到此前在美國之行中與OpenAI（ChatGPT開發(fā)機構(gòu)）的交流時，王小川說，“OpenAI正在研究把1000萬顆GPU連在一起做大模型的技術(shù)。GPT-3.5用了4000顆GPU，做GPT-4是25000顆。英偉達一年的生產(chǎn)能力只有100萬顆，而OpenAI要連接1000萬顆GPU，這樣的想法像登月一樣，所以我內(nèi)心對他們充滿了一種敬畏。”

不過，王小川同時說道，“但是我們在做應(yīng)用方面可能走得更快。”他認為，明年中國會有若干款超級應(yīng)用產(chǎn)生。

“語言模型是通用智能時代的起點，語言模型就是現(xiàn)實世界的數(shù)學(xué)模型，數(shù)據(jù)儲備和算法最終都跟語言相關(guān)，真正的智力藏在文科能力之中。從技術(shù)上來說，語言感知比圖片視頻感知更難，同時智力并不是邏輯推理，而是一種抽象和比喻的能力。”他打比方稱，牛頓曾用三大定律把萬物之間的規(guī)律變成了數(shù)學(xué)問題，這對于人類而言是巨大的進步。“今天的大模型也是將語言變成數(shù)學(xué)模型，一旦掌握了語言的規(guī)律就意味著掌握了背后的知識、思考、溝通和文化。”

責(zé)任編輯：鄭潔

校對：劉威

澎湃新聞報料：021-962866

澎湃新聞，未經(jīng)授權(quán)不得轉(zhuǎn)載

我要舉報

#百川智能 #大模型 #AI