- +1
百川智能創(chuàng)始人王小川:明年中國會有若干大模型超級應(yīng)用產(chǎn)生
·“今年年底之前,國內(nèi)會有幾家公司能夠做到GPT-3.5的水平,到明年也有信心能夠達到GPT-4的水平,但是達到不是超越?!?/u>
·“OpenAI正在研究把1000萬顆GPU連在一起做大模型的技術(shù)。GPT-3.5用了4000顆GPU,做GPT-4是25000顆,英偉達一年生產(chǎn)能力只有100萬顆?!?/u>

10月31日,百川智能創(chuàng)始人兼首席執(zhí)行官王小川在云棲大會上演講。
10月31日,百川智能創(chuàng)始人兼首席執(zhí)行官王小川在杭州舉辦的云棲大會上表示,“我非常堅定地相信,明年中國會有若干款超級應(yīng)用產(chǎn)生?!?/p>
今年4月,作為前搜狗公司CEO的王小川高調(diào)宣布押注大模型,創(chuàng)立AI大模型公司“百川智能”,旨在打造中國版OpenAI。在完成天使輪融資時,百川智能估值超過5億美元。在10月17日完成A1輪融資后,成立不到半年時間的百川智能躋身獨角獸。
在此次會議上,王小川首次對外闡釋了百川智能做大模型的理念,“理想上慢一步,落地上快三步?!蓖跣〈ń榻B,百川智能成立半年發(fā)布了7款大模型,包括日前推出的Baichuan2-192K大模型,其上下文窗口長度達192K(GPT-4支持32K上下文窗口,實測約2.5萬字),能夠處理約35萬個漢字。
王小川判斷,今年年底之前,國內(nèi)會有幾家公司能夠做到GPT-3.5的水平,到明年也有信心能夠達到GPT-4的水平,但是達到不是超越。
談到此前在美國之行中與OpenAI(ChatGPT開發(fā)機構(gòu))的交流時,王小川說,“OpenAI正在研究把1000萬顆GPU連在一起做大模型的技術(shù)。GPT-3.5用了4000顆GPU,做GPT-4是25000顆。英偉達一年的生產(chǎn)能力只有100萬顆,而OpenAI要連接1000萬顆GPU,這樣的想法像登月一樣,所以我內(nèi)心對他們充滿了一種敬畏。”
不過,王小川同時說道,“但是我們在做應(yīng)用方面可能走得更快。”他認為,明年中國會有若干款超級應(yīng)用產(chǎn)生。
“語言模型是通用智能時代的起點,語言模型就是現(xiàn)實世界的數(shù)學(xué)模型,數(shù)據(jù)儲備和算法最終都跟語言相關(guān),真正的智力藏在文科能力之中。從技術(shù)上來說,語言感知比圖片視頻感知更難,同時智力并不是邏輯推理,而是一種抽象和比喻的能力。”他打比方稱,牛頓曾用三大定律把萬物之間的規(guī)律變成了數(shù)學(xué)問題,這對于人類而言是巨大的進步。“今天的大模型也是將語言變成數(shù)學(xué)模型,一旦掌握了語言的規(guī)律就意味著掌握了背后的知識、思考、溝通和文化。”





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2026 上海東方報業(yè)有限公司




