中文字幕国产91无码|AV成人手机在线|av成人先锋在线|911无码在线国产人人操|91蜜桃视频精品免费在线|极品美女A∨片在线看|日韩在线成人视频日韩|电影三级成人黄免费影片|超碰97国产在线|国产成人精品色情免费视频

  • +1

谷歌全面反擊!PaLM 2模型挑戰(zhàn)GPT-4,產(chǎn)品通通AI化

澎湃新聞?dòng)浾?邵文
2023-05-11 08:39
來(lái)源:澎湃新聞
? 未來(lái)2% >
聽全文
字號(hào)

·PaLM 2模型提供了不同規(guī)模的四個(gè)版本,其中輕量級(jí)的Gecko模型可以在移動(dòng)設(shè)備上運(yùn)行,速度非常快,不聯(lián)網(wǎng)也能在設(shè)備上運(yùn)行。谷歌還推出了兩個(gè)專業(yè)領(lǐng)域大模型,其中,Med-PaLM 2能回答各種醫(yī)學(xué)問題,是首個(gè)在美國(guó)醫(yī)療執(zhí)照考試中達(dá)到專家水平的大語(yǔ)言模型。

 

谷歌首席執(zhí)行官桑達(dá)爾·皮查伊 (Sundar Pichai) 在2023年I/O開發(fā)者大會(huì)上。

在ChatGPT推出之后,谷歌一度發(fā)布內(nèi)部“紅色警報(bào)”(red code),被媒體稱為遭遇“柯達(dá)時(shí)刻”(形容膠卷被數(shù)碼照相替代)。久被唱衰之后,谷歌在北京時(shí)間5月11日的最新一屆I/O開發(fā)者大會(huì)上官宣大語(yǔ)言模型PaLM 2(Pathways Language Model 2),稱其在部分任務(wù)上超越GPT-4。

谷歌首席執(zhí)行官桑達(dá)爾·皮查伊(Sundar Pichai)在加州山景城海岸圓形劇場(chǎng)的演講中表示,PaLM 2是該公司最新的AI模型,同時(shí)谷歌的研究重心正在轉(zhuǎn)向開發(fā)更大的模型Gemini,這是一種多模態(tài)和高效的機(jī)器學(xué)習(xí)工具。

除此之外,谷歌也官宣會(huì)將Duet AI整合進(jìn)谷歌辦公全家桶Workspace;聊天機(jī)器人Bard全面升級(jí)并向所有人開放;谷歌云將上線多個(gè)基礎(chǔ)大模型,為行業(yè)提供更進(jìn)一步的生成式AI服務(wù),等等。

在長(zhǎng)達(dá)兩個(gè)小時(shí)的演講中,谷歌拋開以往的謹(jǐn)慎形象,從各個(gè)角度介紹了最新的大模型技術(shù)如何應(yīng)用在了谷歌產(chǎn)品體系的幾乎所有方面。

皮查伊宣布PaLM 2。(2:18)

PaLM 2部分結(jié)果超越GPT-4

實(shí)際上,這一波由ChatGPT帶來(lái)的AI熱潮,其背后關(guān)鍵技術(shù)即是2017年谷歌提出的transformer架構(gòu)。2022年4月,PaLM第一個(gè)版本的模型發(fā)布。而在微軟和OpenAI在大模型技術(shù)上先聲奪人之后,這一次PaLM 2的發(fā)布顯然被谷歌寄予厚望。

在I/O開發(fā)者大會(huì)上,皮查伊宣布推出PaLM 2預(yù)覽版本,利用谷歌最新的TPU算力基礎(chǔ)設(shè)施提升了訓(xùn)練速度。由于它的構(gòu)建方式是將計(jì)算、優(yōu)化擴(kuò)展、改進(jìn)的數(shù)據(jù)集混合以及模型架構(gòu)改進(jìn)結(jié)合在一起,因此服務(wù)效率更高,同時(shí)整體表現(xiàn)更好。

PaLM 2模型提供了不同規(guī)模的四個(gè)版本,從小到大依次為“壁虎” (Gecko),“水獺”(Otter)、“野?!保˙ison)、“獨(dú)角獸”,更易于針對(duì)各種用例進(jìn)行部署。其中輕量級(jí)的Gecko模型可以在移動(dòng)設(shè)備上運(yùn)行,速度非常快,不聯(lián)網(wǎng)也能在設(shè)備上運(yùn)行出色的交互式應(yīng)用程序。

PaLM 2在超過100種語(yǔ)言的多語(yǔ)言文本上進(jìn)行了訓(xùn)練。

據(jù)介紹,PaLM 2在超過100種語(yǔ)言的多語(yǔ)言文本上進(jìn)行了訓(xùn)練,這使得它在語(yǔ)言理解、生成和翻譯上的能力更強(qiáng),并且會(huì)更加擅長(zhǎng)常識(shí)推理、數(shù)學(xué)邏輯分析。

PaLM 2的數(shù)據(jù)集中有海量論文和網(wǎng)頁(yè),其中包含非常多的數(shù)學(xué)表達(dá)式。在這些數(shù)據(jù)的訓(xùn)練后,PaLM 2能輕松解決數(shù)學(xué)問題,甚至是制作圖表。

根據(jù)基準(zhǔn)測(cè)試,對(duì)于具有思維鏈prompt(提示)或自洽性的MATH、GSM8K和MGSM基準(zhǔn)評(píng)估,PaLM 2的部分結(jié)果超越了GPT-4。

根據(jù)基準(zhǔn)測(cè)試,PaLM 2的部分結(jié)果超越了GPT-4。

PaLM 2 是在具有100+語(yǔ)言的語(yǔ)料庫(kù)上進(jìn)行訓(xùn)練的,因此它更擅長(zhǎng)多語(yǔ)言任務(wù),能夠理解、生成和翻譯比以往模型更細(xì)致多樣化的文本。

PaLM 2 通過了“精通”(mastery)級(jí)別的高級(jí)語(yǔ)言能力考試。比起PaLM,在最新專業(yè)語(yǔ)言熟練度考試中的表現(xiàn),PaLM 2的日語(yǔ)水平達(dá)到了A級(jí),而PaLM達(dá)到了F級(jí)。PaLM 2的法語(yǔ)水平達(dá)到了C1級(jí)。在相關(guān)論文中,谷歌工程師聲稱PaLM 2的語(yǔ)言能力已經(jīng)“足以教授這門語(yǔ)言”,原因是其訓(xùn)練數(shù)據(jù)中的非英語(yǔ)文本更為普遍。

編程方面,PaLM 2現(xiàn)在支持20種編程語(yǔ)言,如Python、JavaScript等常用語(yǔ)言,以及Prolog、Fortran和Verilog等。

此外,基于PaLM 2,谷歌還推出了兩個(gè)專業(yè)領(lǐng)域大模型。一個(gè)是谷歌健康團(tuán)隊(duì)打造的Med-PaLM 2,它能回答各種醫(yī)學(xué)問題,據(jù)介紹是首個(gè)在美國(guó)醫(yī)療執(zhí)照考試中達(dá)到專家水平的大語(yǔ)言模型。

谷歌健康團(tuán)隊(duì)打造的Med-PaLM 2。

目前谷歌正在嘗試讓它具備多模態(tài)能力,比如檢查X光片然后給出診斷。在今年夏天晚些時(shí)候,這個(gè)模型將對(duì)一小部分谷歌云用戶開放。

另一個(gè)專業(yè)大模型是面向網(wǎng)絡(luò)安全維護(hù)的Sec-PaLM 2,它使用人工智能來(lái)幫助分析和解釋潛在惡意腳本的行為,并在非常短的時(shí)間內(nèi)檢測(cè)哪些腳本實(shí)際上對(duì)個(gè)人和組織構(gòu)成威脅。

另外,在Google Brain和DeepMind合并之后,新的大模型也在研制過程當(dāng)中。皮查伊表示現(xiàn)在谷歌的研究重心正在轉(zhuǎn)向Gemini——一種多模態(tài)和高效的機(jī)器學(xué)習(xí)工具。該模型是在今年才開始研發(fā)的,將具有像GPT-4一樣的萬(wàn)億參數(shù)。目前,Gemini仍在訓(xùn)練中,但已經(jīng)展示出了以往模型中從未見過的多模態(tài)能力。

DeepMind副總裁祖賓·加赫拉馬尼(Zoubin Ghahramani)在介紹PaLM 2的博客中表示,他們發(fā)現(xiàn)模型并不總是越大越好。“壁虎”非常輕巧甚至能在移動(dòng)設(shè)備上離線運(yùn)行,也就是說在手機(jī)也能運(yùn)行交互式應(yīng)用程序,同時(shí)保證速度(每秒可處理20個(gè)token)。這意味著微調(diào)PaLM 2會(huì)更加方便,由此它也能支持更多產(chǎn)品和應(yīng)用。

英偉達(dá)AI研究員Jim Fan對(duì)這樣的嘗試表示贊同,“下一波LLM(大型語(yǔ)言模型)將是移動(dòng)原生的。一個(gè)離線的、永遠(yuǎn)在線的LLM不僅可以降低服務(wù)成本,而且還為用戶體驗(yàn)開辟了全新的途徑。例如,一個(gè)元應(yīng)用程序可以從你的移動(dòng)工作流程中學(xué)習(xí),并為你實(shí)現(xiàn)自動(dòng)化。在小屏幕上節(jié)省的生產(chǎn)力,將比在大屏幕上多得多?!?/p>

PaLM 2技術(shù)報(bào)告。

當(dāng)天,谷歌一同發(fā)布了PaLM 2技術(shù)報(bào)告(https://ai.google/static/documents/palm2techreport.pdf),整整 91 頁(yè)。但是,PaLM 2論文遠(yuǎn)沒初代PaLM有誠(chéng)意,和GPT-4一樣,更像是技術(shù)報(bào)告。

谷歌研究副總裁Zoubin Ghahramani承認(rèn),在打擊AI產(chǎn)生的虛假信息方面,還有很長(zhǎng)的路要走。谷歌特地介紹了開發(fā)AI技術(shù)的社會(huì)責(zé)任感,包括兩個(gè)判別AI生成內(nèi)容的工具:嵌入水印和嵌入元數(shù)據(jù)。

谷歌全線產(chǎn)品接入PaLM 2大模型

目前谷歌的聊天機(jī)器人Bard以及超過25個(gè)AI產(chǎn)品和功能,都由PaLM 2作為底層技術(shù)支持。具體的表現(xiàn)之一是Duet AI,一個(gè)類似于微軟365 Copilot的產(chǎn)品、能夠內(nèi)嵌在各種辦公軟件中的AI助手。

谷歌在開發(fā)者大會(huì)上推出新工具Duet AI。(2:13)

在發(fā)布會(huì)現(xiàn)場(chǎng),谷歌展示了Duet AI在Gmail、Google Docs、Google Sheets中的能力。它可以根據(jù)提示補(bǔ)充郵件內(nèi)容、生成PPT、根據(jù)提示生成圖片素材、一鍵生成表格等。同時(shí),這個(gè)AI助手也能提供編程幫助,包括實(shí)時(shí)推薦、糾錯(cuò)代碼塊,并且以對(duì)話方式解答編程問題,目前支持Go、JavaScript、Python和SQL。

Duet AI直接從幻燈片中的文本生成圖像。

自動(dòng)生成遛狗業(yè)務(wù)的收費(fèi)表。

用Bard起草郵件,并一鍵導(dǎo)入Gmail。

如果想試用這些新工具,需要注冊(cè)Workspace Labs,加入候補(bǔ)名單?,F(xiàn)在,任何人都可以申請(qǐng)加入候補(bǔ)名單,不過尚不清楚用戶何時(shí)可以訪問。谷歌的說法是,將在未來(lái)幾周內(nèi)將服務(wù)擴(kuò)展到“更多的用戶和國(guó)家”。

為了與微軟必應(yīng)競(jìng)爭(zhēng),谷歌推出了由PaLM 2驅(qū)動(dòng)的全新搜索引擎。它能夠提供問題回答的摘要,比如問“為什么酵母面包仍然如此受歡迎?”谷歌搜索就給出幾段詳細(xì)描述酵母的味道、其益生元能力的優(yōu)勢(shì)等。另外,在生成內(nèi)容旁給出3個(gè)鏈接,以證明摘要中的內(nèi)容,以減少AI在生成內(nèi)容上出現(xiàn)“幻覺”問題。

在谷歌搜索藍(lán)牙音箱,首先頂部有一個(gè)簡(jiǎn)短的摘要,詳細(xì)說明了購(gòu)買時(shí)應(yīng)注意的事項(xiàng):電池壽命、防水性、音質(zhì)。右邊是3個(gè)購(gòu)買指南的鏈接,下面是6個(gè)不錯(cuò)選擇的購(gòu)物鏈接,每個(gè)旁邊都有一個(gè)AI生成的摘要。

但是要是想要訪問這一功能,必須選擇Search Generative Experience(SGE)這一新功能。并非所有搜索都會(huì)有AI生成的答案。只有當(dāng)谷歌的算法認(rèn)為它比標(biāo)準(zhǔn)答案更有用時(shí),AI內(nèi)容才會(huì)出現(xiàn),而像健康、財(cái)務(wù)等敏感主題就不會(huì)由AI生成。

發(fā)布會(huì)上,谷歌還宣布了一個(gè)重磅消息:聊天機(jī)器人Bard未來(lái)也能像ChatGPT一樣,接入網(wǎng)絡(luò),實(shí)時(shí)搜索網(wǎng)頁(yè)。

這次,Bard有諸多升級(jí)并很快就會(huì)支持各種第三方擴(kuò)展,例如AI可以自動(dòng)根據(jù)你輸入的文本生成圖像。

谷歌在發(fā)布會(huì)上展示了一個(gè)案例。假如用戶問Bard,美國(guó)的新奧爾良有哪些必看的景點(diǎn),那么Bard就能圖文并茂地解答這個(gè)問題,就像用戶在谷歌搜圖中問同樣的問題一樣。

另一個(gè)功能是圖像提示系統(tǒng),由Google Lens提供,它能夠識(shí)別圖片中的物體。比如說,上傳一張狗的照片,然后給一個(gè)prompt“為這兩只狗寫一個(gè)有趣的標(biāo)題”。Google Lens就可以識(shí)別狗的品種,然后Bard就能寫下與狗特征相關(guān)的內(nèi)容。

用Bard為照片寫一個(gè)有趣的標(biāo)題。

通過語(yǔ)言描述讓Bard生成代碼。

谷歌決定取消Bard的等候名單,其將在180個(gè)國(guó)家或地區(qū)提供服務(wù)。

發(fā)布文本生成音樂模型MusicLM

谷歌當(dāng)天還發(fā)布了一種新的實(shí)驗(yàn)性AI工具M(jìn)usicLM,可以將文本描述轉(zhuǎn)化為音樂。 MusicLM可在網(wǎng)絡(luò)、Android或iOS上的AI Test Kitchen應(yīng)用程序中使用,允許用戶輸入諸如“晚宴上的深情爵士樂”或“創(chuàng)造催眠的工業(yè)技術(shù)聲音”的提示,讓該工具創(chuàng)建多個(gè)版本的歌曲。

用戶可以在完善MusicLM生成的作品時(shí)指定“電子”或“古典”等風(fēng)格,以及他們想要的“氛圍、情緒或情感”。

谷歌1月在一篇學(xué)術(shù)論文中預(yù)覽MusicLM時(shí),表示“沒有立即計(jì)劃”發(fā)布它。論文的合著者指出,像MusicLM這樣的系統(tǒng)會(huì)帶來(lái)許多倫理挑戰(zhàn),包括將訓(xùn)練數(shù)據(jù)中受版權(quán)保護(hù)的材料整合到生成的歌曲中。

但在接下來(lái)的幾個(gè)月里,谷歌表示它一直在與音樂人士合作并舉辦研討會(huì),以“了解這項(xiàng)技術(shù)如何為創(chuàng)作過程賦能”。結(jié)果之一是,AI Test Kitchen中的MusicLM版本不會(huì)生成具有特定藝術(shù)家或人聲的音樂。

無(wú)論如何,圍繞生成音樂的更廣泛挑戰(zhàn)不太可能輕易解決。而“深度造假”音樂仍然站在模糊的法律基礎(chǔ)上。

在移動(dòng)終端發(fā)力

相比微軟,谷歌的一點(diǎn)優(yōu)勢(shì)是擁有包括智能手機(jī)、平板電腦及其操作系統(tǒng)在內(nèi)的終端出口,這是它可以發(fā)力并必須抓住的部分。

I/O大會(huì)上,谷歌展示了下一代移動(dòng)操作系統(tǒng)Android 14的新能力。其中,Magic Compose將于今年夏天在谷歌的默認(rèn)短信應(yīng)用Message中推出測(cè)試版,它是一種基于AI生成模型的工具,讓你在回短信的時(shí)候根據(jù)聊天內(nèi)容獲得大量提示。它會(huì)學(xué)習(xí)你的說話方式,你也可以讓自己的回復(fù)內(nèi)容看起來(lái)有不同的語(yǔ)氣,或者用莎士比亞的風(fēng)格來(lái)寫。

谷歌還使用生成式AI來(lái)幫你制作獨(dú)一無(wú)二的手機(jī)壁紙,和AI畫圖一樣使用語(yǔ)言提示完成。

在大會(huì)上,谷歌還發(fā)布了AI筆記本——一個(gè)名叫Tailwind的項(xiàng)目,目標(biāo)受眾定位為學(xué)生。該功能在大學(xué)校園內(nèi)進(jìn)行了廣泛的測(cè)試。

谷歌發(fā)布了AI筆記本項(xiàng)目Tailwind。

Tailwind就像一個(gè)真正的筆記本一樣,可以在里面記筆記,而這些內(nèi)容就是AI學(xué)習(xí)的對(duì)象。

用戶可以從谷歌云端硬盤中挑選文件,創(chuàng)建一個(gè)兼具個(gè)性化和私人屬性的AI模型。在示例演示中,Tailwind收集了一大堆學(xué)習(xí)筆記,然后生成了包括主題詞在內(nèi)的很多內(nèi)容,比如用戶可以為特定主題創(chuàng)建術(shù)語(yǔ)表。

Tailwind操作演示。

Tailwind不僅能為學(xué)生服務(wù),對(duì)任何從不同來(lái)源獲取信息的人都有幫助。用戶目前可以注冊(cè)Project Tailwind進(jìn)行測(cè)試。

隱藏在Tailwind背后的理念是,為什么不能為每個(gè)用戶定制不同的AI語(yǔ)言模型呢?

三大基礎(chǔ)模型上線谷歌云、安卓開發(fā)小助手等

在宣布了AI方面的一系列更新后,谷歌也為自己的云端機(jī)器學(xué)習(xí)平臺(tái)Vertex AI推出了三款大模型:Codey(text-to-code,幫助程序員寫代碼)、Imagen(text-to-image,生成高質(zhì)量圖像)、Chirp(speech-to-text,方便溝通)。

LLM模型需要大量的計(jì)算能力來(lái)訓(xùn)練和運(yùn)行。認(rèn)識(shí)到這一點(diǎn),谷歌云在谷歌I/O大會(huì)上宣布了一款新的A3超級(jí)計(jì)算機(jī)虛擬機(jī)。

谷歌在一份聲明中寫道:“A3 GPU VM專為當(dāng)今的機(jī)器學(xué)習(xí)工作負(fù)載提供最高性能的訓(xùn)練而設(shè)計(jì),配備了現(xiàn)代CPU、改進(jìn)的主機(jī)內(nèi)存、下一代英偉達(dá)GPU和主要網(wǎng)絡(luò)升級(jí)?!?/p>

具體來(lái)說,該公司正在為這些機(jī)器配備英偉達(dá)的H100 GPU,并將其與專門的數(shù)據(jù)中心相結(jié)合,以獲得具有高吞吐量和低延遲的巨大計(jì)算能力。

谷歌將以多種方式提供A3:客戶可以自己運(yùn)行它,或者如果他們?cè)敢?,可以將其作為托管服?wù)運(yùn)行,谷歌會(huì)為他們處理大部分繁重的工作。目前,客戶只能通過注冊(cè)預(yù)覽等候名單來(lái)使用。

除此之外,谷歌I/O大會(huì)上也推出了專為Android開發(fā)的AI編碼機(jī)器人Studio Bot。它不僅可以生成代碼、修復(fù)BUG,甚至能夠回答關(guān)于安卓應(yīng)用開發(fā)的相關(guān)問題。同時(shí)支持Kotlin和Java編程語(yǔ)言,并將直接嵌入到Android Studio開發(fā)工具的工具欄中。

谷歌還宣布推出搜索實(shí)驗(yàn)室,這是一種讓消費(fèi)者在搜索中測(cè)試“大膽的新想法和我們正在探索的想法”的新方式。

搜索實(shí)驗(yàn)室限時(shí)提供三個(gè)主要功能。第一個(gè)稱為搜索生成體驗(yàn)(SGE),將生成式AI直接引入谷歌搜索。 “新的搜索體驗(yàn)可以幫助您快速找到并理解信息?!惫雀璞硎?, “在搜索時(shí),您可以通過AI驅(qū)動(dòng)的概述、探索更多內(nèi)容的指示以及以自然跟進(jìn)的方式來(lái)了解主題的要點(diǎn)?!钡诙€(gè)功能是,搜索提示還提供代碼提示,使用大型語(yǔ)言模型提供片段和“更快更智能地編寫代碼的指針”。最后,“添加到表格”可以將搜索結(jié)果直接插入到電子表格中。例如,如果計(jì)劃使用表格文檔安排度假,可以直接從谷歌搜索輕松添加鏈接。

    責(zé)任編輯:鄭潔
    校對(duì):施鋆
    澎湃新聞報(bào)料:021-962866
    澎湃新聞,未經(jīng)授權(quán)不得轉(zhuǎn)載
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號(hào)

            滬公網(wǎng)安備31010602000299號(hào)

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116

            ? 2014-2026 上海東方報(bào)業(yè)有限公司