下載客戶端

登錄

谷歌全面反擊！PaLM 2模型挑戰(zhàn)GPT-4，產(chǎn)品通通AI化

澎湃新聞?dòng)浾?邵文

2023-05-11 08:39

來(lái)源：澎湃新聞

聽全文

·PaLM 2模型提供了不同規(guī)模的四個(gè)版本，其中輕量級(jí)的Gecko模型可以在移動(dòng)設(shè)備上運(yùn)行，速度非常快，不聯(lián)網(wǎng)也能在設(shè)備上運(yùn)行。谷歌還推出了兩個(gè)專業(yè)領(lǐng)域大模型，其中，Med-PaLM 2能回答各種醫(yī)學(xué)問題，是首個(gè)在美國(guó)醫(yī)療執(zhí)照考試中達(dá)到專家水平的大語(yǔ)言模型。

谷歌首席執(zhí)行官桑達(dá)爾·皮查伊 (Sundar Pichai) 在2023年I/O開發(fā)者大會(huì)上。

在ChatGPT推出之后，谷歌一度發(fā)布內(nèi)部“紅色警報(bào)”（red code），被媒體稱為遭遇“柯達(dá)時(shí)刻”（形容膠卷被數(shù)碼照相替代）。久被唱衰之后，谷歌在北京時(shí)間5月11日的最新一屆I/O開發(fā)者大會(huì)上官宣大語(yǔ)言模型PaLM 2（Pathways Language Model 2），稱其在部分任務(wù)上超越GPT-4。

谷歌首席執(zhí)行官桑達(dá)爾·皮查伊（Sundar Pichai）在加州山景城海岸圓形劇場(chǎng)的演講中表示，PaLM 2是該公司最新的AI模型，同時(shí)谷歌的研究重心正在轉(zhuǎn)向開發(fā)更大的模型Gemini，這是一種多模態(tài)和高效的機(jī)器學(xué)習(xí)工具。

除此之外，谷歌也官宣會(huì)將Duet AI整合進(jìn)谷歌辦公全家桶Workspace；聊天機(jī)器人Bard全面升級(jí)并向所有人開放；谷歌云將上線多個(gè)基礎(chǔ)大模型，為行業(yè)提供更進(jìn)一步的生成式AI服務(wù)，等等。

在長(zhǎng)達(dá)兩個(gè)小時(shí)的演講中，谷歌拋開以往的謹(jǐn)慎形象，從各個(gè)角度介紹了最新的大模型技術(shù)如何應(yīng)用在了谷歌產(chǎn)品體系的幾乎所有方面。

皮查伊宣布PaLM 2。(2:18)

PaLM 2部分結(jié)果超越GPT-4

實(shí)際上，這一波由ChatGPT帶來(lái)的AI熱潮，其背后關(guān)鍵技術(shù)即是2017年谷歌提出的transformer架構(gòu)。2022年4月，PaLM第一個(gè)版本的模型發(fā)布。而在微軟和OpenAI在大模型技術(shù)上先聲奪人之后，這一次PaLM 2的發(fā)布顯然被谷歌寄予厚望。

在I/O開發(fā)者大會(huì)上，皮查伊宣布推出PaLM 2預(yù)覽版本，利用谷歌最新的TPU算力基礎(chǔ)設(shè)施提升了訓(xùn)練速度。由于它的構(gòu)建方式是將計(jì)算、優(yōu)化擴(kuò)展、改進(jìn)的數(shù)據(jù)集混合以及模型架構(gòu)改進(jìn)結(jié)合在一起，因此服務(wù)效率更高，同時(shí)整體表現(xiàn)更好。

PaLM 2模型提供了不同規(guī)模的四個(gè)版本，從小到大依次為“壁虎” （Gecko），“水獺”（Otter）、“野?！保˙ison）、“獨(dú)角獸”，更易于針對(duì)各種用例進(jìn)行部署。其中輕量級(jí)的Gecko模型可以在移動(dòng)設(shè)備上運(yùn)行，速度非常快，不聯(lián)網(wǎng)也能在設(shè)備上運(yùn)行出色的交互式應(yīng)用程序。

PaLM 2在超過100種語(yǔ)言的多語(yǔ)言文本上進(jìn)行了訓(xùn)練。

據(jù)介紹，PaLM 2在超過100種語(yǔ)言的多語(yǔ)言文本上進(jìn)行了訓(xùn)練，這使得它在語(yǔ)言理解、生成和翻譯上的能力更強(qiáng)，并且會(huì)更加擅長(zhǎng)常識(shí)推理、數(shù)學(xué)邏輯分析。

PaLM 2的數(shù)據(jù)集中有海量論文和網(wǎng)頁(yè)，其中包含非常多的數(shù)學(xué)表達(dá)式。在這些數(shù)據(jù)的訓(xùn)練后，PaLM 2能輕松解決數(shù)學(xué)問題，甚至是制作圖表。

根據(jù)基準(zhǔn)測(cè)試，對(duì)于具有思維鏈prompt（提示）或自洽性的MATH、GSM8K和MGSM基準(zhǔn)評(píng)估，PaLM 2的部分結(jié)果超越了GPT-4。

根據(jù)基準(zhǔn)測(cè)試，PaLM 2的部分結(jié)果超越了GPT-4。

PaLM 2 是在具有100+語(yǔ)言的語(yǔ)料庫(kù)上進(jìn)行訓(xùn)練的，因此它更擅長(zhǎng)多語(yǔ)言任務(wù)，能夠理解、生成和翻譯比以往模型更細(xì)致多樣化的文本。

PaLM 2 通過了“精通”（mastery）級(jí)別的高級(jí)語(yǔ)言能力考試。比起PaLM，在最新專業(yè)語(yǔ)言熟練度考試中的表現(xiàn)，PaLM 2的日語(yǔ)水平達(dá)到了A級(jí)，而PaLM達(dá)到了F級(jí)。PaLM 2的法語(yǔ)水平達(dá)到了C1級(jí)。在相關(guān)論文中，谷歌工程師聲稱PaLM 2的語(yǔ)言能力已經(jīng)“足以教授這門語(yǔ)言”，原因是其訓(xùn)練數(shù)據(jù)中的非英語(yǔ)文本更為普遍。

編程方面，PaLM 2現(xiàn)在支持20種編程語(yǔ)言，如Python、JavaScript等常用語(yǔ)言，以及Prolog、Fortran和Verilog等。

此外，基于PaLM 2，谷歌還推出了兩個(gè)專業(yè)領(lǐng)域大模型。一個(gè)是谷歌健康團(tuán)隊(duì)打造的Med-PaLM 2，它能回答各種醫(yī)學(xué)問題，據(jù)介紹是首個(gè)在美國(guó)醫(yī)療執(zhí)照考試中達(dá)到專家水平的大語(yǔ)言模型。

谷歌健康團(tuán)隊(duì)打造的Med-PaLM 2。

目前谷歌正在嘗試讓它具備多模態(tài)能力，比如檢查X光片然后給出診斷。在今年夏天晚些時(shí)候，這個(gè)模型將對(duì)一小部分谷歌云用戶開放。

另一個(gè)專業(yè)大模型是面向網(wǎng)絡(luò)安全維護(hù)的Sec-PaLM 2，它使用人工智能來(lái)幫助分析和解釋潛在惡意腳本的行為，并在非常短的時(shí)間內(nèi)檢測(cè)哪些腳本實(shí)際上對(duì)個(gè)人和組織構(gòu)成威脅。

另外，在Google Brain和DeepMind合并之后，新的大模型也在研制過程當(dāng)中。皮查伊表示現(xiàn)在谷歌的研究重心正在轉(zhuǎn)向Gemini——一種多模態(tài)和高效的機(jī)器學(xué)習(xí)工具。該模型是在今年才開始研發(fā)的，將具有像GPT-4一樣的萬(wàn)億參數(shù)。目前，Gemini仍在訓(xùn)練中，但已經(jīng)展示出了以往模型中從未見過的多模態(tài)能力。

DeepMind副總裁祖賓·加赫拉馬尼（Zoubin Ghahramani）在介紹PaLM 2的博客中表示，他們發(fā)現(xiàn)模型并不總是越大越好。“壁虎”非常輕巧甚至能在移動(dòng)設(shè)備上離線運(yùn)行，也就是說在手機(jī)也能運(yùn)行交互式應(yīng)用程序，同時(shí)保證速度（每秒可處理20個(gè)token）。這意味著微調(diào)PaLM 2會(huì)更加方便，由此它也能支持更多產(chǎn)品和應(yīng)用。

英偉達(dá)AI研究員Jim Fan對(duì)這樣的嘗試表示贊同，“下一波LLM（大型語(yǔ)言模型）將是移動(dòng)原生的。一個(gè)離線的、永遠(yuǎn)在線的LLM不僅可以降低服務(wù)成本，而且還為用戶體驗(yàn)開辟了全新的途徑。例如，一個(gè)元應(yīng)用程序可以從你的移動(dòng)工作流程中學(xué)習(xí)，并為你實(shí)現(xiàn)自動(dòng)化。在小屏幕上節(jié)省的生產(chǎn)力，將比在大屏幕上多得多?！?/p>

PaLM 2技術(shù)報(bào)告。

當(dāng)天，谷歌一同發(fā)布了PaLM 2技術(shù)報(bào)告（https://ai.google/static/documents/palm2techreport.pdf），整整 91 頁(yè)。但是，PaLM 2論文遠(yuǎn)沒初代PaLM有誠(chéng)意，和GPT-4一樣，更像是技術(shù)報(bào)告。

谷歌研究副總裁Zoubin Ghahramani承認(rèn)，在打擊AI產(chǎn)生的虛假信息方面，還有很長(zhǎng)的路要走。谷歌特地介紹了開發(fā)AI技術(shù)的社會(huì)責(zé)任感，包括兩個(gè)判別AI生成內(nèi)容的工具：嵌入水印和嵌入元數(shù)據(jù)。

谷歌全線產(chǎn)品接入PaLM 2大模型

目前谷歌的聊天機(jī)器人Bard以及超過25個(gè)AI產(chǎn)品和功能，都由PaLM 2作為底層技術(shù)支持。具體的表現(xiàn)之一是Duet AI，一個(gè)類似于微軟365 Copilot的產(chǎn)品、能夠內(nèi)嵌在各種辦公軟件中的AI助手。

谷歌在開發(fā)者大會(huì)上推出新工具Duet AI。(2:13)

在發(fā)布會(huì)現(xiàn)場(chǎng)，谷歌展示了Duet AI在Gmail、Google Docs、Google Sheets中的能力。它可以根據(jù)提示補(bǔ)充郵件內(nèi)容、生成PPT、根據(jù)提示生成圖片素材、一鍵生成表格等。同時(shí)，這個(gè)AI助手也能提供編程幫助，包括實(shí)時(shí)推薦、糾錯(cuò)代碼塊，并且以對(duì)話方式解答編程問題，目前支持Go、JavaScript、Python和SQL。

Duet AI直接從幻燈片中的文本生成圖像。

自動(dòng)生成遛狗業(yè)務(wù)的收費(fèi)表。

用Bard起草郵件，并一鍵導(dǎo)入Gmail。

如果想試用這些新工具，需要注冊(cè)Workspace Labs，加入候補(bǔ)名單?，F(xiàn)在，任何人都可以申請(qǐng)加入候補(bǔ)名單，不過尚不清楚用戶何時(shí)可以訪問。谷歌的說法是，將在未來(lái)幾周內(nèi)將服務(wù)擴(kuò)展到“更多的用戶和國(guó)家”。

為了與微軟必應(yīng)競(jìng)爭(zhēng)，谷歌推出了由PaLM 2驅(qū)動(dòng)的全新搜索引擎。它能夠提供問題回答的摘要，比如問“為什么酵母面包仍然如此受歡迎？”谷歌搜索就給出幾段詳細(xì)描述酵母的味道、其益生元能力的優(yōu)勢(shì)等。另外，在生成內(nèi)容旁給出3個(gè)鏈接，以證明摘要中的內(nèi)容，以減少AI在生成內(nèi)容上出現(xiàn)“幻覺”問題。

在谷歌搜索藍(lán)牙音箱，首先頂部有一個(gè)簡(jiǎn)短的摘要，詳細(xì)說明了購(gòu)買時(shí)應(yīng)注意的事項(xiàng)：電池壽命、防水性、音質(zhì)。右邊是3個(gè)購(gòu)買指南的鏈接，下面是6個(gè)不錯(cuò)選擇的購(gòu)物鏈接，每個(gè)旁邊都有一個(gè)AI生成的摘要。

但是要是想要訪問這一功能，必須選擇Search Generative Experience（SGE）這一新功能。并非所有搜索都會(huì)有AI生成的答案。只有當(dāng)谷歌的算法認(rèn)為它比標(biāo)準(zhǔn)答案更有用時(shí)，AI內(nèi)容才會(huì)出現(xiàn)，而像健康、財(cái)務(wù)等敏感主題就不會(huì)由AI生成。

發(fā)布會(huì)上，谷歌還宣布了一個(gè)重磅消息：聊天機(jī)器人Bard未來(lái)也能像ChatGPT一樣，接入網(wǎng)絡(luò)，實(shí)時(shí)搜索網(wǎng)頁(yè)。

這次，Bard有諸多升級(jí)并很快就會(huì)支持各種第三方擴(kuò)展，例如AI可以自動(dòng)根據(jù)你輸入的文本生成圖像。

谷歌在發(fā)布會(huì)上展示了一個(gè)案例。假如用戶問Bard，美國(guó)的新奧爾良有哪些必看的景點(diǎn)，那么Bard就能圖文并茂地解答這個(gè)問題，就像用戶在谷歌搜圖中問同樣的問題一樣。

另一個(gè)功能是圖像提示系統(tǒng)，由Google Lens提供，它能夠識(shí)別圖片中的物體。比如說，上傳一張狗的照片，然后給一個(gè)prompt“為這兩只狗寫一個(gè)有趣的標(biāo)題”。Google Lens就可以識(shí)別狗的品種，然后Bard就能寫下與狗特征相關(guān)的內(nèi)容。

用Bard為照片寫一個(gè)有趣的標(biāo)題。

通過語(yǔ)言描述讓Bard生成代碼。

谷歌決定取消Bard的等候名單，其將在180個(gè)國(guó)家或地區(qū)提供服務(wù)。

發(fā)布文本生成音樂模型MusicLM

谷歌當(dāng)天還發(fā)布了一種新的實(shí)驗(yàn)性AI工具M(jìn)usicLM，可以將文本描述轉(zhuǎn)化為音樂。 MusicLM可在網(wǎng)絡(luò)、Android或iOS上的AI Test Kitchen應(yīng)用程序中使用，允許用戶輸入諸如“晚宴上的深情爵士樂”或“創(chuàng)造催眠的工業(yè)技術(shù)聲音”的提示，讓該工具創(chuàng)建多個(gè)版本的歌曲。

用戶可以在完善MusicLM生成的作品時(shí)指定“電子”或“古典”等風(fēng)格，以及他們想要的“氛圍、情緒或情感”。

谷歌1月在一篇學(xué)術(shù)論文中預(yù)覽MusicLM時(shí)，表示“沒有立即計(jì)劃”發(fā)布它。論文的合著者指出，像MusicLM這樣的系統(tǒng)會(huì)帶來(lái)許多倫理挑戰(zhàn)，包括將訓(xùn)練數(shù)據(jù)中受版權(quán)保護(hù)的材料整合到生成的歌曲中。

但在接下來(lái)的幾個(gè)月里，谷歌表示它一直在與音樂人士合作并舉辦研討會(huì)，以“了解這項(xiàng)技術(shù)如何為創(chuàng)作過程賦能”。結(jié)果之一是，AI Test Kitchen中的MusicLM版本不會(huì)生成具有特定藝術(shù)家或人聲的音樂。

無(wú)論如何，圍繞生成音樂的更廣泛挑戰(zhàn)不太可能輕易解決。而“深度造假”音樂仍然站在模糊的法律基礎(chǔ)上。

在移動(dòng)終端發(fā)力

相比微軟，谷歌的一點(diǎn)優(yōu)勢(shì)是擁有包括智能手機(jī)、平板電腦及其操作系統(tǒng)在內(nèi)的終端出口，這是它可以發(fā)力并必須抓住的部分。

I/O大會(huì)上，谷歌展示了下一代移動(dòng)操作系統(tǒng)Android 14的新能力。其中，Magic Compose將于今年夏天在谷歌的默認(rèn)短信應(yīng)用Message中推出測(cè)試版，它是一種基于AI生成模型的工具，讓你在回短信的時(shí)候根據(jù)聊天內(nèi)容獲得大量提示。它會(huì)學(xué)習(xí)你的說話方式，你也可以讓自己的回復(fù)內(nèi)容看起來(lái)有不同的語(yǔ)氣，或者用莎士比亞的風(fēng)格來(lái)寫。

谷歌還使用生成式AI來(lái)幫你制作獨(dú)一無(wú)二的手機(jī)壁紙，和AI畫圖一樣使用語(yǔ)言提示完成。

在大會(huì)上，谷歌還發(fā)布了AI筆記本——一個(gè)名叫Tailwind的項(xiàng)目，目標(biāo)受眾定位為學(xué)生。該功能在大學(xué)校園內(nèi)進(jìn)行了廣泛的測(cè)試。

谷歌發(fā)布了AI筆記本項(xiàng)目Tailwind。

Tailwind就像一個(gè)真正的筆記本一樣，可以在里面記筆記，而這些內(nèi)容就是AI學(xué)習(xí)的對(duì)象。

用戶可以從谷歌云端硬盤中挑選文件，創(chuàng)建一個(gè)兼具個(gè)性化和私人屬性的AI模型。在示例演示中，Tailwind收集了一大堆學(xué)習(xí)筆記，然后生成了包括主題詞在內(nèi)的很多內(nèi)容，比如用戶可以為特定主題創(chuàng)建術(shù)語(yǔ)表。

Tailwind操作演示。

Tailwind不僅能為學(xué)生服務(wù)，對(duì)任何從不同來(lái)源獲取信息的人都有幫助。用戶目前可以注冊(cè)Project Tailwind進(jìn)行測(cè)試。

隱藏在Tailwind背后的理念是，為什么不能為每個(gè)用戶定制不同的AI語(yǔ)言模型呢？

三大基礎(chǔ)模型上線谷歌云、安卓開發(fā)小助手等

在宣布了AI方面的一系列更新后，谷歌也為自己的云端機(jī)器學(xué)習(xí)平臺(tái)Vertex AI推出了三款大模型：Codey（text-to-code，幫助程序員寫代碼）、Imagen（text-to-image，生成高質(zhì)量圖像）、Chirp（speech-to-text，方便溝通）。

LLM模型需要大量的計(jì)算能力來(lái)訓(xùn)練和運(yùn)行。認(rèn)識(shí)到這一點(diǎn)，谷歌云在谷歌I/O大會(huì)上宣布了一款新的A3超級(jí)計(jì)算機(jī)虛擬機(jī)。

谷歌在一份聲明中寫道：“A3 GPU VM專為當(dāng)今的機(jī)器學(xué)習(xí)工作負(fù)載提供最高性能的訓(xùn)練而設(shè)計(jì)，配備了現(xiàn)代CPU、改進(jìn)的主機(jī)內(nèi)存、下一代英偉達(dá)GPU和主要網(wǎng)絡(luò)升級(jí)?！?/p>

具體來(lái)說，該公司正在為這些機(jī)器配備英偉達(dá)的H100 GPU，并將其與專門的數(shù)據(jù)中心相結(jié)合，以獲得具有高吞吐量和低延遲的巨大計(jì)算能力。

谷歌將以多種方式提供A3：客戶可以自己運(yùn)行它，或者如果他們?cè)敢?，可以將其作為托管服?wù)運(yùn)行，谷歌會(huì)為他們處理大部分繁重的工作。目前，客戶只能通過注冊(cè)預(yù)覽等候名單來(lái)使用。

除此之外，谷歌I/O大會(huì)上也推出了專為Android開發(fā)的AI編碼機(jī)器人Studio Bot。它不僅可以生成代碼、修復(fù)BUG，甚至能夠回答關(guān)于安卓應(yīng)用開發(fā)的相關(guān)問題。同時(shí)支持Kotlin和Java編程語(yǔ)言，并將直接嵌入到Android Studio開發(fā)工具的工具欄中。

谷歌還宣布推出搜索實(shí)驗(yàn)室，這是一種讓消費(fèi)者在搜索中測(cè)試“大膽的新想法和我們正在探索的想法”的新方式。

搜索實(shí)驗(yàn)室限時(shí)提供三個(gè)主要功能。第一個(gè)稱為搜索生成體驗(yàn)（SGE），將生成式AI直接引入谷歌搜索。 “新的搜索體驗(yàn)可以幫助您快速找到并理解信息?！惫雀璞硎?， “在搜索時(shí)，您可以通過AI驅(qū)動(dòng)的概述、探索更多內(nèi)容的指示以及以自然跟進(jìn)的方式來(lái)了解主題的要點(diǎn)?！钡诙€(gè)功能是，搜索提示還提供代碼提示，使用大型語(yǔ)言模型提供片段和“更快更智能地編寫代碼的指針”。最后，“添加到表格”可以將搜索結(jié)果直接插入到電子表格中。例如，如果計(jì)劃使用表格文檔安排度假，可以直接從谷歌搜索輕松添加鏈接。

責(zé)任編輯：鄭潔

校對(duì)：施鋆

澎湃新聞報(bào)料：021-962866

澎湃新聞，未經(jīng)授權(quán)不得轉(zhuǎn)載

我要舉報(bào)

#谷歌 #PaLM #GPT-4