- +1
機構(gòu)解讀谷歌芯片競爭力:參數(shù)不如英偉達(dá),但系統(tǒng)級工程能力使得成本效率旗鼓相當(dāng)
在最新自研TPU(張量處理單元)芯片的推動下,科技巨頭谷歌向AI(人工智能)芯片龍頭英偉達(dá)發(fā)起沖鋒。
近日,研究機構(gòu)SemiAnalysis發(fā)布報告,解釋了谷歌如何成為英偉達(dá)在商用芯片領(lǐng)域最具威脅的競爭對手。SemiAnalysis的模型數(shù)據(jù)顯示,從TCO(總體擁有成本)的角度來看,谷歌第七代TPU芯片在成本效率上對英偉達(dá)構(gòu)成了碾壓優(yōu)勢:客戶采購越多谷歌TPU,能夠節(jié)省的英偉達(dá)GPU資本開支就越多。
SemiAnalysis指出,以O(shè)penAI為例,自從其于2024年5月發(fā)布大模型GPT-4o以來,OpenAI還沒能完成任何“面向下一代前沿模型”的大規(guī)模預(yù)訓(xùn)練部署。盡管OpenAI尚未從英偉達(dá)GPU轉(zhuǎn)向谷歌TPU,但在TPU帶來的競爭壓力下,OpenAI已經(jīng)從英偉達(dá)處獲得了約30%的算力集群報價折扣。
TPU(Tensor Processing Unit)是谷歌于2016年公開的自研AI專用集成芯片(ASIC),主要用于加速機器學(xué)習(xí)模型的訓(xùn)練和推理。與英偉達(dá)的GPU相比,TPU的通用性較差、功能更專一,但功耗也更低。此前,谷歌并不會直接出售TPU,而是允許其他企業(yè)通過谷歌云來進(jìn)行租用。
SemiAnalysis強調(diào),谷歌的AI基礎(chǔ)設(shè)施優(yōu)勢不是在于芯片參數(shù),而是來自其系統(tǒng)級工程能力,也就是說“系統(tǒng)比微架構(gòu)更重要”:“依靠系統(tǒng)設(shè)計、互聯(lián)、編譯器和整體軟硬件協(xié)同,谷歌能夠讓TPU在實際性能和成本效率方面與英偉達(dá)相當(dāng)。”
今年11月,谷歌宣布,公司第七代自研TPU芯片Ironwood即將正式發(fā)布。據(jù)介紹,Ironwood在訓(xùn)練和推理方面的性能比上一代芯片提升了4倍多,采用了先進(jìn)的互聯(lián)架構(gòu),單個POD(AI超級計算機單元)可連接多達(dá)9216顆Ironwood芯片,并通過每秒9.6 Tb(太比特)的突破性ICI(芯片間互聯(lián)網(wǎng)絡(luò))連接成一個“超級pod”,訪問高達(dá)1.77 PB的共享高帶寬內(nèi)存(HBM)。
根據(jù)SemiAnalysis統(tǒng)計的數(shù)據(jù),從技術(shù)角度來看,Ironwood芯片在每秒浮點運算(FLOPs)和內(nèi)存帶寬方面幾乎追上了英偉達(dá)的Blackwell GPU系列。如果谷歌自用該芯片,每顆芯片的TCO比同等配置的英偉達(dá)GB200系統(tǒng)低約44%。
SemiAnalysis認(rèn)為,谷歌正在努力成為“真正差異化的云服務(wù)供應(yīng)商”。今年10月,AI初創(chuàng)公司Anthropic宣布與谷歌達(dá)成合作,將部署多達(dá)100萬個谷歌的TPU芯片以訓(xùn)練旗下AI大模型。在約定部署的100萬顆芯片中,首批約40萬顆最新TPU芯片將由與谷歌共同設(shè)計芯片的博通直接出售給Anthropic,價值約100億美元;剩余的60萬顆芯片則通過谷歌云進(jìn)行租賃。
目前,英偉達(dá)也感受到了來自谷歌的壓力。當(dāng)?shù)貢r間11月25日,有消息稱Meta正在考慮從2027年起在其數(shù)據(jù)中心部署谷歌的TPU(張量處理單元),價值達(dá)到數(shù)十億美元,還可能在明年通過谷歌云租借TPU,令英偉達(dá)當(dāng)天股價盤中一度跌超7%。
對此,英偉達(dá)當(dāng)天公開回應(yīng)稱,公司的GPU“仍領(lǐng)先行業(yè)一代”:“與專為特定AI框架或功能設(shè)計的ASIC(專用集成芯片)相比,英偉達(dá)提供更高的性能、更強的通用性以及更好的可替代性?!?/p>





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2026 上海東方報業(yè)有限公司




