- +1
Meta發(fā)布四款自研AI推理芯片,最高性能達(dá)10 petaflops
Meta Platforms公司今日宣布已設(shè)計(jì)出四款定制芯片,用于支持其內(nèi)部人工智能工作負(fù)載。
該公司上次更新處理器開發(fā)進(jìn)展是在2024年。當(dāng)年4月,Meta發(fā)布了一款功耗為90瓦的定制AI加速器。而今天發(fā)布的四款加速器中最先進(jìn)的一款熱設(shè)計(jì)功耗達(dá)到1700瓦。
Meta在2024年4月發(fā)布的定制芯片MTIA 200專門用于運(yùn)行排序和推薦模型。這些神經(jīng)網(wǎng)絡(luò)幫助Meta決定在用戶信息流中顯示哪些帖子和廣告。
今天發(fā)布的第一款新芯片MTIA 300專注于相同的應(yīng)用場景。該芯片在處理MX8格式數(shù)據(jù)時(shí)可提供1.2 petaflops的性能,配備216GB的HBM內(nèi)存。
Meta工程師團(tuán)隊(duì)在今日的博客文章中寫道:"MTIA 300包含一個(gè)計(jì)算芯片、兩個(gè)網(wǎng)絡(luò)芯片和多個(gè)HBM堆棧。每個(gè)計(jì)算芯片包含一個(gè)處理單元網(wǎng)格,并配有一些冗余處理單元以提高良品率。"
MTIA 300是四款新發(fā)布芯片中唯一已在生產(chǎn)環(huán)境中部署的產(chǎn)品。其他三款處理器支持更廣泛的應(yīng)用場景。除了排序和推薦工作負(fù)載外,它們還能運(yùn)行生成式AI軟件,如大語言模型。
產(chǎn)品線中最先進(jìn)的MTIA 500芯片在處理MX8數(shù)據(jù)時(shí)可提供10 petaflops的性能。它還支持更高效的MX4數(shù)據(jù)格式。這項(xiàng)技術(shù)減少了AI模型回答提示時(shí)需要分析的字節(jié)數(shù),從而加快處理速度。
MTIA 500使用四個(gè)邏輯芯片進(jìn)行計(jì)算。這些模塊被多個(gè)HBM內(nèi)存堆棧環(huán)繞,總共可存儲(chǔ)高達(dá)516GB的數(shù)據(jù),是MTIA 300的兩倍。該處理器的組件清單還包括一個(gè)SoC芯片,負(fù)責(zé)在主機(jī)服務(wù)器之間傳輸信息。
MTIA 500預(yù)計(jì)將于2027年投產(chǎn),同時(shí)推出的還有功能相似但性能稍低的MTIA 450芯片。這兩款處理器都針對生成式AI推理工作負(fù)載進(jìn)行了優(yōu)化。它們包含專門設(shè)計(jì)的電路,用于加速推理工作流程中特定的硬件密集型元素,如FlashAttention。這是一種流行的注意力機(jī)制實(shí)現(xiàn)方式,大語言模型用它來分析輸入數(shù)據(jù)。
Meta工程師寫道:"在系統(tǒng)層面,MTIA 400、450和500都使用相同的機(jī)箱、機(jī)架和網(wǎng)絡(luò)基礎(chǔ)設(shè)施。因此,每一代新芯片都可以直接替換到相同的物理空間中,加速從硅片到生產(chǎn)部署的過渡。我們的模塊化、可重用設(shè)計(jì)還最大限度地減少了開發(fā)和部署多代芯片所需的資源。"
Meta使用定制編譯器為其MTIA芯片優(yōu)化AI模型。另一個(gè)定制軟件模塊Hoot集體通信庫管理處理器之間的數(shù)據(jù)流。它使用位于內(nèi)存單元附近的晶體管執(zhí)行某些計(jì)算,減少數(shù)據(jù)傳輸時(shí)間,從而提升性能。
這些芯片的發(fā)布距離Meta同意從英偉達(dá)公司和超微半導(dǎo)體公司購買價(jià)值數(shù)十億美元的處理器不到一個(gè)月。大約同一時(shí)間,消息人士:這家Facebook母公司還計(jì)劃采用谷歌的TPU加速器。據(jù)報(bào)道,該公司將使用這些芯片來運(yùn)行大語言模型。
Q&A
Q1:MTIA 500芯片有什么特殊性能?
A:MTIA 500是Meta最先進(jìn)的AI芯片,在處理MX8數(shù)據(jù)時(shí)可提供10 petaflops的性能,還支持更高效的MX4數(shù)據(jù)格式。該芯片使用四個(gè)邏輯芯片進(jìn)行計(jì)算,配備516GB的HBM內(nèi)存,預(yù)計(jì)2027年投產(chǎn)。
Q2:Meta為什么要自研AI芯片?
A:Meta自研芯片主要用于支持內(nèi)部人工智能工作負(fù)載,包括排序推薦模型和生成式AI軟件如大語言模型。通過定制芯片,Meta可以更好地優(yōu)化AI模型性能,減少對外部供應(yīng)商的依賴。
Q3:MTIA芯片系列有哪些不同型號(hào)?
A:Meta發(fā)布了四款MTIA芯片:MTIA 200專門用于排序推薦,MTIA 300已投產(chǎn)并提供1.2 petaflops性能,MTIA 450和500都支持生成式AI推理,其中MTIA 500性能最強(qiáng)達(dá)10 petaflops。
本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場,澎湃新聞僅提供信息發(fā)布平臺(tái)。申請澎湃號(hào)請用電腦訪問http://renzheng.thepaper.cn。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2026 上海東方報(bào)業(yè)有限公司




