AI觀察｜Agentic AI帶動(dòng)中國Token出海，算力價(jià)格面臨上行壓力

澎湃新聞?dòng)浾?張靜

2026-03-09 10:29

來源：澎湃新聞

聽全文

3月6日，中興通訊股份有限公司發(fā)布2025年度業(yè)績，雖然凈利下滑，但是該公司算力業(yè)務(wù)實(shí)現(xiàn)了跨越式增長，全年?duì)I收同比增長約150%，該公司表示將持續(xù)構(gòu)建AI端到端能力矩陣，為長期競爭力夯實(shí)基礎(chǔ)。

伴隨著人工智能產(chǎn)業(yè)的快速迭代，應(yīng)用的持續(xù)發(fā)展，算力像水一樣流淌，中國的算力服務(wù)商正迎來一個(gè)全新的發(fā)展機(jī)遇，同時(shí)也不得不直面眾多不期而遇的挑戰(zhàn)。

1月下旬，AI云計(jì)算服務(wù)商派歐云計(jì)算（上海）有限公司（即PPIO）進(jìn)入一種特別的“備戰(zhàn)”狀態(tài)。中國人工智能模型的使用占據(jù)了全球市場的主導(dǎo)地位。彼時(shí)，多家國產(chǎn)大模型廠商密集敲定檔期，不約而同地選擇春節(jié)前后推出新模型。為了保證首發(fā)時(shí)的算力彈性，作為算力服務(wù)商的PPIO，其核心任務(wù)是幫助模型廠商兜住不確定的流量沖擊。

一方面，模型性能持續(xù)提升推動(dòng)Token消耗量暴漲，另一方面，AI編程、OpenClaw等智能體應(yīng)用帶來了巨大的Token需求增量。清華系國產(chǎn)算力軟件企業(yè)北京清程極智科技有限公司聯(lián)合創(chuàng)始人師天麾表示，至少在兩三年之內(nèi)，直接調(diào)用API而無須關(guān)注底層技術(shù)細(xì)節(jié)的MaaS（模型即服務(wù)）還會(huì)保持高增長，算力價(jià)格正在面臨上行壓力。

在PPIO聯(lián)合創(chuàng)始人兼CEO姚欣看來，AI已進(jìn)入到未來一兩年內(nèi)十倍百倍高速增長的時(shí)期，所有沒有準(zhǔn)備好應(yīng)對(duì)這種增長的行業(yè)，短期內(nèi)都會(huì)遇到這種供不應(yīng)求的情況。但就像水波紋那樣慢慢擴(kuò)散，最終會(huì)趨于平穩(wěn)，產(chǎn)能提升。

Agentic AI爆發(fā)推動(dòng)算力增長

在AI模型聚合平臺(tái)OpenRouter上，中國人工智能模型的使用占據(jù)了主導(dǎo)地位。2月24日公布的數(shù)據(jù)顯示，中國大模型占Token總消耗量的61%，這些模型主要應(yīng)用于編程和智能體驅(qū)動(dòng)的工作流程。

周度統(tǒng)計(jì)數(shù)據(jù)顯示，中國模型的Token總消耗量達(dá)5.3萬億，前十大模型總消耗量為8.7萬億Token。該平臺(tái)使用量排名前三的模型均來自中國。受編程應(yīng)用場景推動(dòng)，MiniMax M2.5 Token使用量激增近200%，以單周消耗2.45萬億Token登頂榜首。Kimi K2.5位居第二，消耗1.21萬億Token，智譜GLM-5以7800億Token消耗量排名第三。

應(yīng)用重點(diǎn)的結(jié)構(gòu)性轉(zhuǎn)變支撐了Token的消費(fèi)數(shù)據(jù)。在OpenRouter上，編程已成為Token消耗的最大應(yīng)用類別。此外，自主執(zhí)行多步驟任務(wù)的智能體驅(qū)動(dòng)工作流，消耗的Token占該平臺(tái)輸出Token總量的一半以上。

成立于2007年的北京并行科技股份有限公司董事長陳健告訴澎湃科技，算力服務(wù)已形成模型訓(xùn)練、推理服務(wù)、科學(xué)計(jì)算三大明確場景，用戶需求從算力資源向Token服務(wù)轉(zhuǎn)變。其中，推理服務(wù)與Token消耗深度綁定，是當(dāng)前體量最大、增長最快的場景。大模型應(yīng)用多為輸入少、輸出多，AI編程則呈現(xiàn)輸入輸出雙高特征，Token消耗量呈指數(shù)級(jí)增長。

“目前行業(yè)共識(shí)是，2026年在MaaS領(lǐng)域，Token的需求量至少有十倍增長?！鼻宄虡O智聯(lián)合創(chuàng)始人師天麾對(duì)澎湃科技表示，模型能力持續(xù)提升是Token消耗量暴漲的根本動(dòng)力，其中又以編程和角色扮演類聊天這兩大應(yīng)用的Token消耗量為大。在AI編程中，模型需處理極長的上下文才能準(zhǔn)確編程，開發(fā)者要反復(fù)與模型溝通、調(diào)試、優(yōu)化，長上下文和高頻交互的特點(diǎn)使得編程調(diào)用的Token遠(yuǎn)超普通問答。

而OpenClaw等熱點(diǎn)應(yīng)用的涌現(xiàn)迅速吸引大量用戶，推高Token消耗。未來主要的Token消耗量將集中在OpenClaw等智能體應(yīng)用上?！罢{(diào)用一次智能體實(shí)際上是調(diào)用了多次MaaS或API（應(yīng)用程序接口），比如用智能體點(diǎn)外賣，智能體會(huì)調(diào)用多次API執(zhí)行任務(wù)?！?/p>

編程和聊天的算力消耗以Token為計(jì)，從更廣義的算力消耗來看，以圖片數(shù)量計(jì)價(jià)的圖片生成，以及以時(shí)長和分辨率計(jì)價(jià)的視頻生成，同樣消耗大量算力。

云服務(wù)是AI落地的“輸水管道”。PPIO聯(lián)合創(chuàng)始人兼CEO姚欣對(duì)于算力增長的預(yù)期同樣樂觀，“2024年，模型訓(xùn)練慢慢轉(zhuǎn)向推理，去年推理大爆發(fā)，Token成為核心關(guān)鍵詞，背后和大量國產(chǎn)開源模型的爆發(fā)相關(guān)。到今天，無論是OpenClaw還是AI編程，主題都從生成式AI切換到Agentic AI?！?/p>

由于“算力需求增長實(shí)在太快”，他計(jì)劃進(jìn)一步上調(diào)今年的企業(yè)目標(biāo)。一個(gè)確定性的增長就是AI編程。MiniMax M2.5、Kimi K2.5、智譜GLM-5的AI編程能力基本追平海外半年前的頂尖模型，Token出海的主要消耗幾乎是AI編程。

“在海外，我們已經(jīng)看到的一個(gè)趨勢是，大家不是因?yàn)閲鴥?nèi)模型的Token便宜而使用它，而是因?yàn)樽銐蚝糜貌庞盟?。”這讓PPIO在今年春節(jié)期間面向海外市場推出Coding Plan，“本質(zhì)上，大家購買的是智能能力?！?/p>

產(chǎn)能不足傳導(dǎo)供應(yīng)鏈價(jià)格整體上漲，配套部件擴(kuò)產(chǎn)

推理需求持續(xù)增長，但在算力供給側(cè)，高性價(jià)比的推理顯卡產(chǎn)能有限，國內(nèi)外均稀缺。算力供不應(yīng)求，提高算力價(jià)格是一個(gè)合理選擇。

今年2月，智譜發(fā)布Coding Plan調(diào)價(jià)公告?！坝捎贕LM Coding Plan市場需求持續(xù)強(qiáng)勁增長，用戶規(guī)模與調(diào)用量快速提升”，決定取消首購優(yōu)惠，保留按季按年訂閱優(yōu)惠，套餐價(jià)格整體漲幅自30%起。由于算力供不應(yīng)求，今年以來，智譜多次對(duì)國產(chǎn)芯片集群擴(kuò)容，并限量發(fā)售GLM Coding Plan套餐，招募“算力合伙人”，開放核心技術(shù)接口，針對(duì)GLM-5的底層優(yōu)化，提升軟硬一體化性能。

隨著AI編程等應(yīng)用的普及，陳健表示，并行科技和Token相關(guān)的收入在總營收中的占比正持續(xù)提升。Token使用量和生成質(zhì)量要求同步攀升，推理算力需求持續(xù)高漲，算力價(jià)格面臨上行壓力，產(chǎn)業(yè)鏈價(jià)值向算力供給和模型優(yōu)化端集中。算力網(wǎng)絡(luò)將成為支撐AI應(yīng)用規(guī)?；l(fā)展的核心底層基礎(chǔ)設(shè)施，開發(fā)面向Token生成的專用芯片成為產(chǎn)業(yè)共識(shí)，預(yù)計(jì)明后兩年針對(duì)主流模型推理的專用芯片將規(guī)模化落地，屆時(shí)專用芯片將與算力網(wǎng)協(xié)同，釋放AI應(yīng)用潛力。

師天麾表示，硬件采購成本日趨透明，國內(nèi)電力支出相差無幾，單純依靠硬件堆疊難以構(gòu)筑競爭壁壘，必須在軟件技術(shù)層面形成差異化優(yōu)勢，以軟件技術(shù)提升推理效率，降低算力成本，提升利潤率?！癕aaS的特點(diǎn)就是推理優(yōu)化的infra技術(shù)越強(qiáng)，MaaS利潤率越高?！?/p>

MaaS通過云端平臺(tái)將預(yù)訓(xùn)練模型封裝為可調(diào)用服務(wù)，用戶可通過API直接調(diào)用而無須關(guān)注底層技術(shù)細(xì)節(jié)，由于所有用戶均攤服務(wù)器成本，調(diào)用一次API的成本僅幾分錢?！半S著越來越多的企業(yè)明確了AI在業(yè)務(wù)場景中的落地路徑，確定了所需的并發(fā)處理能力以及對(duì)應(yīng)的服務(wù)器規(guī)模，今年我們接到的大規(guī)模推理性能優(yōu)化的需求越來越多。”師天麾表示，“比起純粹租算力，MaaS是一種更好的服務(wù)形式。對(duì)開發(fā)者來說，使用門檻和使用成本更低，至少在兩三年之內(nèi)，MaaS會(huì)保持高增長?！?/p>

算力成本整體呈上漲趨勢，姚欣對(duì)此補(bǔ)充了一個(gè)“反直覺”視角。今天，限制AI和算力的瓶頸并非最高端的芯片，而是那些普通的IT技術(shù)、傳統(tǒng)的配套部件。過去十年，內(nèi)存、硬盤乃至交換機(jī)等傳統(tǒng)IT基礎(chǔ)設(shè)施產(chǎn)業(yè)鏈一直保持與全球GDP增速相當(dāng)?shù)钠椒€(wěn)增長，長期穩(wěn)定的需求預(yù)期決定了溫和的產(chǎn)能擴(kuò)張節(jié)奏。但人工智能的爆發(fā)式增長打破了這一平衡。GPU出貨量大增，配套周邊部件在這種“拐點(diǎn)式”需求下，供給能力被甩在身后。“高端芯片產(chǎn)能是擴(kuò)上去了，但其他產(chǎn)能沒跟上。當(dāng)然，這一波大家都被打疼了，所以包括內(nèi)存硬盤在內(nèi)的傳統(tǒng)部件紛紛擴(kuò)產(chǎn)。”

姚欣表示，產(chǎn)能擴(kuò)充只是第一層。當(dāng)上游部件到位后，中游的機(jī)房建設(shè)、設(shè)備部署等基礎(chǔ)設(shè)施環(huán)節(jié)又成為新的堵點(diǎn)，這些物理設(shè)施的建設(shè)周期天然緩慢。“它就像供應(yīng)鏈一樣，一層層往上傳導(dǎo)。在北美更夸張的是，找到了電力，找到了機(jī)房，買到了所有設(shè)備，最后施工工人告訴你，排期已經(jīng)排到16個(gè)月、18個(gè)月甚至2年以上了。”

AI全球擴(kuò)散，價(jià)格的傳導(dǎo)也不再局限于科技領(lǐng)域，大宗商品及基礎(chǔ)工業(yè)原材料市場同樣受到?jīng)_擊，以銅為代表的金屬材料因廣泛應(yīng)用于AI相關(guān)的元器件制造，導(dǎo)致需求增加，價(jià)格上漲。姚欣表示，AI已經(jīng)進(jìn)入“奇點(diǎn)時(shí)刻”，“進(jìn)入到未來一兩年內(nèi)十倍百倍高速增長的時(shí)期，所有沒有準(zhǔn)備好應(yīng)對(duì)這種增長的行業(yè)，短期內(nèi)都會(huì)遇到這種供不應(yīng)求的情況。但就像水波紋那樣慢慢擴(kuò)散，最終會(huì)趨于平穩(wěn)，產(chǎn)能提升，屆時(shí)全球GDP也能上漲。”

責(zé)任編輯：宦艷紅

圖片編輯：蔣立冬

校對(duì)：施鋆

澎湃新聞報(bào)料：021-962866

澎湃新聞，未經(jīng)授權(quán)不得轉(zhuǎn)載

我要舉報(bào)

#智能體 #AI編程助手 #Token