- +1
AI觀察|Agentic AI帶動(dòng)中國Token出海,算力價(jià)格面臨上行壓力
3月6日,中興通訊股份有限公司發(fā)布2025年度業(yè)績,雖然凈利下滑,但是該公司算力業(yè)務(wù)實(shí)現(xiàn)了跨越式增長,全年?duì)I收同比增長約150%,該公司表示將持續(xù)構(gòu)建AI端到端能力矩陣,為長期競爭力夯實(shí)基礎(chǔ)。
伴隨著人工智能產(chǎn)業(yè)的快速迭代,應(yīng)用的持續(xù)發(fā)展,算力像水一樣流淌,中國的算力服務(wù)商正迎來一個(gè)全新的發(fā)展機(jī)遇,同時(shí)也不得不直面眾多不期而遇的挑戰(zhàn)。
1月下旬,AI云計(jì)算服務(wù)商派歐云計(jì)算(上海)有限公司 (即PPIO)進(jìn)入一種特別的“備戰(zhàn)”狀態(tài)。中國人工智能模型的使用占據(jù)了全球市場的主導(dǎo)地位。彼時(shí),多家國產(chǎn)大模型廠商密集敲定檔期,不約而同地選擇春節(jié)前后推出新模型。為了保證首發(fā)時(shí)的算力彈性,作為算力服務(wù)商的PPIO,其核心任務(wù)是幫助模型廠商兜住不確定的流量沖擊。
一方面,模型性能持續(xù)提升推動(dòng)Token消耗量暴漲,另一方面,AI編程、OpenClaw等智能體應(yīng)用帶來了巨大的Token需求增量。清華系國產(chǎn)算力軟件企業(yè)北京清程極智科技有限公司聯(lián)合創(chuàng)始人師天麾表示,至少在兩三年之內(nèi),直接調(diào)用API而無須關(guān)注底層技術(shù)細(xì)節(jié)的MaaS(模型即服務(wù))還會(huì)保持高增長,算力價(jià)格正在面臨上行壓力。
在PPIO聯(lián)合創(chuàng)始人兼CEO姚欣看來,AI已進(jìn)入到未來一兩年內(nèi)十倍百倍高速增長的時(shí)期,所有沒有準(zhǔn)備好應(yīng)對(duì)這種增長的行業(yè),短期內(nèi)都會(huì)遇到這種供不應(yīng)求的情況。但就像水波紋那樣慢慢擴(kuò)散,最終會(huì)趨于平穩(wěn),產(chǎn)能提升。
Agentic AI爆發(fā)推動(dòng)算力增長
在AI模型聚合平臺(tái)OpenRouter上,中國人工智能模型的使用占據(jù)了主導(dǎo)地位。2月24日公布的數(shù)據(jù)顯示,中國大模型占Token總消耗量的61%,這些模型主要應(yīng)用于編程和智能體驅(qū)動(dòng)的工作流程。
周度統(tǒng)計(jì)數(shù)據(jù)顯示,中國模型的Token總消耗量達(dá)5.3萬億,前十大模型總消耗量為8.7萬億Token。該平臺(tái)使用量排名前三的模型均來自中國。受編程應(yīng)用場景推動(dòng),MiniMax M2.5 Token使用量激增近200%,以單周消耗2.45萬億Token登頂榜首。Kimi K2.5位居第二,消耗1.21萬億Token,智譜GLM-5以7800億Token消耗量排名第三。
應(yīng)用重點(diǎn)的結(jié)構(gòu)性轉(zhuǎn)變支撐了Token的消費(fèi)數(shù)據(jù)。在OpenRouter上,編程已成為Token消耗的最大應(yīng)用類別。此外,自主執(zhí)行多步驟任務(wù)的智能體驅(qū)動(dòng)工作流,消耗的Token占該平臺(tái)輸出Token總量的一半以上。
成立于2007年的北京并行科技股份有限公司董事長陳健告訴澎湃科技,算力服務(wù)已形成模型訓(xùn)練、推理服務(wù)、科學(xué)計(jì)算三大明確場景,用戶需求從算力資源向Token服務(wù)轉(zhuǎn)變。其中,推理服務(wù)與Token消耗深度綁定,是當(dāng)前體量最大、增長最快的場景。大模型應(yīng)用多為輸入少、輸出多,AI編程則呈現(xiàn)輸入輸出雙高特征,Token消耗量呈指數(shù)級(jí)增長。
“目前行業(yè)共識(shí)是,2026年在MaaS領(lǐng)域,Token的需求量至少有十倍增長?!鼻宄虡O智聯(lián)合創(chuàng)始人師天麾對(duì)澎湃科技表示,模型能力持續(xù)提升是Token消耗量暴漲的根本動(dòng)力,其中又以編程和角色扮演類聊天這兩大應(yīng)用的Token消耗量為大。在AI編程中,模型需處理極長的上下文才能準(zhǔn)確編程,開發(fā)者要反復(fù)與模型溝通、調(diào)試、優(yōu)化,長上下文和高頻交互的特點(diǎn)使得編程調(diào)用的Token遠(yuǎn)超普通問答。
而OpenClaw等熱點(diǎn)應(yīng)用的涌現(xiàn)迅速吸引大量用戶,推高Token消耗。未來主要的Token消耗量將集中在OpenClaw等智能體應(yīng)用上?!罢{(diào)用一次智能體實(shí)際上是調(diào)用了多次MaaS或API(應(yīng)用程序接口),比如用智能體點(diǎn)外賣,智能體會(huì)調(diào)用多次API執(zhí)行任務(wù)?!?/p>
編程和聊天的算力消耗以Token為計(jì),從更廣義的算力消耗來看,以圖片數(shù)量計(jì)價(jià)的圖片生成,以及以時(shí)長和分辨率計(jì)價(jià)的視頻生成,同樣消耗大量算力。
云服務(wù)是AI落地的“輸水管道”。PPIO聯(lián)合創(chuàng)始人兼CEO姚欣對(duì)于算力增長的預(yù)期同樣樂觀,“2024年,模型訓(xùn)練慢慢轉(zhuǎn)向推理,去年推理大爆發(fā),Token成為核心關(guān)鍵詞,背后和大量國產(chǎn)開源模型的爆發(fā)相關(guān)。到今天,無論是OpenClaw還是AI編程,主題都從生成式AI切換到Agentic AI?!?/p>
由于“算力需求增長實(shí)在太快”,他計(jì)劃進(jìn)一步上調(diào)今年的企業(yè)目標(biāo)。一個(gè)確定性的增長就是AI編程。MiniMax M2.5、Kimi K2.5、智譜GLM-5的AI編程能力基本追平海外半年前的頂尖模型,Token出海的主要消耗幾乎是AI編程。
“在海外,我們已經(jīng)看到的一個(gè)趨勢是,大家不是因?yàn)閲鴥?nèi)模型的Token便宜而使用它,而是因?yàn)樽銐蚝糜貌庞盟?。”這讓PPIO在今年春節(jié)期間面向海外市場推出Coding Plan,“本質(zhì)上,大家購買的是智能能力?!?/p>
產(chǎn)能不足傳導(dǎo)供應(yīng)鏈價(jià)格整體上漲,配套部件擴(kuò)產(chǎn)
推理需求持續(xù)增長,但在算力供給側(cè),高性價(jià)比的推理顯卡產(chǎn)能有限,國內(nèi)外均稀缺。算力供不應(yīng)求,提高算力價(jià)格是一個(gè)合理選擇。
今年2月,智譜發(fā)布Coding Plan調(diào)價(jià)公告?!坝捎贕LM Coding Plan市場需求持續(xù)強(qiáng)勁增長,用戶規(guī)模與調(diào)用量快速提升”,決定取消首購優(yōu)惠,保留按季按年訂閱優(yōu)惠,套餐價(jià)格整體漲幅自30%起。由于算力供不應(yīng)求,今年以來,智譜多次對(duì)國產(chǎn)芯片集群擴(kuò)容,并限量發(fā)售GLM Coding Plan套餐,招募“算力合伙人”,開放核心技術(shù)接口,針對(duì)GLM-5的底層優(yōu)化,提升軟硬一體化性能。
隨著AI編程等應(yīng)用的普及,陳健表示,并行科技和Token相關(guān)的收入在總營收中的占比正持續(xù)提升。Token使用量和生成質(zhì)量要求同步攀升,推理算力需求持續(xù)高漲,算力價(jià)格面臨上行壓力,產(chǎn)業(yè)鏈價(jià)值向算力供給和模型優(yōu)化端集中。算力網(wǎng)絡(luò)將成為支撐AI應(yīng)用規(guī)?;l(fā)展的核心底層基礎(chǔ)設(shè)施,開發(fā)面向Token生成的專用芯片成為產(chǎn)業(yè)共識(shí),預(yù)計(jì)明后兩年針對(duì)主流模型推理的專用芯片將規(guī)模化落地,屆時(shí)專用芯片將與算力網(wǎng)協(xié)同,釋放AI應(yīng)用潛力。
師天麾表示,硬件采購成本日趨透明,國內(nèi)電力支出相差無幾,單純依靠硬件堆疊難以構(gòu)筑競爭壁壘,必須在軟件技術(shù)層面形成差異化優(yōu)勢,以軟件技術(shù)提升推理效率,降低算力成本,提升利潤率?!癕aaS的特點(diǎn)就是推理優(yōu)化的infra技術(shù)越強(qiáng),MaaS利潤率越高?!?/p>
MaaS通過云端平臺(tái)將預(yù)訓(xùn)練模型封裝為可調(diào)用服務(wù),用戶可通過API直接調(diào)用而無須關(guān)注底層技術(shù)細(xì)節(jié),由于所有用戶均攤服務(wù)器成本,調(diào)用一次API的成本僅幾分錢?!半S著越來越多的企業(yè)明確了AI在業(yè)務(wù)場景中的落地路徑,確定了所需的并發(fā)處理能力以及對(duì)應(yīng)的服務(wù)器規(guī)模,今年我們接到的大規(guī)模推理性能優(yōu)化的需求越來越多。”師天麾表示,“比起純粹租算力,MaaS是一種更好的服務(wù)形式。對(duì)開發(fā)者來說,使用門檻和使用成本更低,至少在兩三年之內(nèi),MaaS會(huì)保持高增長?!?/p>
算力成本整體呈上漲趨勢,姚欣對(duì)此補(bǔ)充了一個(gè)“反直覺”視角。今天,限制AI和算力的瓶頸并非最高端的芯片,而是那些普通的IT技術(shù)、傳統(tǒng)的配套部件。過去十年,內(nèi)存、硬盤乃至交換機(jī)等傳統(tǒng)IT基礎(chǔ)設(shè)施產(chǎn)業(yè)鏈一直保持與全球GDP增速相當(dāng)?shù)钠椒€(wěn)增長,長期穩(wěn)定的需求預(yù)期決定了溫和的產(chǎn)能擴(kuò)張節(jié)奏。但人工智能的爆發(fā)式增長打破了這一平衡。GPU出貨量大增,配套周邊部件在這種“拐點(diǎn)式”需求下,供給能力被甩在身后。“高端芯片產(chǎn)能是擴(kuò)上去了,但其他產(chǎn)能沒跟上。當(dāng)然,這一波大家都被打疼了,所以包括內(nèi)存硬盤在內(nèi)的傳統(tǒng)部件紛紛擴(kuò)產(chǎn)。”
姚欣表示,產(chǎn)能擴(kuò)充只是第一層。當(dāng)上游部件到位后,中游的機(jī)房建設(shè)、設(shè)備部署等基礎(chǔ)設(shè)施環(huán)節(jié)又成為新的堵點(diǎn),這些物理設(shè)施的建設(shè)周期天然緩慢。“它就像供應(yīng)鏈一樣,一層層往上傳導(dǎo)。在北美更夸張的是,找到了電力,找到了機(jī)房,買到了所有設(shè)備,最后施工工人告訴你,排期已經(jīng)排到16個(gè)月、18個(gè)月甚至2年以上了。”
AI全球擴(kuò)散,價(jià)格的傳導(dǎo)也不再局限于科技領(lǐng)域,大宗商品及基礎(chǔ)工業(yè)原材料市場同樣受到?jīng)_擊,以銅為代表的金屬材料因廣泛應(yīng)用于AI相關(guān)的元器件制造,導(dǎo)致需求增加,價(jià)格上漲。姚欣表示,AI已經(jīng)進(jìn)入“奇點(diǎn)時(shí)刻”,“進(jìn)入到未來一兩年內(nèi)十倍百倍高速增長的時(shí)期,所有沒有準(zhǔn)備好應(yīng)對(duì)這種增長的行業(yè),短期內(nèi)都會(huì)遇到這種供不應(yīng)求的情況。但就像水波紋那樣慢慢擴(kuò)散,最終會(huì)趨于平穩(wěn),產(chǎn)能提升,屆時(shí)全球GDP也能上漲。”





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2026 上海東方報(bào)業(yè)有限公司




