中文字幕国产91无码|AV成人手机在线|av成人先锋在线|911无码在线国产人人操|91蜜桃视频精品免费在线|极品美女A∨片在线看|日韩在线成人视频日韩|电影三级成人黄免费影片|超碰97国产在线|国产成人精品色情免费视频

  • +1

理解人工智能,必須從理解詞元開始

2026-05-18 11:11
來源:澎湃新聞·澎湃號(hào)·政務(wù)
字號(hào)

2026年初,一組數(shù)據(jù)引發(fā)全球AI產(chǎn)業(yè)領(lǐng)域熱烈討論。全球最大的AI模型API聚合平臺(tái)OpenRouter顯示,2月9日至15日這一周,中國大模型詞元(token)調(diào)用量達(dá)到4.12萬億,歷史上首次超過同期美國模型的2.94萬億;此后連續(xù)多周保持領(lǐng)先,3月中下旬已突破7.3萬億,全球調(diào)用量前五的模型中,四席來自中國。

舉這組數(shù)據(jù),并不為了比較“誰多誰少”。它所標(biāo)記的,是人工智能產(chǎn)業(yè)基本計(jì)量單位的一次悄然革命——詞元,正在成為智能時(shí)代的“千瓦時(shí)”。模型、算力、數(shù)據(jù)、應(yīng)用、產(chǎn)業(yè)、治理這6個(gè)維度的內(nèi)涵,都因這一計(jì)量單位的確立而被深刻重塑。理解2026年的人工智能,必須從理解詞元開始。

一個(gè)計(jì)量單位帶來的六重重構(gòu)

工業(yè)革命的計(jì)量單位是“千瓦時(shí)”,能量第一次可被精確計(jì)量、定價(jià)、跨域輸送;信息革命的計(jì)量單位是“比特”與“流量”,信息第一次可被打包、傳輸、計(jì)費(fèi);智能革命的計(jì)量單位是“詞元”,“智能”第一次可被切分、計(jì)量、定價(jià)、交易。

詞元概念的普及和其調(diào)用量的快速增長,正逐步推動(dòng)“智能”走向工業(yè)化、市場(chǎng)化、可流通化。

模型方面:從“訓(xùn)練即資產(chǎn)”到“推理即生產(chǎn)”。大模型的經(jīng)濟(jì)價(jià)值正從一次性訓(xùn)練成本,向長期推理產(chǎn)出遷移。模型廠商已不再單純“賣能力”,而是直接“賣詞元”——按百萬詞元輸入、輸出分檔定價(jià),已成為全球行業(yè)慣例。模型的資產(chǎn)屬性,正從“權(quán)重文件”轉(zhuǎn)向“持續(xù)產(chǎn)出詞元的能力”。

算力方面:從“訓(xùn)練算力”到“推理算力”。訓(xùn)練算力是脈沖式、集中式的,推理算力是持續(xù)性、分布式的,對(duì)延遲、能效與地理分布提出全新要求。“云—邊—端”三級(jí)算力協(xié)同、推理專用芯片、硅光互聯(lián)與算力網(wǎng)絡(luò),正在成為基礎(chǔ)設(shè)施的新重心。摩根大通預(yù)測(cè),中國推理詞元消耗量到2030年將較2025年增長2個(gè)數(shù)量級(jí)以上。

數(shù)據(jù)方面:從“原始數(shù)據(jù)”到“詞元化語料”。原煤需被加工成符合規(guī)格的標(biāo)準(zhǔn)燃料才能入爐發(fā)電;數(shù)據(jù)進(jìn)入大模型,同樣需要清洗、標(biāo)注與詞元化。在自動(dòng)駕駛、機(jī)器人訓(xùn)練、科學(xué)發(fā)現(xiàn)等長尾場(chǎng)景中,仿真生成的合成數(shù)據(jù)已實(shí)現(xiàn)規(guī)?;瘧?yīng)用。數(shù)據(jù)要素市場(chǎng)建設(shè)也進(jìn)入實(shí)質(zhì)階段,“可訓(xùn)練性”與“詞元產(chǎn)出密度”——而非單純的數(shù)據(jù)規(guī)?!诔蔀閿?shù)據(jù)資產(chǎn)定價(jià)的新標(biāo)尺。這一轉(zhuǎn)變意義深遠(yuǎn):數(shù)據(jù)的價(jià)值評(píng)估,開始與其在詞元生產(chǎn)鏈條中的實(shí)際貢獻(xiàn)掛鉤,數(shù)據(jù)要素市場(chǎng)化配置由此獲得了更扎實(shí)的經(jīng)濟(jì)學(xué)基礎(chǔ)。

應(yīng)用方面:從“功能交付”到“詞元消費(fèi)”。傳統(tǒng)軟件按席位、按功能收費(fèi);今天的應(yīng)用按詞元調(diào)用量與業(yè)務(wù)結(jié)果計(jì)費(fèi)。智能體正在成為詞元的主要消費(fèi)者,一次復(fù)雜任務(wù)可能消耗數(shù)十萬乃至上百萬詞元?!爸悄荏w即服務(wù)”市場(chǎng)快速擴(kuò)張,按效果計(jì)費(fèi)的商業(yè)模式在客服、營銷、合規(guī)、編程等場(chǎng)景規(guī)?;涞亍?yīng)用的本質(zhì),從“交付功能”轉(zhuǎn)向“消費(fèi)智能”。

產(chǎn)業(yè)方面:從“軟件產(chǎn)業(yè)鏈”到“詞元產(chǎn)業(yè)鏈”。圍繞詞元的生產(chǎn)(模型與算力)、輸配(推理網(wǎng)絡(luò)、API、智能體協(xié)議)、消費(fèi)(應(yīng)用與智能體)、計(jì)量(評(píng)測(cè)基準(zhǔn)、審計(jì)與可信驗(yàn)證),一條全新的產(chǎn)業(yè)鏈正在成型。模型層、推理服務(wù)層、智能體中間件層、行業(yè)應(yīng)用層之間的邊界日趨清晰,行業(yè)專用智能體成為投資主流,模型廠商、云廠商、芯片廠商、綠電運(yùn)營商、內(nèi)容分發(fā)網(wǎng)絡(luò)廠商共同構(gòu)成詞元產(chǎn)業(yè)鏈的協(xié)同生態(tài)。中國信通院數(shù)據(jù)顯示,2026年國產(chǎn)AI核心產(chǎn)業(yè)規(guī)模有望突破1.2萬億元,全產(chǎn)業(yè)鏈協(xié)同效應(yīng)正在顯現(xiàn)。

治理方面:從“算法治理”到“詞元全鏈路治理”。人工智能產(chǎn)業(yè)發(fā)展到今天,治理對(duì)象正從“算法與代碼”擴(kuò)展到詞元的生產(chǎn)、流通、消費(fèi)與跨境全鏈路:詞元可追溯、合成內(nèi)容標(biāo)識(shí)、跨境詞元流動(dòng)、算力與能耗約束、可信評(píng)測(cè)與基準(zhǔn)——一系列新命題都呼喚新的治理工具與規(guī)則。2026年或?qū)⒊蔀槿駻I治理規(guī)則集中落地的關(guān)鍵年份。

全球詞元浪潮的中國位勢(shì)

在詞元帶來的全球浪潮中,中國正在形成具備多重支撐的獨(dú)特位勢(shì)。

詞元生產(chǎn)端,國產(chǎn)模型集群式崛起。MiniMax、月之暗面、深度求索、智譜、阿里千問、字節(jié)豆包等一批國產(chǎn)模型借助混合專家架構(gòu)與極致工程優(yōu)化,在性能持續(xù)提升的同時(shí)把推理價(jià)格壓低到同檔全球模型的幾分之一甚至更低。OpenRouter平臺(tái)上美國用戶占47%、中國用戶僅占約6%,但調(diào)用量卻由中國模型領(lǐng)跑——這是一次由全球開發(fā)者用腳投票得出的認(rèn)可。

詞元消費(fèi)端,應(yīng)用縱深前所未有,詞元正以從未有過的速度走進(jìn)百姓的日常生活??h醫(yī)院的全科醫(yī)生面對(duì)一張可疑的肺部CT,AI在十幾秒、幾萬詞元間圈出結(jié)節(jié)、給出鑒別診斷建議,把過去要等兩周的會(huì)診壓縮到一次門診;山東壽光的菜農(nóng)舉起手機(jī)拍下卷葉的黃瓜,智慧農(nóng)業(yè)App用詞元化的農(nóng)技知識(shí)告訴他這是薊馬還是病毒病、該用哪種藥;獨(dú)居老人用方言對(duì)智能音箱說“我胸口悶”,幾千詞元的對(duì)話之后,子女的手機(jī)能收到預(yù)警和120的位置共享;外賣騎手在導(dǎo)航里聽到的不再是機(jī)械的“前方右轉(zhuǎn)”,而是結(jié)合實(shí)時(shí)路況、電梯等待時(shí)間規(guī)劃的路線;政務(wù)大廳的“AI小晉”“AI蓉寶”全天候應(yīng)答醫(yī)保轉(zhuǎn)移、不動(dòng)產(chǎn)登記等各項(xiàng)政策咨詢,把“群眾跑腿”換成“詞元跑腿”……詞元,正在成為千行百業(yè)的“無形勞動(dòng)力”。

產(chǎn)業(yè)鏈層面,全棧協(xié)同生態(tài)加速成型。從昇騰、寒武紀(jì)、海光等國產(chǎn)芯片,到火山引擎、阿里云、騰訊云等推理服務(wù)平臺(tái),再到一批開源中間件與行業(yè)智能體,覆蓋芯片—算力—模型—中間件—應(yīng)用的全產(chǎn)業(yè)鏈正在快速完善?!皷|數(shù)西算”工程八大樞紐節(jié)點(diǎn)提供低成本算力,綠電直供數(shù)據(jù)中心夯實(shí)能源底座。

也要清醒看到,前沿模型原創(chuàng)性、高端算力底座、跨語言跨文化生態(tài)影響力、全球規(guī)則參與深度等方面,我國仍存在很大提升空間。

詞元浪潮的下半場(chǎng)不是“已經(jīng)贏”,而是“剛剛開始”。在由小小詞元鋪展開來的全球圖景中,中國既是巨大的市場(chǎng),也應(yīng)是積極的建設(shè)者與負(fù)責(zé)任的共治者。理解詞元,就是理解人工智能的下一程。(作者王蘊(yùn)韜,系中國信息通信研究院人工智能研究所副總工程師)

來源:新華每日電訊

    本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場(chǎng),澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問http://renzheng.thepaper.cn。

            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號(hào)

            滬公網(wǎng)安備31010602000299號(hào)

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116

            ? 2014-2026 上海東方報(bào)業(yè)有限公司