- +1
Anthropic裝糊涂,全球AI圈看笑了

Anthropic急了。
AIX財(cái)經(jīng)(AIXcaijing)原創(chuàng)
見(jiàn)習(xí)作者 | 雷晶
編輯 | 金玙璠
近日,美國(guó)AI公司Anthropic發(fā)布報(bào)告,公開(kāi)指控中國(guó)三家大模型公司深度求索(DeepSeek)、月之暗面(Moonshot)與稀宇科技(MiniMax)對(duì)其Claude模型進(jìn)行了“工業(yè)規(guī)模的蒸餾攻擊”。這一指控迅速在全球AI行業(yè)引發(fā)了廣泛的討論與爭(zhēng)議。
值得注意的是,Anthropic自身也面臨過(guò)數(shù)據(jù)合規(guī)方面的爭(zhēng)議。其曾在2025年9月因使用盜版書(shū)訓(xùn)練模型而與作家群體達(dá)成高額和解,并在今年年初因音樂(lè)版權(quán)問(wèn)題面臨來(lái)自音樂(lè)出版商的訴訟升級(jí)。在這樣的背景下,其高調(diào)指控他人,使得這場(chǎng)風(fēng)波的動(dòng)機(jī)與合理性變得更加復(fù)雜。
此次事件的核心,是一種被稱為“模型蒸餾”(Model Distillation)的AI訓(xùn)練技術(shù)。其原理可以通俗地理解為“老師教學(xué)生”:一個(gè)能力更強(qiáng)的大模型(老師)通過(guò)輸出帶有推理過(guò)程的示例,來(lái)訓(xùn)練一個(gè)參數(shù)量更小的模型(學(xué)生),從而以更低的成本實(shí)現(xiàn)知識(shí)的遷移和能力的復(fù)刻。在行業(yè)普遍觀點(diǎn)中,這是一種常規(guī)且公認(rèn)的模型能力提升方式。
技術(shù)本身是中立的,但行業(yè)內(nèi)對(duì)于模型蒸餾是否構(gòu)成侵權(quán)并無(wú)統(tǒng)一的法律規(guī)范。相關(guān)的爭(zhēng)議往往涉及服務(wù)協(xié)議的違約問(wèn)題,而非明確的法律禁止條款,這導(dǎo)致侵權(quán)行為難以界定,證據(jù)也難以獲取。
更值得玩味的是,Anthropic此次為了證明其指控,詳細(xì)披露了其監(jiān)控和識(shí)別API調(diào)用模式的能力。這變相承認(rèn)了其具備對(duì)用戶調(diào)用行為的深度洞察力,無(wú)形中加劇了業(yè)界對(duì)于AI時(shí)代數(shù)據(jù)隱私和用戶安全的普遍擔(dān)憂。
一項(xiàng)行業(yè)通用技術(shù)被“武器化”,這場(chǎng)“蒸餾鬧劇”究竟是在維護(hù)權(quán)益,還是在掩蓋競(jìng)爭(zhēng)焦慮?回到事件本身,模型蒸餾的合規(guī)邊界究竟在哪,或許才是更值得深究的問(wèn)題。
什么是模型蒸餾?
要理解整場(chǎng)爭(zhēng)議,首先必須厘清“模型蒸餾”這一核心技術(shù)概念。
這是一種知識(shí)遷移(Knowledge Transfer)的方法。前大廠AI技術(shù)人員Frank打了個(gè)比方,就像老師讀了1000萬(wàn)本書(shū),過(guò)濾掉500萬(wàn)本,只留下精華的部分。學(xué)生可以直接學(xué)習(xí)這些精華,“腦容量”可以變小,但能力卻能接近老師。其本質(zhì)是實(shí)現(xiàn)模型能力的高效傳遞與復(fù)用。

需要明確區(qū)分的是,模型蒸餾與備受質(zhì)疑的“套殼”有著本質(zhì)的差別。北京理工大學(xué)博士生王明解釋,“套殼”是簡(jiǎn)單地調(diào)用第三方模型的API接口或者原封不動(dòng)移植開(kāi)源模型,然后包裝上自己的產(chǎn)品外殼;而模型蒸餾是一個(gè)完整的訓(xùn)練與優(yōu)化過(guò)程,最終生成一個(gè)全新、獨(dú)立的模型。
模型蒸餾最早在2015年被提出,最初主要應(yīng)用于圖像分類和語(yǔ)音識(shí)別等場(chǎng)景。隨著大模型時(shí)代的到來(lái),“模型蒸餾已成為行業(yè)常態(tài),即使是海外頭部模型廠商也會(huì)學(xué)習(xí)對(duì)方模型的優(yōu)勢(shì)能力”,AI創(chuàng)業(yè)者Jojo告訴「AIX財(cái)經(jīng)」。
模型蒸餾之所以在業(yè)內(nèi)被廣泛采用,原因在于降本增效。
從零開(kāi)始訓(xùn)練一個(gè)高性能的大模型,需要耗費(fèi)海量的高質(zhì)量數(shù)據(jù)、巨大的算力以及漫長(zhǎng)的研發(fā)周期,成本極其高昂。
通過(guò)蒸餾,AI企業(yè)首先降低了數(shù)據(jù)成本:利用成熟模型的API生成高質(zhì)量的“問(wèn)答”作為訓(xùn)練數(shù)據(jù),大幅減少人工標(biāo)注和數(shù)據(jù)清洗的成本;其次加速了研發(fā)進(jìn)程:快速讓自身模型的能力向行業(yè)頭部模型看齊,縮短技術(shù)差距,更快地驗(yàn)證產(chǎn)品和商業(yè)模式。
然而,為了防止自身核心能力被輕易“蒸餾”,閉源模型廠商也在采取防范措施。王明提到,Anthropic已經(jīng)聲明,一旦識(shí)別到用戶在進(jìn)行模型蒸餾,可能會(huì)對(duì)輸出語(yǔ)料進(jìn)行“投毒”,也就是在正常語(yǔ)句中混入錯(cuò)誤標(biāo)點(diǎn)、打亂文字順序、植入隱性錯(cuò)誤等,迫使蒸餾方投入大量人力校對(duì)、清洗數(shù)據(jù),以此變相提高蒸餾成本。但這同樣可能損害自身模型的聲譽(yù)和用戶體驗(yàn)。
模型蒸餾的技術(shù)中立性與商業(yè)應(yīng)用的復(fù)雜性,自然引出了下一個(gè)核心問(wèn)題:在法律層面,這些行為該如何界定?
Anthropic的指控,站得住腳嗎?
Anthropic此次并未提起正式訴訟,而是選擇發(fā)布公開(kāi)報(bào)告并呼吁行業(yè)與政策制定者采取行動(dòng)。
它的指控很具體:注冊(cè)大量虛假賬號(hào)、繞過(guò)地域限制、進(jìn)行“工業(yè)規(guī)模的蒸餾攻擊”。在理解這個(gè)指控之前,先弄清一個(gè)技術(shù)細(xì)節(jié),模型蒸餾有兩種形態(tài)——“黑盒蒸餾”與“白盒蒸餾”。
北京星也律師事務(wù)所于澤輝律師介紹,“白盒蒸餾”是需要獲取模型的內(nèi)部權(quán)限,直接訪問(wèn)底層參數(shù)、權(quán)重和架構(gòu)?!昂诤姓麴s”則是只能通過(guò)API接口與模型進(jìn)行交互。
Anthropic指控的是“黑盒蒸餾”,而這種做法在學(xué)術(shù)界和產(chǎn)業(yè)界被視為正常的技術(shù)迭代手段,不涉及任何商業(yè)機(jī)密的攝取。于澤輝解釋,這就像一個(gè)學(xué)生閱讀教材,并不侵犯教材的版權(quán)。
我們從證據(jù)鏈、版權(quán)歸屬和不正當(dāng)競(jìng)爭(zhēng)三個(gè)核心維度,結(jié)合法律專業(yè)人士的觀點(diǎn)進(jìn)行分析。

根據(jù)法律從業(yè)者的觀點(diǎn),Anthropic指控面臨的首要挑戰(zhàn)是證據(jù)鏈的完整性。
劍橋頤華律師事務(wù)所楊衛(wèi)薪律師告訴「AIX財(cái)經(jīng)」,即便Anthropic能證明特定賬號(hào)存在高頻調(diào)用,卻無(wú)法證明這些調(diào)用產(chǎn)生的輸出內(nèi)容確實(shí)被用于模型訓(xùn)練,更無(wú)法證明相關(guān)行為是為所在公司的產(chǎn)品開(kāi)發(fā)服務(wù)。這之間隔著多層需要獨(dú)立證明的法律事實(shí)。Anthropic目前公開(kāi)的信息,并未完成這一系列的舉證環(huán)節(jié)。
其次,指控若要構(gòu)成版權(quán)侵權(quán),需證明其模型輸出的內(nèi)容是受《著作權(quán)法》保護(hù)的“作品”。這面臨兩大障礙:
一是AI生成物是否構(gòu)成作品?于澤輝提到,美國(guó)版權(quán)局通常對(duì)純AI生成內(nèi)容不予版權(quán)保護(hù)。但Anthropic的用戶協(xié)議中明確約定,用戶擁有對(duì)輸入和輸出內(nèi)容的權(quán)利。他指出:“平臺(tái)既然已經(jīng)通過(guò)協(xié)議將相關(guān)內(nèi)容的所有權(quán)轉(zhuǎn)讓給用戶,隨后又主張知識(shí)產(chǎn)權(quán)受到侵害并限制用戶合法使用,這在法律邏輯上是完全自相矛盾的?!?/p>
二是保護(hù)思想還是表達(dá)?楊衛(wèi)薪介紹,AI大模型通過(guò)交互學(xué)到的是能力而非具體內(nèi)容,這種能力屬于思想、方法的范疇,而著作權(quán)法僅保護(hù)表達(dá),并不保護(hù)思想和概念,因此相關(guān)行為并不構(gòu)成版權(quán)侵權(quán)。
最后,將“模型蒸餾”定義為不正當(dāng)競(jìng)爭(zhēng)行為同樣困難重重。
于澤輝表示,Anthropic在這一問(wèn)題上存在將違約行為與違法行為相混淆的傾向。它將用戶協(xié)議層面的違約指控,包裝成非法提取甚至國(guó)家安全威脅,而這在法律層面是兩個(gè)性質(zhì)不同的概念。
Anthropic用戶協(xié)議中存在“禁止用于訓(xùn)練競(jìng)爭(zhēng)性模型”的條款,一方面,“競(jìng)爭(zhēng)性模型”的定義模糊不清。另一方面,即便相關(guān)企業(yè)違反了禁止將模型輸出用于競(jìng)爭(zhēng)模型訓(xùn)練的用戶協(xié)議,其承擔(dān)的主要是合同法上的違約責(zé)任,但這并不等同于實(shí)施了不正當(dāng)競(jìng)爭(zhēng)行為。通過(guò)正常且付費(fèi)的API調(diào)用獲取公開(kāi)輸出,是否構(gòu)成入侵系統(tǒng)獲取底層代碼或參數(shù),值得商榷。
綜上所述,受訪律師認(rèn)為,Anthropic的指控在現(xiàn)行法律框架下,無(wú)論是從版權(quán)還是不正當(dāng)競(jìng)爭(zhēng)的角度,都面臨著相當(dāng)大的舉證困難和法律適用障礙。Anthropic選擇發(fā)布公開(kāi)報(bào)告而非提起正式訴訟,或許與上述法律層面的挑戰(zhàn)不無(wú)關(guān)系。
蒸餾不是“萬(wàn)能藥”,省下成本省不下創(chuàng)新
盡管在法律上難以被嚴(yán)格界定為“竊取”,但模型蒸餾在商業(yè)戰(zhàn)略層面無(wú)疑是一把雙刃劍。它為AI領(lǐng)域的追趕者提供了一條看似高效的“捷徑”,但也帶了局限和挑戰(zhàn)。
首先是能力天花板和創(chuàng)新能力受限。學(xué)生模型的能力上限被教師模型牢牢鎖住,它能學(xué)會(huì)老師教的知識(shí),卻很難超越老師,更無(wú)法實(shí)現(xiàn)真正的源頭創(chuàng)新。
Frank告訴「AIX財(cái)經(jīng)」,蒸餾后的模型大多會(huì)做輕量化處理,雖然參數(shù)更少、算力需求更低,但在處理復(fù)雜、全新任務(wù)時(shí)也會(huì)表現(xiàn)不佳,甚至出現(xiàn)輸出不穩(wěn)定的情況,能力天花板有限。
他進(jìn)一步解釋,如果原模型的思維偏理性,類似于“數(shù)學(xué)老師”,蒸餾后的模型也會(huì)延續(xù)這一特點(diǎn),在語(yǔ)文等其他領(lǐng)域的能力可能會(huì)相對(duì)薄弱。

過(guò)度依賴蒸餾也會(huì)使模型在回答風(fēng)格和思維范式上趨同于教師模型,喪失獨(dú)特性和創(chuàng)造性,難以形成差異化的競(jìng)爭(zhēng)優(yōu)勢(shì)。
其次是缺陷被繼承。Frank表示,教師模型存在的偏見(jiàn)、幻覺(jué)、錯(cuò)誤認(rèn)知等問(wèn)題,會(huì)被蒸餾后的模型原樣繼承,且由于學(xué)生模型不具備自主糾錯(cuò)的能力,這些缺陷會(huì)被固化甚至放大。
這些局限指向一個(gè)核心問(wèn)題:靠模型蒸餾,企業(yè)無(wú)法實(shí)現(xiàn)技術(shù)上的超越,所以對(duì)于處于追趕階段的企業(yè)而言,這只是一種務(wù)實(shí)的階段性策略。
王明解釋,模型訓(xùn)練分為預(yù)訓(xùn)練、后訓(xùn)練等多個(gè)階段,最核心的預(yù)訓(xùn)練階段無(wú)法通過(guò)蒸餾完成,企業(yè)要自主研發(fā)模型,就必須獨(dú)立完成這一階段。同時(shí),企業(yè)在不同發(fā)展階段對(duì)數(shù)據(jù)的需求也不同,起步階段會(huì)用蒸餾數(shù)據(jù)控制成本、快速驗(yàn)證技術(shù)可行性,但發(fā)展到追求模型質(zhì)量的階段,必然會(huì)轉(zhuǎn)向人工創(chuàng)造的高質(zhì)量數(shù)據(jù),打造自身模型的獨(dú)特性。
Jojo指出,蒸餾的核心作用是讓后發(fā)模型快速向先進(jìn)模型對(duì)齊。這是“追趕者”的技術(shù)手段,但單純依靠這份復(fù)刻的能力,企業(yè)只能一直跟在頭部廠商身后,后續(xù)的研發(fā)工作也容易陷入被動(dòng)的跟隨狀態(tài),無(wú)法突破原模型的能力邊界,更談不上打造屬于自己的技術(shù)壁壘。
在Frank看來(lái),在AI快速發(fā)展的時(shí)代,想要靠限制蒸餾來(lái)維持競(jìng)爭(zhēng)優(yōu)勢(shì)并不現(xiàn)實(shí),與其將精力放在對(duì)現(xiàn)有能力的保護(hù)上,不如多花功夫在自身模型的技術(shù)迭代和創(chuàng)新上,實(shí)現(xiàn)突破。
總的來(lái)說(shuō),不必談“蒸餾”色變。模型蒸餾僅是一種普遍、常規(guī)的技術(shù)迭代手段,它能為AI模型的發(fā)展提供一把“梯子”,但并不是“萬(wàn)能藥”,模型的優(yōu)勢(shì)還要靠自身的核心研發(fā)實(shí)力來(lái)實(shí)現(xiàn)。
結(jié)語(yǔ)
本質(zhì)上,Anthropic的指控,是全球AI產(chǎn)業(yè)在高速發(fā)展下一次矛盾的集中爆發(fā)。它反應(yīng)出了一些值得深思的問(wèn)題:
一是開(kāi)源與閉源的路線之爭(zhēng):事件背后是AI領(lǐng)域開(kāi)源精神與閉源商業(yè)模式之間的持續(xù)博弈。如何在鼓勵(lì)技術(shù)快速擴(kuò)散、推動(dòng)行業(yè)整體進(jìn)步與保護(hù)企業(yè)研發(fā)投入、維持商業(yè)競(jìng)爭(zhēng)力之間找到平衡,是所有從業(yè)者必須面對(duì)的難題。

二是全球AI競(jìng)爭(zhēng)的白熱化:隨著中國(guó)AI企業(yè)的快速崛起,全球AI領(lǐng)域的競(jìng)爭(zhēng)正日趨激烈。Anthropic的指控,無(wú)論其初衷如何,客觀上都帶有濃厚的商業(yè)競(jìng)爭(zhēng)色彩,反映出頭部廠商在領(lǐng)先地位受到挑戰(zhàn)時(shí)的焦慮。
對(duì)于被指控的企業(yè)而言,此次風(fēng)波是一次警醒,提示我們?cè)谧汾s過(guò)程中必須更加注重合規(guī)性,并盡快從“學(xué)習(xí)模仿”走向“自主創(chuàng)新”。而對(duì)于整個(gè)行業(yè),與其將精力耗費(fèi)在如何限制“蒸餾”上,不如回歸技術(shù)創(chuàng)新的本質(zhì),通過(guò)構(gòu)建真正的技術(shù)壁壘和差異化優(yōu)勢(shì),來(lái)贏得市場(chǎng)的最終尊重。
*題圖及文中配圖來(lái)源于pexels。應(yīng)受訪者要求,文中Frank、Jojo、王明均為化名。
本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場(chǎng),澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問(wèn)http://renzheng.thepaper.cn。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2026 上海東方報(bào)業(yè)有限公司




