下載客戶端

登錄

Anthropic裝糊涂，全球AI圈看笑了

2026-02-28 15:41

來(lái)源：澎湃新聞·澎湃號(hào)·湃客

聽(tīng)全文

Anthropic急了。

AIX財(cái)經(jīng)（AIXcaijing）原創(chuàng)

見(jiàn)習(xí)作者 | 雷晶

編輯 | 金玙璠

近日，美國(guó)AI公司Anthropic發(fā)布報(bào)告，公開(kāi)指控中國(guó)三家大模型公司深度求索（DeepSeek）、月之暗面（Moonshot）與稀宇科技（MiniMax）對(duì)其Claude模型進(jìn)行了“工業(yè)規(guī)模的蒸餾攻擊”。這一指控迅速在全球AI行業(yè)引發(fā)了廣泛的討論與爭(zhēng)議。

值得注意的是，Anthropic自身也面臨過(guò)數(shù)據(jù)合規(guī)方面的爭(zhēng)議。其曾在2025年9月因使用盜版書(shū)訓(xùn)練模型而與作家群體達(dá)成高額和解，并在今年年初因音樂(lè)版權(quán)問(wèn)題面臨來(lái)自音樂(lè)出版商的訴訟升級(jí)。在這樣的背景下，其高調(diào)指控他人，使得這場(chǎng)風(fēng)波的動(dòng)機(jī)與合理性變得更加復(fù)雜。

此次事件的核心，是一種被稱為“模型蒸餾”（Model Distillation）的AI訓(xùn)練技術(shù)。其原理可以通俗地理解為“老師教學(xué)生”：一個(gè)能力更強(qiáng)的大模型（老師）通過(guò)輸出帶有推理過(guò)程的示例，來(lái)訓(xùn)練一個(gè)參數(shù)量更小的模型（學(xué)生），從而以更低的成本實(shí)現(xiàn)知識(shí)的遷移和能力的復(fù)刻。在行業(yè)普遍觀點(diǎn)中，這是一種常規(guī)且公認(rèn)的模型能力提升方式。

技術(shù)本身是中立的，但行業(yè)內(nèi)對(duì)于模型蒸餾是否構(gòu)成侵權(quán)并無(wú)統(tǒng)一的法律規(guī)范。相關(guān)的爭(zhēng)議往往涉及服務(wù)協(xié)議的違約問(wèn)題，而非明確的法律禁止條款，這導(dǎo)致侵權(quán)行為難以界定，證據(jù)也難以獲取。

更值得玩味的是，Anthropic此次為了證明其指控，詳細(xì)披露了其監(jiān)控和識(shí)別API調(diào)用模式的能力。這變相承認(rèn)了其具備對(duì)用戶調(diào)用行為的深度洞察力，無(wú)形中加劇了業(yè)界對(duì)于AI時(shí)代數(shù)據(jù)隱私和用戶安全的普遍擔(dān)憂。

一項(xiàng)行業(yè)通用技術(shù)被“武器化”，這場(chǎng)“蒸餾鬧劇”究竟是在維護(hù)權(quán)益，還是在掩蓋競(jìng)爭(zhēng)焦慮？回到事件本身，模型蒸餾的合規(guī)邊界究竟在哪，或許才是更值得深究的問(wèn)題。

什么是模型蒸餾？

要理解整場(chǎng)爭(zhēng)議，首先必須厘清“模型蒸餾”這一核心技術(shù)概念。

這是一種知識(shí)遷移（Knowledge Transfer）的方法。前大廠AI技術(shù)人員Frank打了個(gè)比方，就像老師讀了1000萬(wàn)本書(shū)，過(guò)濾掉500萬(wàn)本，只留下精華的部分。學(xué)生可以直接學(xué)習(xí)這些精華，“腦容量”可以變小，但能力卻能接近老師。其本質(zhì)是實(shí)現(xiàn)模型能力的高效傳遞與復(fù)用。

需要明確區(qū)分的是，模型蒸餾與備受質(zhì)疑的“套殼”有著本質(zhì)的差別。北京理工大學(xué)博士生王明解釋，“套殼”是簡(jiǎn)單地調(diào)用第三方模型的API接口或者原封不動(dòng)移植開(kāi)源模型，然后包裝上自己的產(chǎn)品外殼；而模型蒸餾是一個(gè)完整的訓(xùn)練與優(yōu)化過(guò)程，最終生成一個(gè)全新、獨(dú)立的模型。

模型蒸餾最早在2015年被提出，最初主要應(yīng)用于圖像分類和語(yǔ)音識(shí)別等場(chǎng)景。隨著大模型時(shí)代的到來(lái)，“模型蒸餾已成為行業(yè)常態(tài)，即使是海外頭部模型廠商也會(huì)學(xué)習(xí)對(duì)方模型的優(yōu)勢(shì)能力”，AI創(chuàng)業(yè)者Jojo告訴「AIX財(cái)經(jīng)」。

模型蒸餾之所以在業(yè)內(nèi)被廣泛采用，原因在于降本增效。

從零開(kāi)始訓(xùn)練一個(gè)高性能的大模型，需要耗費(fèi)海量的高質(zhì)量數(shù)據(jù)、巨大的算力以及漫長(zhǎng)的研發(fā)周期，成本極其高昂。

通過(guò)蒸餾，AI企業(yè)首先降低了數(shù)據(jù)成本：利用成熟模型的API生成高質(zhì)量的“問(wèn)答”作為訓(xùn)練數(shù)據(jù)，大幅減少人工標(biāo)注和數(shù)據(jù)清洗的成本；其次加速了研發(fā)進(jìn)程：快速讓自身模型的能力向行業(yè)頭部模型看齊，縮短技術(shù)差距，更快地驗(yàn)證產(chǎn)品和商業(yè)模式。

然而，為了防止自身核心能力被輕易“蒸餾”，閉源模型廠商也在采取防范措施。王明提到，Anthropic已經(jīng)聲明，一旦識(shí)別到用戶在進(jìn)行模型蒸餾，可能會(huì)對(duì)輸出語(yǔ)料進(jìn)行“投毒”，也就是在正常語(yǔ)句中混入錯(cuò)誤標(biāo)點(diǎn)、打亂文字順序、植入隱性錯(cuò)誤等，迫使蒸餾方投入大量人力校對(duì)、清洗數(shù)據(jù)，以此變相提高蒸餾成本。但這同樣可能損害自身模型的聲譽(yù)和用戶體驗(yàn)。

模型蒸餾的技術(shù)中立性與商業(yè)應(yīng)用的復(fù)雜性，自然引出了下一個(gè)核心問(wèn)題：在法律層面，這些行為該如何界定？

Anthropic的指控，站得住腳嗎？

Anthropic此次并未提起正式訴訟，而是選擇發(fā)布公開(kāi)報(bào)告并呼吁行業(yè)與政策制定者采取行動(dòng)。

它的指控很具體：注冊(cè)大量虛假賬號(hào)、繞過(guò)地域限制、進(jìn)行“工業(yè)規(guī)模的蒸餾攻擊”。在理解這個(gè)指控之前，先弄清一個(gè)技術(shù)細(xì)節(jié)，模型蒸餾有兩種形態(tài)——“黑盒蒸餾”與“白盒蒸餾”。

北京星也律師事務(wù)所于澤輝律師介紹，“白盒蒸餾”是需要獲取模型的內(nèi)部權(quán)限，直接訪問(wèn)底層參數(shù)、權(quán)重和架構(gòu)?！昂诤姓麴s”則是只能通過(guò)API接口與模型進(jìn)行交互。

Anthropic指控的是“黑盒蒸餾”，而這種做法在學(xué)術(shù)界和產(chǎn)業(yè)界被視為正常的技術(shù)迭代手段，不涉及任何商業(yè)機(jī)密的攝取。于澤輝解釋，這就像一個(gè)學(xué)生閱讀教材，并不侵犯教材的版權(quán)。

我們從證據(jù)鏈、版權(quán)歸屬和不正當(dāng)競(jìng)爭(zhēng)三個(gè)核心維度，結(jié)合法律專業(yè)人士的觀點(diǎn)進(jìn)行分析。

根據(jù)法律從業(yè)者的觀點(diǎn)，Anthropic指控面臨的首要挑戰(zhàn)是證據(jù)鏈的完整性。

劍橋頤華律師事務(wù)所楊衛(wèi)薪律師告訴「AIX財(cái)經(jīng)」，即便Anthropic能證明特定賬號(hào)存在高頻調(diào)用，卻無(wú)法證明這些調(diào)用產(chǎn)生的輸出內(nèi)容確實(shí)被用于模型訓(xùn)練，更無(wú)法證明相關(guān)行為是為所在公司的產(chǎn)品開(kāi)發(fā)服務(wù)。這之間隔著多層需要獨(dú)立證明的法律事實(shí)。Anthropic目前公開(kāi)的信息，并未完成這一系列的舉證環(huán)節(jié)。

其次，指控若要構(gòu)成版權(quán)侵權(quán)，需證明其模型輸出的內(nèi)容是受《著作權(quán)法》保護(hù)的“作品”。這面臨兩大障礙：

一是AI生成物是否構(gòu)成作品？于澤輝提到，美國(guó)版權(quán)局通常對(duì)純AI生成內(nèi)容不予版權(quán)保護(hù)。但Anthropic的用戶協(xié)議中明確約定，用戶擁有對(duì)輸入和輸出內(nèi)容的權(quán)利。他指出：“平臺(tái)既然已經(jīng)通過(guò)協(xié)議將相關(guān)內(nèi)容的所有權(quán)轉(zhuǎn)讓給用戶，隨后又主張知識(shí)產(chǎn)權(quán)受到侵害并限制用戶合法使用，這在法律邏輯上是完全自相矛盾的?！?/p>

二是保護(hù)思想還是表達(dá)？楊衛(wèi)薪介紹，AI大模型通過(guò)交互學(xué)到的是能力而非具體內(nèi)容，這種能力屬于思想、方法的范疇，而著作權(quán)法僅保護(hù)表達(dá)，并不保護(hù)思想和概念，因此相關(guān)行為并不構(gòu)成版權(quán)侵權(quán)。

最后，將“模型蒸餾”定義為不正當(dāng)競(jìng)爭(zhēng)行為同樣困難重重。

于澤輝表示，Anthropic在這一問(wèn)題上存在將違約行為與違法行為相混淆的傾向。它將用戶協(xié)議層面的違約指控，包裝成非法提取甚至國(guó)家安全威脅，而這在法律層面是兩個(gè)性質(zhì)不同的概念。

Anthropic用戶協(xié)議中存在“禁止用于訓(xùn)練競(jìng)爭(zhēng)性模型”的條款，一方面，“競(jìng)爭(zhēng)性模型”的定義模糊不清。另一方面，即便相關(guān)企業(yè)違反了禁止將模型輸出用于競(jìng)爭(zhēng)模型訓(xùn)練的用戶協(xié)議，其承擔(dān)的主要是合同法上的違約責(zé)任，但這并不等同于實(shí)施了不正當(dāng)競(jìng)爭(zhēng)行為。通過(guò)正常且付費(fèi)的API調(diào)用獲取公開(kāi)輸出，是否構(gòu)成入侵系統(tǒng)獲取底層代碼或參數(shù)，值得商榷。

綜上所述，受訪律師認(rèn)為，Anthropic的指控在現(xiàn)行法律框架下，無(wú)論是從版權(quán)還是不正當(dāng)競(jìng)爭(zhēng)的角度，都面臨著相當(dāng)大的舉證困難和法律適用障礙。Anthropic選擇發(fā)布公開(kāi)報(bào)告而非提起正式訴訟，或許與上述法律層面的挑戰(zhàn)不無(wú)關(guān)系。

蒸餾不是“萬(wàn)能藥”，省下成本省不下創(chuàng)新

盡管在法律上難以被嚴(yán)格界定為“竊取”，但模型蒸餾在商業(yè)戰(zhàn)略層面無(wú)疑是一把雙刃劍。它為AI領(lǐng)域的追趕者提供了一條看似高效的“捷徑”，但也帶了局限和挑戰(zhàn)。

首先是能力天花板和創(chuàng)新能力受限。學(xué)生模型的能力上限被教師模型牢牢鎖住，它能學(xué)會(huì)老師教的知識(shí)，卻很難超越老師，更無(wú)法實(shí)現(xiàn)真正的源頭創(chuàng)新。

Frank告訴「AIX財(cái)經(jīng)」，蒸餾后的模型大多會(huì)做輕量化處理，雖然參數(shù)更少、算力需求更低，但在處理復(fù)雜、全新任務(wù)時(shí)也會(huì)表現(xiàn)不佳，甚至出現(xiàn)輸出不穩(wěn)定的情況，能力天花板有限。

他進(jìn)一步解釋，如果原模型的思維偏理性，類似于“數(shù)學(xué)老師”，蒸餾后的模型也會(huì)延續(xù)這一特點(diǎn)，在語(yǔ)文等其他領(lǐng)域的能力可能會(huì)相對(duì)薄弱。

過(guò)度依賴蒸餾也會(huì)使模型在回答風(fēng)格和思維范式上趨同于教師模型，喪失獨(dú)特性和創(chuàng)造性，難以形成差異化的競(jìng)爭(zhēng)優(yōu)勢(shì)。

其次是缺陷被繼承。Frank表示，教師模型存在的偏見(jiàn)、幻覺(jué)、錯(cuò)誤認(rèn)知等問(wèn)題，會(huì)被蒸餾后的模型原樣繼承，且由于學(xué)生模型不具備自主糾錯(cuò)的能力，這些缺陷會(huì)被固化甚至放大。

這些局限指向一個(gè)核心問(wèn)題：靠模型蒸餾，企業(yè)無(wú)法實(shí)現(xiàn)技術(shù)上的超越，所以對(duì)于處于追趕階段的企業(yè)而言，這只是一種務(wù)實(shí)的階段性策略。

王明解釋，模型訓(xùn)練分為預(yù)訓(xùn)練、后訓(xùn)練等多個(gè)階段，最核心的預(yù)訓(xùn)練階段無(wú)法通過(guò)蒸餾完成，企業(yè)要自主研發(fā)模型，就必須獨(dú)立完成這一階段。同時(shí)，企業(yè)在不同發(fā)展階段對(duì)數(shù)據(jù)的需求也不同，起步階段會(huì)用蒸餾數(shù)據(jù)控制成本、快速驗(yàn)證技術(shù)可行性，但發(fā)展到追求模型質(zhì)量的階段，必然會(huì)轉(zhuǎn)向人工創(chuàng)造的高質(zhì)量數(shù)據(jù)，打造自身模型的獨(dú)特性。

Jojo指出，蒸餾的核心作用是讓后發(fā)模型快速向先進(jìn)模型對(duì)齊。這是“追趕者”的技術(shù)手段，但單純依靠這份復(fù)刻的能力，企業(yè)只能一直跟在頭部廠商身后，后續(xù)的研發(fā)工作也容易陷入被動(dòng)的跟隨狀態(tài)，無(wú)法突破原模型的能力邊界，更談不上打造屬于自己的技術(shù)壁壘。

在Frank看來(lái)，在AI快速發(fā)展的時(shí)代，想要靠限制蒸餾來(lái)維持競(jìng)爭(zhēng)優(yōu)勢(shì)并不現(xiàn)實(shí)，與其將精力放在對(duì)現(xiàn)有能力的保護(hù)上，不如多花功夫在自身模型的技術(shù)迭代和創(chuàng)新上，實(shí)現(xiàn)突破。

總的來(lái)說(shuō)，不必談“蒸餾”色變。模型蒸餾僅是一種普遍、常規(guī)的技術(shù)迭代手段，它能為AI模型的發(fā)展提供一把“梯子”，但并不是“萬(wàn)能藥”，模型的優(yōu)勢(shì)還要靠自身的核心研發(fā)實(shí)力來(lái)實(shí)現(xiàn)。

結(jié)語(yǔ)

本質(zhì)上，Anthropic的指控，是全球AI產(chǎn)業(yè)在高速發(fā)展下一次矛盾的集中爆發(fā)。它反應(yīng)出了一些值得深思的問(wèn)題：

一是開(kāi)源與閉源的路線之爭(zhēng)：事件背后是AI領(lǐng)域開(kāi)源精神與閉源商業(yè)模式之間的持續(xù)博弈。如何在鼓勵(lì)技術(shù)快速擴(kuò)散、推動(dòng)行業(yè)整體進(jìn)步與保護(hù)企業(yè)研發(fā)投入、維持商業(yè)競(jìng)爭(zhēng)力之間找到平衡，是所有從業(yè)者必須面對(duì)的難題。

二是全球AI競(jìng)爭(zhēng)的白熱化：隨著中國(guó)AI企業(yè)的快速崛起，全球AI領(lǐng)域的競(jìng)爭(zhēng)正日趨激烈。Anthropic的指控，無(wú)論其初衷如何，客觀上都帶有濃厚的商業(yè)競(jìng)爭(zhēng)色彩，反映出頭部廠商在領(lǐng)先地位受到挑戰(zhàn)時(shí)的焦慮。

對(duì)于被指控的企業(yè)而言，此次風(fēng)波是一次警醒，提示我們?cè)谧汾s過(guò)程中必須更加注重合規(guī)性，并盡快從“學(xué)習(xí)模仿”走向“自主創(chuàng)新”。而對(duì)于整個(gè)行業(yè)，與其將精力耗費(fèi)在如何限制“蒸餾”上，不如回歸技術(shù)創(chuàng)新的本質(zhì)，通過(guò)構(gòu)建真正的技術(shù)壁壘和差異化優(yōu)勢(shì)，來(lái)贏得市場(chǎng)的最終尊重。

*題圖及文中配圖來(lái)源于pexels。應(yīng)受訪者要求，文中Frank、Jojo、王明均為化名。

特別聲明

本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布，僅代表該作者或機(jī)構(gòu)觀點(diǎn)，不代表澎湃新聞的觀點(diǎn)或立場(chǎng)，澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問(wèn)http://renzheng.thepaper.cn。

我要舉報(bào)

#Anthropic