- +1
“互聯(lián)網(wǎng)檔案館”告急:互聯(lián)網(wǎng)時(shí)代的公共記憶終將消逝?
公元前323年,曾經(jīng)睥睨天下的亞歷山大大帝猝然離世,他所建立的橫跨歐非亞三洲的大帝國(guó)旋即陷入繼業(yè)者的內(nèi)部?jī)A軋之中;為了收拾群龍無(wú)首的殘局,亞歷山大曾經(jīng)的部將托勒密公元前305年在埃及地區(qū)宣布稱(chēng)王,并決意在尼羅河三角洲附近以亞歷山大所命名的港口城市奠定統(tǒng)治根基,使其比肩雅典成為地中海世界最耀眼的學(xué)術(shù)中心。在舉朝不計(jì)成本的努力之下,亞歷山大圖書(shū)館建成,數(shù)十萬(wàn)卷書(shū)籍和文獻(xiàn)得以留存和管理,歐亞非地區(qū)許多科學(xué)家、哲學(xué)家和文學(xué)家的主要著作被收集起來(lái)。然而,隨著托勒密王朝的日益衰敗,這座圖書(shū)館也卷入了戰(zhàn)火之中,屢次成為侵略和襲擊的目標(biāo),并最終在羅馬帝國(guó)皇帝狄?jiàn)W多西一世要求禁止一切異端的敕令下被破壞殆盡。

亞歷山大圖書(shū)館
亞歷山大圖書(shū)館的毀滅,被視作是全球文化史上最為慘重的浩劫之一;在后世歐洲的文化想象中,它的消亡逐漸成為“失落知識(shí)圣殿”的象征。自文藝復(fù)興時(shí)期以來(lái),這座曾經(jīng)匯集古代世界智慧的中心成為歐陸思想家們想象與仰慕的對(duì)象,重建堪比亞歷山大圖書(shū)館的知識(shí)典藏的夢(mèng)想自此展開(kāi),從未斷絕。隨著科學(xué)技術(shù)的發(fā)展和傳播介質(zhì)的簡(jiǎn)化,數(shù)字技術(shù)的問(wèn)世讓人們第一次看到了希望的曙光;而1996年,在萬(wàn)維網(wǎng)面對(duì)公眾開(kāi)放不過(guò)三年以后,一位名叫布魯斯特·卡利(Brewster Kahle)的美國(guó)電腦工程師創(chuàng)立了非營(yíng)利機(jī)構(gòu)“互聯(lián)網(wǎng)檔案館(Internet Archive)”,以“普遍獲取一切知識(shí)”為使命收集全世界的信息并將其在網(wǎng)絡(luò)上進(jìn)行永久保存,這一舉動(dòng)得到了“亞歷山大圖書(shū)館得以復(fù)興”的贊嘆。
隨著這一雄心勃勃的項(xiàng)目走入它為普羅大眾服務(wù)的第三十個(gè)年頭,互聯(lián)網(wǎng)檔案館通過(guò)電子留檔的形式保存了浩如煙海的書(shū)籍、音頻、視頻、軟件程序、圖像、文獻(xiàn)和特色服務(wù)項(xiàng)目,已經(jīng)成為了學(xué)術(shù)研究者、調(diào)查記者、檔案管理員和無(wú)數(shù)普通人必不可少的網(wǎng)絡(luò)工具。在互聯(lián)網(wǎng)技術(shù)被大型資本集團(tuán)壟斷的現(xiàn)實(shí)下,這一平臺(tái)作為屈指可數(shù)的堅(jiān)持奉行Web 1.0時(shí)代“以?xún)?nèi)容為中心的自由傳播”精神的平臺(tái),依靠著全世界圖書(shū)館的捐贈(zèng)、慈善機(jī)構(gòu)的貢獻(xiàn)和無(wú)數(shù)志愿者的維護(hù)毅然挺立。盡管如此,伴隨著版權(quán)管理規(guī)則的收緊和生成式AI平臺(tái)對(duì)信息環(huán)境的沖擊,互聯(lián)網(wǎng)檔案館正在面臨著自創(chuàng)立以來(lái)最為嚴(yán)峻的威脅和挑戰(zhàn)。

2022年4月19日,在埃及亞歷山大拍攝的亞歷山大圖書(shū)館內(nèi)景。新華社 圖
為了盡可能保存全世界公開(kāi)可訪問(wèn)網(wǎng)頁(yè)的歷史快照,互聯(lián)網(wǎng)檔案館會(huì)通過(guò)自動(dòng)運(yùn)行的爬蟲(chóng)腳本訪問(wèn)網(wǎng)頁(yè),并將自己所閱覽的內(nèi)容抓取并存入自己的數(shù)據(jù)庫(kù)中,在自己管理的“時(shí)光機(jī)(Wayback Machine)”網(wǎng)站上存放,供公眾閱覽和檢索。這一服務(wù)在方便普通人查詢(xún)的同時(shí),網(wǎng)站上海量原始、免費(fèi)的信息更被亟需海量公開(kāi)可訪問(wèn)資料來(lái)訓(xùn)練大語(yǔ)言模型的 AI 企業(yè)視作取之不盡的聚寶盆。出于對(duì)AI大模型系統(tǒng)性利用互聯(lián)網(wǎng)檔案館的數(shù)據(jù)進(jìn)行訓(xùn)練從而損害自身盈利模式、危及輿論信息環(huán)境安全的擔(dān)憂,自2026年1月以來(lái),《紐約時(shí)報(bào)》、《衛(wèi)報(bào)》、管理全美數(shù)百家本地報(bào)紙的《今日美國(guó)》集團(tuán)陸續(xù)宣布將會(huì)通過(guò)robots.txt規(guī)則、訪問(wèn)限制和其他技術(shù)手段阻攔互聯(lián)網(wǎng)檔案館的爬蟲(chóng)抓取頁(yè)面,以避免其受版權(quán)保護(hù)的內(nèi)容在未經(jīng)允許的情況下成為AI模型的訓(xùn)練資料。在此之前,網(wǎng)絡(luò)論壇平臺(tái)Reddit已經(jīng)宣布,為了避免論壇數(shù)據(jù)成為AI模型的訓(xùn)練資料,他們將會(huì)對(duì)互聯(lián)網(wǎng)檔案館的爬蟲(chóng)加以封殺。
隨著這些限制的升級(jí)和發(fā)酵,三家網(wǎng)絡(luò)自由倡導(dǎo)組織與一百余名傳統(tǒng)和獨(dú)立媒體的記者編輯在四月初發(fā)起了一項(xiàng)聯(lián)名公開(kāi)信簽署活動(dòng)聲援互聯(lián)網(wǎng)檔案館,大力肯定其公共價(jià)值。在信中,署名者對(duì)互聯(lián)網(wǎng)檔案館的工作進(jìn)行了毫不吝惜的贊揚(yáng),并表示這份記錄的保存關(guān)乎新聞業(yè)子孫后代的傳承,是確保這些信息對(duì)于公眾觸手可及最重要甚至是唯一的工具。在社交媒體上,公開(kāi)信署名者之一的獨(dú)立記者大衛(wèi)·西羅塔(David Sirota)將互聯(lián)網(wǎng)檔案館譽(yù)為“純凈互聯(lián)網(wǎng)的永恒陽(yáng)光”,將阻攔訪問(wèn)的行為比作“將亞歷山大圖書(shū)館付之一炬”。另一位公開(kāi)信的署名者,科技博客Techdirt的創(chuàng)始人麥克·馬斯尼克(Mike Masnick)也表示,為了避免數(shù)據(jù)被AI抓取而封鎖互聯(lián)網(wǎng)檔案館的信息訪問(wèn)權(quán),是“我們急于懲罰AI公司的過(guò)程中,對(duì)服務(wù)于所有人的公共資源的摧毀”。
如今五十多歲的西羅塔和馬斯尼克都是從年輕時(shí)就開(kāi)始關(guān)注技術(shù)發(fā)展并使用互聯(lián)網(wǎng)進(jìn)行內(nèi)容創(chuàng)作的美國(guó)媒體人;他們的身份和經(jīng)歷讓他們從這一技術(shù)誕生的時(shí)候開(kāi)始,親身見(jiàn)證了互聯(lián)網(wǎng)時(shí)代的發(fā)展和興衰,也因此對(duì)封鎖互聯(lián)網(wǎng)檔案館訪問(wèn)權(quán)會(huì)對(duì)公共知識(shí)傳承與歷史記憶權(quán)利造成何種影響,抱有格外強(qiáng)烈的警惕。該機(jī)構(gòu)當(dāng)前面臨的挑戰(zhàn),既體現(xiàn)了互聯(lián)網(wǎng)及其服務(wù)在歷史演進(jìn)與解讀過(guò)程中的跌宕起伏,也折射出在這個(gè)充滿(mǎn)不確定性且資本權(quán)力野蠻擴(kuò)張日益加劇的時(shí)代,信息自由和歷史記憶風(fēng)雨飄搖的危險(xiǎn)處境。
互聯(lián)網(wǎng)檔案館與記憶的政治性
師從“人工智能先驅(qū)”馬文·明斯基(Marvin Minsky),1982年畢業(yè)于麻省理工學(xué)院的卡利,在成為互聯(lián)網(wǎng)檔案館的創(chuàng)立者之前,曾是科技行業(yè)發(fā)展創(chuàng)新的佼佼者,開(kāi)發(fā)了互聯(lián)網(wǎng)上首個(gè)發(fā)布和分布式搜索系統(tǒng)廣域信息服務(wù)器(WAIS)和網(wǎng)站信息數(shù)據(jù)分析平臺(tái)Alexa,在這兩項(xiàng)業(yè)務(wù)被收購(gòu)之后身價(jià)千萬(wàn)。盡管聲名顯赫且事業(yè)有成,他一直懷揣著成為圖書(shū)檔案管理員的夢(mèng)想,這在一定程度上源于他讀到羅伯特·賓克利的故事——這位被譽(yù)為“數(shù)字人文界鼻祖”的歷史學(xué)家在1930年代將大量書(shū)籍制成微縮膠片并復(fù)制傳播,旨在向美國(guó)農(nóng)村地區(qū)以更為便利的方式推廣知識(shí)。
自互聯(lián)網(wǎng)作為基礎(chǔ)設(shè)施投入運(yùn)行以來(lái),網(wǎng)頁(yè)缺乏可追溯性便一直成為了許多人最為頭疼的問(wèn)題。無(wú)論是遭遇人為刪除還是服務(wù)器停運(yùn),曾經(jīng)可訪問(wèn)的信息都可能輕易變成一頁(yè)“404錯(cuò)誤”頁(yè)面,且不留任何物理痕跡。根據(jù)皮尤研究中心的調(diào)查數(shù)據(jù),從2013到2023年的十年間,在他們抽樣調(diào)查的540萬(wàn)個(gè)網(wǎng)頁(yè)之中,有38%的網(wǎng)頁(yè)已經(jīng)失效,而有25%的網(wǎng)頁(yè)已經(jīng)徹底消失。依靠著互聯(lián)網(wǎng)檔案館的保護(hù),這些已經(jīng)消失的網(wǎng)頁(yè)的數(shù)量才由25%降低到10%。通過(guò)將網(wǎng)址信息置于它存在時(shí)的語(yǔ)境中以供不做評(píng)價(jià)的瀏覽,互聯(lián)網(wǎng)檔案館的作用不僅限于幫助用戶(hù)獲取內(nèi)容信息本身,更成為保障信息真實(shí)性與完整性的重要結(jié)構(gòu)性支撐。
隨著網(wǎng)頁(yè)存檔工作的成功,自1990年代末開(kāi)始,卡利將互聯(lián)網(wǎng)檔案館業(yè)務(wù)范圍向各類(lèi)不同的媒介擴(kuò)展,致力于為尋求各類(lèi)不同信息的人們提供綜合的查詢(xún)和閱覽服務(wù)。通過(guò)與全球各地的圖書(shū)館、檔案館、博物館、政府機(jī)構(gòu)、歷史學(xué)會(huì)、文化遺產(chǎn)組織、各類(lèi)機(jī)構(gòu)、收藏家和協(xié)會(huì)合作,互聯(lián)網(wǎng)檔案館迄今為止已經(jīng)存儲(chǔ)了約1萬(wàn)億個(gè)網(wǎng)頁(yè)、5600萬(wàn)本書(shū)籍和文本、1300萬(wàn)個(gè)音頻文件、1500萬(wàn)個(gè)視頻、530萬(wàn)張圖片和130萬(wàn)個(gè)軟件程序。當(dāng)現(xiàn)實(shí)世界中的檔案保護(hù)工作在錯(cuò)綜復(fù)雜的世界局勢(shì)中面臨日益嚴(yán)重的武裝沖突和資金短缺的威脅,互聯(lián)網(wǎng)檔案館已成為存儲(chǔ)這些無(wú)價(jià)信息最直接可及的渠道,有時(shí)甚至是其僅存的歸宿。
對(duì)于許多職業(yè)的核心工作而言,互聯(lián)網(wǎng)檔案館是一項(xiàng)不可或缺的公共工具。調(diào)查記者用它來(lái)去查詢(xún)過(guò)往的內(nèi)容來(lái)核查信息和對(duì)權(quán)力問(wèn)責(zé);律師和檢察官用它來(lái)建立網(wǎng)站在特定時(shí)間所發(fā)布內(nèi)容以作為法律證據(jù);研究人員用它來(lái)查閱常規(guī)途徑難以甚至無(wú)法獲取的資料;檔案管理者用它來(lái)重建過(guò)去的規(guī)劃和城市生活來(lái)復(fù)原歷史發(fā)展的脈絡(luò)。在接受采訪時(shí),來(lái)自不同行業(yè)的專(zhuān)業(yè)人士都異口同聲地指出,互聯(lián)網(wǎng)檔案館的服務(wù)至關(guān)重要,是他們的研究得以繼續(xù)的命脈。在缺乏資金、原始資料已消失、被修改、地理上無(wú)法獲取、絕版或技術(shù)過(guò)時(shí)的情況下,互聯(lián)網(wǎng)檔案館的服務(wù)至今無(wú)法被替代。
從這種角度上說(shuō),互聯(lián)網(wǎng)檔案館真正的作用并不只限于它所承載的信息和它為服務(wù)對(duì)象提供的便利,而在于它讓信息擁有了可以被記憶的途徑,從而為這些記憶提供了被賦予價(jià)值和意義的基礎(chǔ)條件。在媒介數(shù)字化的時(shí)代,記憶已經(jīng)遠(yuǎn)遠(yuǎn)超越了大腦內(nèi)部活動(dòng)這種單純的個(gè)體生理行為,而是以技術(shù)為支撐、以公共參與為底色,將那些散落、易逝、易被篡改的數(shù)字痕跡,轉(zhuǎn)化為可被回溯、可被共享的集體記憶。荷蘭媒介研究學(xué)者何塞?范戴克(José van Dijck)在《數(shù)字時(shí)代的媒介化記憶》一書(shū)中指出,記憶和媒體都不是被動(dòng)的載體,人類(lèi)始終在通過(guò)各類(lèi)媒介搭建敘事、分享記憶、構(gòu)建公共認(rèn)知空間;互聯(lián)網(wǎng)檔案館不僅加速了這一進(jìn)程,更有效地拆除了記憶生產(chǎn)與傳播的壁壘 —— 它兼具檔案的留存功能與公共參與屬性,以中立開(kāi)放的平臺(tái)收納多元信息、呈現(xiàn)原始痕跡,由此打破了由官方、精英單一主導(dǎo)的傳統(tǒng)記憶載體的敘事霸權(quán)。
對(duì)當(dāng)今許多人而言,互聯(lián)網(wǎng)是一個(gè)由資本主義食物鏈頂端的幾家市值多到無(wú)法想象的巨頭企業(yè)所主導(dǎo)的,無(wú)處不在卻又有些令人生畏的存在。然而,回顧歷史,Web 1.0時(shí)代創(chuàng)建的服務(wù)本是旨在通過(guò)便捷的方式,讓信息共享與創(chuàng)作變得更加公平且普及的平臺(tái)。萬(wàn)維網(wǎng)的發(fā)明者蒂姆·伯納斯-李(Tim Berners-Lee)曾回憶道,他創(chuàng)造萬(wàn)維網(wǎng)的初衷是構(gòu)建一個(gè)基于公共標(biāo)準(zhǔn)、去中心化的信息共享互動(dòng)世界,而那個(gè)年代的互聯(lián)網(wǎng)從業(yè)者對(duì)持續(xù)互動(dòng)、平臺(tái)壟斷和算法驅(qū)動(dòng)的關(guān)注遠(yuǎn)不如現(xiàn)在這般強(qiáng)烈。
加利福尼亞大學(xué)洛杉磯分校(UCLA)社會(huì)與遺傳學(xué)研究所教授克里斯托弗?凱爾蒂(Christopher Kelty)指出,互聯(lián)網(wǎng)的問(wèn)題并不在于技術(shù)本身,而在于其背后的社會(huì)與政治構(gòu)想:原本促成它成功的開(kāi)放性,參與性,去中心化表達(dá)等曾被視為促進(jìn)自由與平等的理念,在平臺(tái)資本主義壟斷的語(yǔ)境中借助舊有的政治特權(quán)所加以曲解異化,轉(zhuǎn)而服務(wù)于權(quán)力集中與經(jīng)濟(jì)控制之中,最終使得它變成了如今這副數(shù)據(jù)被平臺(tái)收集與變現(xiàn),信息和真相可以被隨意操縱,用戶(hù)從消費(fèi)者變成被消費(fèi)的內(nèi)容的模樣。作為依舊以免費(fèi)存儲(chǔ)和分享知識(shí)為宗旨的信息平臺(tái),互聯(lián)網(wǎng)檔案館的存在宛若定格于Web 1.0時(shí)間中的活化石,在如今的社會(huì)生態(tài)環(huán)境中鳳毛麟角。
AI與版權(quán):互聯(lián)網(wǎng)檔案館的危機(jī)時(shí)刻
互聯(lián)網(wǎng)檔案館之所以成為眾矢之的,恰恰因?yàn)樗鼒?jiān)守著Web 1.0時(shí)代那種把知識(shí)盡可能開(kāi)放、復(fù)制、共享的倫理;而今天主導(dǎo)互聯(lián)網(wǎng)的平臺(tái)和版權(quán)秩序則越來(lái)越把信息看成需要被圈定、管控和變現(xiàn)的資產(chǎn)。在他們的認(rèn)知中,如果一家有影響力的實(shí)體的原則未能按照他們制定的游戲規(guī)則“與時(shí)俱進(jìn)”,那么它就可能對(duì)自己對(duì)這些資產(chǎn)的持續(xù)壟斷的威脅,就會(huì)成為他們利用法律手段直接攻擊的目標(biāo)。在21世紀(jì)初,多家提供音樂(lè)流媒體、電視廣播或軟件服務(wù)的在線平臺(tái)因版權(quán)糾紛被起訴至破產(chǎn),徹底終結(jié)了Web 1.0時(shí)代之后,版權(quán)持有者開(kāi)始逐漸將目光轉(zhuǎn)向了互聯(lián)網(wǎng)檔案館。
根據(jù)《美國(guó)法典》第17編第109(a)條規(guī)定的首次銷(xiāo)售原則,美國(guó)圖書(shū)館在分發(fā)范圍有限的情況下,依法有權(quán)分發(fā)其擁有的書(shū)籍實(shí)體副本,這被視為合理使用,從而使圖書(shū)館能夠履行其最基本的功能:出借書(shū)籍供人們閱讀。建立在為圖書(shū)館設(shè)置的合理使用的基礎(chǔ)上,互聯(lián)網(wǎng)檔案館為其藏書(shū)開(kāi)發(fā)了一套受控的數(shù)字借閱系統(tǒng),這些藏書(shū)通常來(lái)自其合作圖書(shū)館制作的復(fù)印件。該系統(tǒng)依托數(shù)字版權(quán)管理技術(shù),防止受版權(quán)保護(hù)的作品被未經(jīng)授權(quán)下載,且僅允許一名用戶(hù)通過(guò)候補(bǔ)名單同時(shí)借閱一本書(shū)進(jìn)行閱覽。按照他們的主張,在受控?cái)?shù)字借閱模式下,對(duì)這些實(shí)體藏書(shū)進(jìn)行數(shù)字化并按“一本實(shí)體對(duì)應(yīng)一份數(shù)字借閱”的方式出借應(yīng)被理解為圖書(shū)館職能在數(shù)字時(shí)代的延伸。

當(dāng)?shù)貢r(shí)間2025年12月11日,加拿大,一部智能手機(jī)屏幕上顯示著互聯(lián)網(wǎng)檔案館的標(biāo)志。視覺(jué)中國(guó) 圖
問(wèn)題出現(xiàn)在2020年3月新冠疫情期間。當(dāng)時(shí)各圖書(shū)館關(guān)閉,互聯(lián)網(wǎng)檔案館放寬了限制以鼓勵(lì)更多人訪問(wèn)其存檔書(shū)籍,允許多名用戶(hù)同時(shí)借閱一本書(shū),并為此推出了一項(xiàng)名為“國(guó)家緊急圖書(shū)館”的服務(wù)。幾個(gè)月后,由美國(guó)出版行業(yè)協(xié)會(huì)所支持的四家大型出版商對(duì)互聯(lián)網(wǎng)檔案館提起訴訟,認(rèn)為“國(guó)家緊急圖書(shū)館”及其借閱服務(wù)違反了合理使用原則。他們主張,由于互聯(lián)網(wǎng)檔案館本身并不是書(shū)籍的持有者,因此無(wú)權(quán)在線以自身的名義出借數(shù)字副本。
盡管這起訴訟僅涉及 127 本與出版商版權(quán)相關(guān)的圖書(shū),但是作為全世界最大的數(shù)字副本檔案,互聯(lián)網(wǎng)檔案館的管理者們深知這起訴訟的余波將遠(yuǎn)遠(yuǎn)不會(huì)是這幾本書(shū)那么簡(jiǎn)單;在案件的口頭辯論開(kāi)始不久以后,互聯(lián)網(wǎng)檔案館的高級(jí)政策顧問(wèn)在新聞發(fā)布會(huì)上表示,這些出版商并未給出互聯(lián)網(wǎng)檔案館的借閱行為直接給他們的銷(xiāo)售產(chǎn)生經(jīng)濟(jì)損害的有效證據(jù)。在訴訟過(guò)程中,美國(guó)東北大學(xué)一位經(jīng)濟(jì)學(xué)家提交的專(zhuān)家評(píng)估報(bào)告指出,大多數(shù)圖書(shū)的主要銷(xiāo)售額產(chǎn)生于其商業(yè)生命周期的早期,而許多圖書(shū)的前五年銷(xiāo)售額就占其總銷(xiāo)售額的90%,但互聯(lián)網(wǎng)檔案館通常在圖書(shū)早已過(guò)了銷(xiāo)售高峰期后才進(jìn)行數(shù)字化處理,因此該借閱計(jì)劃并未對(duì)出版商的圖書(shū)銷(xiāo)售造成實(shí)質(zhì)性損害。
盡管如此,2023年3月,紐約南區(qū)地區(qū)法院裁定出版商勝訴;2024年9月,第二巡回上訴法院維持原判,認(rèn)定互聯(lián)網(wǎng)檔案館的全書(shū)掃描及免費(fèi)在線借閱行為不構(gòu)成合理使用。三個(gè)月后,互聯(lián)網(wǎng)檔案館公開(kāi)表示,他們將不會(huì)向最高法院申請(qǐng)復(fù)審,并同意在借閱系統(tǒng)中移除被出版集團(tuán)點(diǎn)名的書(shū)籍,總數(shù)超過(guò)五十萬(wàn)本。在訴訟塵埃落定以后,卡利曾在采訪中感嘆,相比于廣泛鼓勵(lì)數(shù)字化副本傳播,以公共教育為名義對(duì)電子借閱行為進(jìn)行版權(quán)豁免的歐洲、印度和中國(guó),美國(guó)的圖書(shū)管理體系已經(jīng)不再像之前那樣領(lǐng)先世界。
除了書(shū)籍外,互聯(lián)網(wǎng)檔案館還收錄了數(shù)十萬(wàn)份由收藏家和機(jī)構(gòu)捐贈(zèng)的舊式78轉(zhuǎn)唱片。由于這種錄音介質(zhì)及其播放設(shè)備早已絕版,互聯(lián)網(wǎng)檔案館主張,對(duì)其進(jìn)行數(shù)字化處理旨在為研究人員和后世保存歷史,這與該機(jī)構(gòu)保存書(shū)籍的初衷如出一轍。盡管互聯(lián)網(wǎng)檔案館表示,從商業(yè)流媒體單次播放成本的角度來(lái)看,這些歌曲的播放次數(shù)產(chǎn)生的收益微不足道,但擁有部分錄音版權(quán)的多家唱片公司仍就歌曲數(shù)字化一事提起訴訟,索賠金額超過(guò)七億美元。盡管這起訴訟在未作出最終實(shí)體裁決的情況下達(dá)成了保密和解,但數(shù)千份唱片公司聲稱(chēng)仍在市面上流通的數(shù)字化錄音也因此被永久下架,這些錄音在互聯(lián)網(wǎng)檔案館上已無(wú)法進(jìn)行播放或下載,從而避免與官方流媒體服務(wù)形成競(jìng)爭(zhēng)。
正在版權(quán)問(wèn)題已成為對(duì)互聯(lián)網(wǎng)檔案館持續(xù)運(yùn)營(yíng)穩(wěn)定性的嚴(yán)重威脅的同時(shí),AI公司廣泛利用互聯(lián)網(wǎng)檔案館的數(shù)據(jù)進(jìn)行模型訓(xùn)練的做法也引起了新聞和社交媒體平臺(tái)的擔(dān)憂,從而導(dǎo)致了他們?cè)诮衲晁鞒龅姆怄i決定。當(dāng)記者詢(xún)問(wèn)他們?yōu)楹芜@樣做時(shí),這些平臺(tái)的發(fā)言人不約而同地表示,他們并非專(zhuān)門(mén)針對(duì)互聯(lián)網(wǎng)檔案館,而是出于阻止未經(jīng)授權(quán)的信息抓取行為,保障自身知識(shí)產(chǎn)權(quán)的普遍原則。
這些行為已然成為平臺(tái)與人工智能公司之間沖突這一更大趨勢(shì)的一部分:《紐約時(shí)報(bào)》集團(tuán)以“通過(guò)隱藏爬蟲(chóng)非法復(fù)制網(wǎng)站內(nèi)容”為由起訴了OpenAI和Perplexity,并指控他們生成的內(nèi)容與網(wǎng)站的原文不符,屬于“AI幻覺(jué)”;而一名法官在聽(tīng)證后裁定,允許14家主要新聞出版商聯(lián)合起訴另一家人工智能初創(chuàng)公司Cohere,理由是該模型生成的內(nèi)容“數(shù)量和質(zhì)量上均與原內(nèi)容相似”。在美國(guó)各地,來(lái)自各類(lèi)出版商和創(chuàng)作者的一百多起訴訟指控AI公司大規(guī)模侵犯知識(shí)產(chǎn)權(quán),并以此來(lái)對(duì)自己的模型進(jìn)行數(shù)據(jù)訓(xùn)練。盡管他們認(rèn)為這種侵權(quán)并非蓄意為之,但他們相信,正是互聯(lián)網(wǎng)檔案館免費(fèi)集中保存信息的機(jī)制成為了這種侵權(quán)行為的“后門(mén)”。
互聯(lián)網(wǎng)檔案館所發(fā)揮的關(guān)鍵作用贏得了多個(gè)領(lǐng)域的廣泛支持,從而催生了今年四月呼吁各大媒體平臺(tái)不要限制爬蟲(chóng)的聯(lián)名信。在這些人看來(lái),它的持續(xù)存在讓它早已超越了自己的功能本身,作為Web 1.0時(shí)代的絕唱,演變?yōu)樽杂砷_(kāi)放的信息環(huán)境精神的象征;也正是因?yàn)槿绱耍晕髁_塔為代表的記者們才會(huì)發(fā)出警告,互聯(lián)網(wǎng)檔案館的消失將會(huì)讓奧威爾在《1984》中那句“誰(shuí)控制了過(guò)去,誰(shuí)就控制了未來(lái)”的預(yù)言一語(yǔ)成讖,從而讓對(duì)權(quán)力的有效問(wèn)責(zé)變成一紙空文。
互聯(lián)網(wǎng)檔案館的未來(lái)會(huì)在何方
目前,隨著網(wǎng)頁(yè)保存工作的命運(yùn)懸而未決,雙方都在努力尋求一個(gè)有效的折中方案。為了持續(xù)吸引公眾的關(guān)注度,互聯(lián)網(wǎng)檔案館的發(fā)言人在近期多次公開(kāi)闡述其服務(wù)的意義,強(qiáng)調(diào)其作為非營(yíng)利性服務(wù)機(jī)構(gòu)繼續(xù)運(yùn)營(yíng)的必要性,并特別強(qiáng)調(diào)目前尚無(wú)其他非營(yíng)利組織能以同等規(guī)模和速度進(jìn)行信息保存。然而,新聞界并非所有人都對(duì)此舉印象積極,有人直言該組織是在有預(yù)謀地公開(kāi)扮演受害者角色,通過(guò)否認(rèn)自身的主體性來(lái)博取同情,卻不為它的服務(wù)所造成的現(xiàn)實(shí)問(wèn)題提供有效的解決方案。
前《衛(wèi)報(bào)》科技主編查爾斯·亞瑟(Charles Arthur)在他的個(gè)人博客上指出,在與選擇直接起訴AI公司竊取知識(shí)產(chǎn)權(quán)不同,沒(méi)有一家新聞機(jī)構(gòu)對(duì)互聯(lián)網(wǎng)檔案館發(fā)起過(guò)任何意義上的訴訟或者要求索賠。在AI模型所生產(chǎn)的“幻覺(jué)內(nèi)容”仍然在持續(xù)對(duì)新聞媒體的營(yíng)收和內(nèi)容生態(tài)造成持續(xù)的威脅時(shí),互聯(lián)網(wǎng)檔案館并沒(méi)有通過(guò)正式修改robots.txt的屏蔽規(guī)則,來(lái)徹底切斷AI公司使用互聯(lián)網(wǎng)檔案館的數(shù)據(jù)的渠道。當(dāng)亞瑟詢(xún)問(wèn)“時(shí)光機(jī)”主管馬克·格雷厄姆(Mark Graham)為什么不直接修改規(guī)則時(shí),他并沒(méi)有收到任何回應(yīng)。時(shí)至今日,無(wú)論互聯(lián)網(wǎng)檔案館的工作依然對(duì)無(wú)數(shù)人多么重要,但是它本身并沒(méi)有和這些新聞機(jī)構(gòu)談條件的實(shí)際籌碼,只能依靠聯(lián)名公開(kāi)信和社交媒體呼吁這類(lèi)公關(guān)活動(dòng)才能持續(xù)賺取關(guān)注度和獲得善意,卻對(duì)于自身存在對(duì)新聞機(jī)構(gòu)產(chǎn)生的威脅充耳不聞。
就連互聯(lián)網(wǎng)檔案館自己也承認(rèn),自己的工作并非十全十美:在資源約束、反爬蟲(chóng)攔截、登錄墻與付費(fèi)墻阻隔、深網(wǎng)內(nèi)容無(wú)法觸及,以及大量仍可訪問(wèn)的網(wǎng)頁(yè)因發(fā)現(xiàn)不及時(shí)淪為 “瀕危網(wǎng)址” 的多重局限下,在網(wǎng)頁(yè)持續(xù)消亡、平臺(tái)限制不斷收緊以及內(nèi)容生產(chǎn)機(jī)制發(fā)生變化的背景下,它所能保存的,不過(guò)是一個(gè)始終處于流失與補(bǔ)救之間的歷史切片。
如今的互聯(lián)網(wǎng)檔案館似乎走進(jìn)了自己親手編織的一個(gè)“死結(jié)”當(dāng)中:它在互聯(lián)網(wǎng)資本早已筑起高墻的年代,固執(zhí)地認(rèn)為只要有足夠多的使用者和足夠積極的名譽(yù),就可以度過(guò)一切困難和挑戰(zhàn)。誠(chéng)然,它利用自己的公共價(jià)值和利益,成功地避免了自己因?yàn)榍址笗?shū)籍和音樂(lè)作品版權(quán)而可能帶來(lái)的滅頂之災(zāi);但在這場(chǎng)與新聞機(jī)構(gòu)的政治中,他們并非唯一的受害者,他們也不應(yīng)該將自己表現(xiàn)為毫無(wú)反抗能力的受害者,將話語(yǔ)權(quán)和決策權(quán)主動(dòng)送給了已經(jīng)面臨著多重爭(zhēng)議的AI集團(tuán)們。
互聯(lián)網(wǎng)在它出現(xiàn)的三十余年中,硬件設(shè)施的進(jìn)步讓它已經(jīng)成為了無(wú)處不在而必不可少的基礎(chǔ)設(shè)施,從而幫助人們克服了技術(shù)上獲取網(wǎng)絡(luò)的困難,然而硅谷壟斷集團(tuán)的崛起卻讓主流互聯(lián)網(wǎng)選擇了遵守過(guò)去的游戲規(guī)則,讓自由的分享變得越來(lái)越困難。記憶不是中性的,記憶是對(duì)過(guò)去的回溯和意義賦予,是選擇記住什么、遺忘什么的權(quán)力實(shí)踐,是抵抗歷史被篡改與未來(lái)被平庸化的最后堡壘。
在一個(gè)弱肉強(qiáng)食的時(shí)代,對(duì)于這種捍衛(wèi)自由分享和記憶權(quán)利的事業(yè)的同情本身雖然能引發(fā)情緒上的積極共鳴,卻不可能真正解決它迫在眉睫的問(wèn)題。Web 1.0時(shí)代的理想終究未能兌現(xiàn),但作為新時(shí)代的“亞歷山大圖書(shū)館”,互聯(lián)網(wǎng)檔案館必須采取更加決絕的決心與舉措去守護(hù)自己所保存的那些數(shù)據(jù)和信息,對(duì)AI依賴(lài)所產(chǎn)生的泛平庸化和惰性說(shuō)“不”,才能夠不讓它和那些堅(jiān)守事實(shí)真相,相信記錄歷史有價(jià)值的人們感到失望無(wú)助。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2026 上海東方報(bào)業(yè)有限公司




