用社媒照片訓(xùn)練AIGC大模型，隱私和版權(quán)怎么算？

澎湃研究所研究員呂娜

2023-10-16 20:05

來(lái)源：澎湃新聞

? 澎湃研究所 >

聽(tīng)全文

生成式人工智能（AIGC）給創(chuàng)意帶來(lái)了令人驚嘆的新可能。通過(guò)學(xué)習(xí)海量數(shù)據(jù)，AIGC可以在沒(méi)有人類干預(yù)的情況下快速生成文本，繪制圖像，創(chuàng)作音樂(lè)，編制程序等，大幅提升了創(chuàng)意類工作的效率。

不過(guò)，由于訓(xùn)練AIGC需要向其“投喂”大量的訓(xùn)練數(shù)據(jù)，而這些數(shù)據(jù)通常來(lái)自互聯(lián)網(wǎng)上的數(shù)據(jù)集或用戶上傳的內(nèi)容，一系列復(fù)雜問(wèn)題也隨之產(chǎn)生。當(dāng)使用人們創(chuàng)作的內(nèi)容及數(shù)據(jù)來(lái)“投喂”AIGC時(shí)，如何界定這些創(chuàng)作內(nèi)容的數(shù)字版權(quán)是否受到侵犯？

顯失公平的協(xié)議條款，后知后覺(jué)的平臺(tái)用戶

近來(lái)，一些社交平臺(tái)被曝出擅自將用戶發(fā)布的文字、照片、視頻等內(nèi)容用于訓(xùn)練其研發(fā)的AIGC大模型，引發(fā)廣泛關(guān)注。

以某個(gè)深受年輕人喜愛(ài)的生活方式分享平臺(tái)為例，有用戶偶然發(fā)現(xiàn)自己上傳的繪畫(huà)作品被用于訓(xùn)練平臺(tái)開(kāi)發(fā)的繪畫(huà)AIGC模型，并且作品還受到了匿名處理。

然而，在投訴和維權(quán)過(guò)程中，用戶吃驚地發(fā)現(xiàn)，原來(lái)早在自己注冊(cè)該平臺(tái)賬戶時(shí)，勾選同意的用戶協(xié)議中就已包含了同意授權(quán)的條款。

根據(jù)條款規(guī)定，用戶同意授予平臺(tái)“免費(fèi)的、不可撤銷(xiāo)的、非排他的、無(wú)地域限制的許可使用，包括存儲(chǔ)、使用、傳播、復(fù)制、修訂、改編、匯編、出版、展示、翻譯、表演用戶內(nèi)容或制作派生作品等……”其中的“制作派生作品”這一提法，讓平臺(tái)輕易就獲得了用戶的提前授權(quán)，可以免費(fèi)將用戶上傳和發(fā)布的內(nèi)容用于訓(xùn)練AIGC模型。

現(xiàn)實(shí)中，許多用戶在注冊(cè)平臺(tái)賬戶時(shí)往往來(lái)不及仔細(xì)閱讀、反復(fù)推敲用戶協(xié)議內(nèi)容中的所有條款，就快速點(diǎn)擊了“同意”，或者想要使用軟件就無(wú)法選擇不同意。因此這種不一定能完整體現(xiàn)用戶的真實(shí)意愿。往往等到發(fā)現(xiàn)被侵權(quán)后，用戶才后知后覺(jué)地意識(shí)到當(dāng)初的疏忽。

盡管平臺(tái)通過(guò)一套嚴(yán)密的“話術(shù)”得到了大量用戶數(shù)據(jù)，節(jié)約了訓(xùn)練AIGC模型的成本，但這種做法挑戰(zhàn)了用戶的信息權(quán)利和數(shù)字版權(quán)，并嚴(yán)重?fù)p害用戶對(duì)平臺(tái)的信任。也可以看到，平臺(tái)和科技公司在確保AIGC的使用不侵犯創(chuàng)作者權(quán)益方面尚存在較大不足，也缺乏足夠監(jiān)管。

與AIGC交互，個(gè)人信息權(quán)利遭遇兩類困境

社交媒體平臺(tái)是互聯(lián)網(wǎng)社會(huì)的重要支撐，數(shù)以億計(jì)的用戶躋身其中，分享他們的生活、思考和創(chuàng)意內(nèi)容。平臺(tái)在為用戶提供信息服務(wù)的同時(shí)，也匯聚和存儲(chǔ)了海量用戶數(shù)據(jù)。如果平臺(tái)拿走用戶上傳的內(nèi)容來(lái)訓(xùn)練其AIGC大模型，卻未經(jīng)用戶充分知情同意，就會(huì)導(dǎo)致數(shù)字版權(quán)和數(shù)據(jù)隱私的雙重困境。并且，由于涉及人與AIGC的交互，用戶的個(gè)人信息權(quán)利也較以往更難以響應(yīng)和主張。

首先是數(shù)字版權(quán)歸屬困境。平臺(tái)用戶在上傳原創(chuàng)作品時(shí)，這些作品的版權(quán)理應(yīng)歸屬于創(chuàng)作者。雖然平臺(tái)提供的用戶協(xié)議中可能包含了授權(quán)條款，但用戶對(duì)于他們的作品被用于AIGC訓(xùn)練的方式、細(xì)節(jié)和潛在影響通常沒(méi)有得到充分披露和理解，因此并不能完全確保用戶的數(shù)字版權(quán)和內(nèi)容創(chuàng)作權(quán)益。

其次是數(shù)據(jù)隱私困境。用戶愿意通過(guò)平臺(tái)來(lái)發(fā)布信息，部分是基于對(duì)平臺(tái)的信任，相信平臺(tái)會(huì)妥善處理他們的個(gè)人數(shù)據(jù)。但是，如果平臺(tái)還未取得用戶充分同意，就擅自將其數(shù)據(jù)用于AIGC模型訓(xùn)練，且令用戶維權(quán)無(wú)門(mén)，這將會(huì)給用戶數(shù)據(jù)隱私保護(hù)、知情權(quán)和數(shù)字內(nèi)容版權(quán)等個(gè)人基本信息權(quán)利造成較大負(fù)面影響。

落實(shí)個(gè)人數(shù)字版權(quán)，治理面臨四項(xiàng)關(guān)鍵挑戰(zhàn)

今年8月，中國(guó)網(wǎng)信辦《生成式人工智能服務(wù)管理暫行辦法》開(kāi)始施行，明確規(guī)定了生成式人工智能服務(wù)提供者的服務(wù)規(guī)范。其中，涉及個(gè)人信息的，提供者應(yīng)依法承擔(dān)個(gè)人信息處理者責(zé)任，履行個(gè)人信息保護(hù)義務(wù)。然而，確立指導(dǎo)原則只是第一步。在AIGC時(shí)代，數(shù)字內(nèi)容的版權(quán)保護(hù)還面臨著幾項(xiàng)關(guān)鍵挑戰(zhàn)，亟須開(kāi)展針對(duì)性的治理和監(jiān)管創(chuàng)新，確保將平臺(tái)用戶的個(gè)人信息權(quán)利落到實(shí)處。

數(shù)據(jù)來(lái)源和版權(quán)歸屬

研發(fā)AIGC需要大量的訓(xùn)練數(shù)據(jù)，而這通常來(lái)自互聯(lián)網(wǎng)上的各種來(lái)源。問(wèn)題是，這些數(shù)據(jù)的版權(quán)歸屬并不總是清晰可見(jiàn)。就像前述案例中，用戶上傳的繪畫(huà)作品的版權(quán)是否依然歸他們所有，還是一旦上傳到平臺(tái)就變成了平臺(tái)的資產(chǎn)，還存在很多復(fù)雜的情況需要辨析。未來(lái)，應(yīng)當(dāng)制定更清晰的法規(guī)來(lái)厘清用戶創(chuàng)作和發(fā)布數(shù)據(jù)的版權(quán)歸屬問(wèn)題。

用戶授權(quán)和知情權(quán)

當(dāng)用戶上傳內(nèi)容到社交平臺(tái)時(shí)，通常需要同意平臺(tái)的服務(wù)協(xié)議。然而，這些協(xié)議往往很長(zhǎng)且難以理解，用戶很少有時(shí)間和精力去仔細(xì)閱讀和理解。等到后續(xù)出現(xiàn)侵權(quán)問(wèn)題，用戶又會(huì)被指責(zé)未能充分了解協(xié)議中的條款，進(jìn)而導(dǎo)致對(duì)其作品的不當(dāng)使用。這就涉及如何實(shí)現(xiàn)和確保用戶的知情權(quán)問(wèn)題，亟須設(shè)計(jì)更好的合規(guī)細(xì)則來(lái)讓用戶理解并控制自己的創(chuàng)作內(nèi)容是如何被使用。

技術(shù)判定和取證困難

在AIGC時(shí)代，判定數(shù)字創(chuàng)作內(nèi)容是否侵權(quán)正變得更加困難。因?yàn)锳IGC可以生成高度相似但不完全相同的作品，而且它的創(chuàng)作方式是基于機(jī)器學(xué)習(xí)而非直接復(fù)制。這使得維權(quán)和證明侵權(quán)變得更加復(fù)雜，今后還需要更多的技術(shù)手段和法律支持供給。

平臺(tái)責(zé)任和自律

社交平臺(tái)在AIGC時(shí)代需要承擔(dān)更大的責(zé)任，以符合技術(shù)倫理的方式來(lái)管理和使用用戶上傳的內(nèi)容。這需要構(gòu)建更加嚴(yán)格的審核機(jī)制、更明確的用戶授權(quán)流程以及更積極的版權(quán)保護(hù)措施。同時(shí)，技術(shù)公司也需要加強(qiáng)自律，確保其對(duì)AIGC模型的訓(xùn)練和使用不會(huì)侵犯用戶信息權(quán)利，而不是與用戶爭(zhēng)利。

人工智能技術(shù)的創(chuàng)新對(duì)于數(shù)字社會(huì)的繁榮至關(guān)重要，但創(chuàng)新需要有底線，數(shù)據(jù)獲取也應(yīng)合理合法。保護(hù)數(shù)字版權(quán)，提供合理回報(bào)，對(duì)于基于平互聯(lián)網(wǎng)臺(tái)的內(nèi)容創(chuàng)作和發(fā)布者意義重大。當(dāng)前平臺(tái)用戶正面臨著個(gè)人難以掌控的情況，他們創(chuàng)造的內(nèi)容可能會(huì)被“悄悄”用于訓(xùn)練AIGC模型，而不僅僅是分享。因此，我們需要建立更明確的法律框架，以平衡技術(shù)創(chuàng)新和數(shù)字版權(quán)保護(hù)，降低個(gè)人信息風(fēng)險(xiǎn)，維護(hù)健康的數(shù)字生態(tài)。

--------

城市因集聚而誕生。

一座城市的公共政策、人居環(huán)境、習(xí)俗風(fēng)氣塑造了市民生活的底色。

澎湃城市觀察，聚焦公共政策，回應(yīng)大眾關(guān)切，探討城市議題。

責(zé)任編輯：朱玫潔

圖片編輯：蔣立冬

校對(duì)：施鋆

澎湃新聞報(bào)料：021-962866

澎湃新聞，未經(jīng)授權(quán)不得轉(zhuǎn)載

我要舉報(bào)

#AIGC #隱私保護(hù)#數(shù)字版權(quán)#社交媒體