- +1
用社媒照片訓(xùn)練AIGC大模型,隱私和版權(quán)怎么算?
生成式人工智能(AIGC)給創(chuàng)意帶來(lái)了令人驚嘆的新可能。通過(guò)學(xué)習(xí)海量數(shù)據(jù),AIGC可以在沒(méi)有人類干預(yù)的情況下快速生成文本,繪制圖像,創(chuàng)作音樂(lè),編制程序等,大幅提升了創(chuàng)意類工作的效率。不過(guò),由于訓(xùn)練AIGC需要向其“投喂”大量的訓(xùn)練數(shù)據(jù),而這些數(shù)據(jù)通常來(lái)自互聯(lián)網(wǎng)上的數(shù)據(jù)集或用戶上傳的內(nèi)容,一系列復(fù)雜問(wèn)題也隨之產(chǎn)生。當(dāng)使用人們創(chuàng)作的內(nèi)容及數(shù)據(jù)來(lái)“投喂”AIGC時(shí),如何界定這些創(chuàng)作內(nèi)容的數(shù)字版權(quán)是否受到侵犯?
顯失公平的協(xié)議條款,后知后覺(jué)的平臺(tái)用戶
近來(lái),一些社交平臺(tái)被曝出擅自將用戶發(fā)布的文字、照片、視頻等內(nèi)容用于訓(xùn)練其研發(fā)的AIGC大模型,引發(fā)廣泛關(guān)注。
以某個(gè)深受年輕人喜愛(ài)的生活方式分享平臺(tái)為例,有用戶偶然發(fā)現(xiàn)自己上傳的繪畫(huà)作品被用于訓(xùn)練平臺(tái)開(kāi)發(fā)的繪畫(huà)AIGC模型,并且作品還受到了匿名處理。
然而,在投訴和維權(quán)過(guò)程中,用戶吃驚地發(fā)現(xiàn),原來(lái)早在自己注冊(cè)該平臺(tái)賬戶時(shí),勾選同意的用戶協(xié)議中就已包含了同意授權(quán)的條款。
根據(jù)條款規(guī)定,用戶同意授予平臺(tái)“免費(fèi)的、不可撤銷(xiāo)的、非排他的、無(wú)地域限制的許可使用,包括存儲(chǔ)、使用、傳播、復(fù)制、修訂、改編、匯編、出版、展示、翻譯、表演用戶內(nèi)容或制作派生作品等……”其中的“制作派生作品”這一提法,讓平臺(tái)輕易就獲得了用戶的提前授權(quán),可以免費(fèi)將用戶上傳和發(fā)布的內(nèi)容用于訓(xùn)練AIGC模型。
現(xiàn)實(shí)中,許多用戶在注冊(cè)平臺(tái)賬戶時(shí)往往來(lái)不及仔細(xì)閱讀、反復(fù)推敲用戶協(xié)議內(nèi)容中的所有條款,就快速點(diǎn)擊了“同意”,或者想要使用軟件就無(wú)法選擇不同意。因此這種不一定能完整體現(xiàn)用戶的真實(shí)意愿。往往等到發(fā)現(xiàn)被侵權(quán)后,用戶才后知后覺(jué)地意識(shí)到當(dāng)初的疏忽。
盡管平臺(tái)通過(guò)一套嚴(yán)密的“話術(shù)”得到了大量用戶數(shù)據(jù),節(jié)約了訓(xùn)練AIGC模型的成本,但這種做法挑戰(zhàn)了用戶的信息權(quán)利和數(shù)字版權(quán),并嚴(yán)重?fù)p害用戶對(duì)平臺(tái)的信任。也可以看到,平臺(tái)和科技公司在確保AIGC的使用不侵犯創(chuàng)作者權(quán)益方面尚存在較大不足,也缺乏足夠監(jiān)管。
與AIGC交互,個(gè)人信息權(quán)利遭遇兩類困境
社交媒體平臺(tái)是互聯(lián)網(wǎng)社會(huì)的重要支撐,數(shù)以億計(jì)的用戶躋身其中,分享他們的生活、思考和創(chuàng)意內(nèi)容。平臺(tái)在為用戶提供信息服務(wù)的同時(shí),也匯聚和存儲(chǔ)了海量用戶數(shù)據(jù)。如果平臺(tái)拿走用戶上傳的內(nèi)容來(lái)訓(xùn)練其AIGC大模型,卻未經(jīng)用戶充分知情同意,就會(huì)導(dǎo)致數(shù)字版權(quán)和數(shù)據(jù)隱私的雙重困境。并且,由于涉及人與AIGC的交互,用戶的個(gè)人信息權(quán)利也較以往更難以響應(yīng)和主張。
首先是數(shù)字版權(quán)歸屬困境。平臺(tái)用戶在上傳原創(chuàng)作品時(shí),這些作品的版權(quán)理應(yīng)歸屬于創(chuàng)作者。雖然平臺(tái)提供的用戶協(xié)議中可能包含了授權(quán)條款,但用戶對(duì)于他們的作品被用于AIGC訓(xùn)練的方式、細(xì)節(jié)和潛在影響通常沒(méi)有得到充分披露和理解,因此并不能完全確保用戶的數(shù)字版權(quán)和內(nèi)容創(chuàng)作權(quán)益。
其次是數(shù)據(jù)隱私困境。用戶愿意通過(guò)平臺(tái)來(lái)發(fā)布信息,部分是基于對(duì)平臺(tái)的信任,相信平臺(tái)會(huì)妥善處理他們的個(gè)人數(shù)據(jù)。但是,如果平臺(tái)還未取得用戶充分同意,就擅自將其數(shù)據(jù)用于AIGC模型訓(xùn)練,且令用戶維權(quán)無(wú)門(mén),這將會(huì)給用戶數(shù)據(jù)隱私保護(hù)、知情權(quán)和數(shù)字內(nèi)容版權(quán)等個(gè)人基本信息權(quán)利造成較大負(fù)面影響。
落實(shí)個(gè)人數(shù)字版權(quán),治理面臨四項(xiàng)關(guān)鍵挑戰(zhàn)
今年8月,中國(guó)網(wǎng)信辦《生成式人工智能服務(wù)管理暫行辦法》開(kāi)始施行,明確規(guī)定了生成式人工智能服務(wù)提供者的服務(wù)規(guī)范。其中,涉及個(gè)人信息的,提供者應(yīng)依法承擔(dān)個(gè)人信息處理者責(zé)任,履行個(gè)人信息保護(hù)義務(wù)。然而,確立指導(dǎo)原則只是第一步。在AIGC時(shí)代,數(shù)字內(nèi)容的版權(quán)保護(hù)還面臨著幾項(xiàng)關(guān)鍵挑戰(zhàn),亟須開(kāi)展針對(duì)性的治理和監(jiān)管創(chuàng)新,確保將平臺(tái)用戶的個(gè)人信息權(quán)利落到實(shí)處。
數(shù)據(jù)來(lái)源和版權(quán)歸屬
研發(fā)AIGC需要大量的訓(xùn)練數(shù)據(jù),而這通常來(lái)自互聯(lián)網(wǎng)上的各種來(lái)源。問(wèn)題是,這些數(shù)據(jù)的版權(quán)歸屬并不總是清晰可見(jiàn)。就像前述案例中,用戶上傳的繪畫(huà)作品的版權(quán)是否依然歸他們所有,還是一旦上傳到平臺(tái)就變成了平臺(tái)的資產(chǎn),還存在很多復(fù)雜的情況需要辨析。未來(lái),應(yīng)當(dāng)制定更清晰的法規(guī)來(lái)厘清用戶創(chuàng)作和發(fā)布數(shù)據(jù)的版權(quán)歸屬問(wèn)題。
用戶授權(quán)和知情權(quán)
當(dāng)用戶上傳內(nèi)容到社交平臺(tái)時(shí),通常需要同意平臺(tái)的服務(wù)協(xié)議。然而,這些協(xié)議往往很長(zhǎng)且難以理解,用戶很少有時(shí)間和精力去仔細(xì)閱讀和理解。等到后續(xù)出現(xiàn)侵權(quán)問(wèn)題,用戶又會(huì)被指責(zé)未能充分了解協(xié)議中的條款,進(jìn)而導(dǎo)致對(duì)其作品的不當(dāng)使用。這就涉及如何實(shí)現(xiàn)和確保用戶的知情權(quán)問(wèn)題,亟須設(shè)計(jì)更好的合規(guī)細(xì)則來(lái)讓用戶理解并控制自己的創(chuàng)作內(nèi)容是如何被使用。
技術(shù)判定和取證困難
在AIGC時(shí)代,判定數(shù)字創(chuàng)作內(nèi)容是否侵權(quán)正變得更加困難。因?yàn)锳IGC可以生成高度相似但不完全相同的作品,而且它的創(chuàng)作方式是基于機(jī)器學(xué)習(xí)而非直接復(fù)制。這使得維權(quán)和證明侵權(quán)變得更加復(fù)雜,今后還需要更多的技術(shù)手段和法律支持供給。
平臺(tái)責(zé)任和自律
社交平臺(tái)在AIGC時(shí)代需要承擔(dān)更大的責(zé)任,以符合技術(shù)倫理的方式來(lái)管理和使用用戶上傳的內(nèi)容。這需要構(gòu)建更加嚴(yán)格的審核機(jī)制、更明確的用戶授權(quán)流程以及更積極的版權(quán)保護(hù)措施。同時(shí),技術(shù)公司也需要加強(qiáng)自律,確保其對(duì)AIGC模型的訓(xùn)練和使用不會(huì)侵犯用戶信息權(quán)利,而不是與用戶爭(zhēng)利。
人工智能技術(shù)的創(chuàng)新對(duì)于數(shù)字社會(huì)的繁榮至關(guān)重要,但創(chuàng)新需要有底線,數(shù)據(jù)獲取也應(yīng)合理合法。保護(hù)數(shù)字版權(quán),提供合理回報(bào),對(duì)于基于平互聯(lián)網(wǎng)臺(tái)的內(nèi)容創(chuàng)作和發(fā)布者意義重大。當(dāng)前平臺(tái)用戶正面臨著個(gè)人難以掌控的情況,他們創(chuàng)造的內(nèi)容可能會(huì)被“悄悄”用于訓(xùn)練AIGC模型,而不僅僅是分享。因此,我們需要建立更明確的法律框架,以平衡技術(shù)創(chuàng)新和數(shù)字版權(quán)保護(hù),降低個(gè)人信息風(fēng)險(xiǎn),維護(hù)健康的數(shù)字生態(tài)。
--------
城市因集聚而誕生。
一座城市的公共政策、人居環(huán)境、習(xí)俗風(fēng)氣塑造了市民生活的底色。
澎湃城市觀察,聚焦公共政策,回應(yīng)大眾關(guān)切,探討城市議題。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2026 上海東方報(bào)業(yè)有限公司




