- +1
OpenAI推出圖像水印新技術,AI生成內(nèi)容將更易被識別
今日,OpenAI宣布在其圖像生態(tài)系統(tǒng)中全面引入內(nèi)容溯源信號機制,簡而言之,就是為AI生成的圖像打上專屬標記。
這一方向并非全新嘗試。自2024年起,OpenAI及其他AI工具便已開始在AI生成圖像中嵌入元數(shù)據(jù)。然而,彼時的元數(shù)據(jù)標記方式相對簡單,極易被規(guī)避。此次的真正突破在于,OpenAI借助多項前沿技術,大幅提升了圖像身份識別的安全性。
要理解這一技術的深層邏輯,不妨先將時間撥回公元前440年。
隱寫術的前世今生
隱寫術是一種將加密信息隱藏于公開載體中的技術手段,其核心在于讓信息的存在本身不易被察覺。換句話說,一旦有人知道某處藏有密碼,破解就已成功了一半。
據(jù)現(xiàn)代研究記載,公元前5世紀,古希臘歷史學家哈利卡納蘇斯的希羅多德在其著作《歷史》中記述了這樣一個故事:"約公元前440年,希斯提亞斯剃光了他最信任的助手的頭發(fā),在其頭皮上刺上密信,待頭發(fā)重新長出后,密信便隱于無形。此舉的目的是煽動一場反抗波斯人的起義。"據(jù)記載,這一技術甚至在二戰(zhàn)期間仍有使用。
如果你看過電視偵探劇,劇中常有人從一封普通信件中每隔幾個字母讀出一條隱藏信息,這便是文字版隱寫術的典型案例。這種加密方式雖然強度較低,但若無人知曉信中有玄機,自然也不會去嘗試破解。
在數(shù)字圖像領域,隱寫術已被應用多年,可將文字信息嵌入構成圖片的數(shù)百萬像素之中。這使得創(chuàng)作者能夠以極難被破除的方式,將所有權與來源信息植入圖像之中。
這一技術正是此次OpenAI重大公告的核心所在。
從元數(shù)據(jù)到可信標準
自2024年起,OpenAI便已在DALL-E 3、ImageGen及Sora生成的圖像中嵌入元數(shù)據(jù)。用戶可借助Content Credentials等工具查看這些信息。谷歌的Nano Banana及其他圖像生成AI工具同樣在生成圖像中嵌入了一定的元數(shù)據(jù)。
以ChatGPT和Nano Banana生成的圖像為例:左側(cè)為ChatGPT生成圖,右側(cè)為Nano Banana生成圖,兩者的元數(shù)據(jù)均可通過Content Credentials工具正常讀取。
然而,當對這些圖像進行截圖操作后——截圖僅捕獲像素,不包含底層元數(shù)據(jù)——Content Credentials工具只會報錯提示"出現(xiàn)錯誤"。截圖操作會徹底抹去原始圖像文件所攜帶的元數(shù)據(jù)信息。
這正是OpenAI和谷歌努力尋求解決的核心問題之一。
對此,OpenAI表示:"我們?yōu)榇艘雅α讼喈旈L的時間。我們已在Sora中使用可見水印,在Voice Engine中加入音頻水印,并在部署過程中持續(xù)對準確性和可靠性進行測試與研究。"
OpenAI還宣布:"我們近期正式成為C2PA合規(guī)生成產(chǎn)品。通過取得C2PA合規(guī)認證,我們?yōu)楦髌脚_提供了一種可信的方式,以讀取、保留并傳遞我們附加在內(nèi)容上的溯源信息。"
C2PA,即內(nèi)容溯源與真實性聯(lián)盟,下設C2PA合規(guī)計劃,旨在"為產(chǎn)品符合Content Credentials規(guī)范提供保證,并通過一系列安全要求,確保產(chǎn)品能夠正確生成和驗證C2PA數(shù)據(jù)"。
通俗而言,這意味著內(nèi)容元數(shù)據(jù)已實現(xiàn)標準化、安全化,且信息量足以發(fā)揮實際價值。OpenAI已將此機制應用于旗下所有圖像產(chǎn)品。其公關代表告知:"ChatGPT和OpenAI生成的所有圖像(包括通過OpenAI API和Codex生成的圖像)均包含這些溯源信號。"
引入SynthID:水印技術的重大升級
"信號",注意這里是復數(shù)形式,這正引出了此次公告的重磅核心。
谷歌DeepMind的SynthID是一種多模態(tài)數(shù)字水印機制,能夠在文本、圖像、視頻和音頻中嵌入不可見的數(shù)字水印,技術相當精妙。值得注意的是,盡管谷歌與OpenAI在商業(yè)上是直接競爭對手,OpenAI如今也已將SynthID技術整合至其生成的所有圖像中。
對于圖像而言,SynthID基于像素層面運作。在圖像生成的瞬間,一種類似隱寫術的微妙信號便被嵌入其中。這一身份數(shù)據(jù)對人眼完全不可見,但檢測工具可輕松讀取。即便經(jīng)過裁剪、壓縮、調(diào)色等后期處理乃至截圖操作,這一數(shù)字水印依然完整保留。更為關鍵的是,數(shù)字簽名被均勻分布于整幅圖像之中,而非僅集中在某一局部區(qū)域。
因此,Nano Banana在其生成圖像角落添加的小小菱形標志之外,同樣在整幅圖像中嵌入了更為全面、完整的溯源信號。
SynthID還有一項極為強大的功能,此次OpenAI并未在公告中特別提及:SynthID能夠?qū)ξ谋具M行水印處理,且顯然不會影響文本質(zhì)量。其原理是極為微妙地在每段文本中選擇特定的Token,使生成內(nèi)容中蘊含一種可被檢測軟件識別的統(tǒng)計特征。這一功能目前尚未被OpenAI正式宣布用于ChatGPT,但已在Gemini中投入使用。
與C2PA合規(guī)措施相同,OpenAI已在通過ChatGPT、Codex及OpenAI API生成的圖像中全面嵌入SynthID。
公共驗證工具正式上線
與C2PA合規(guī)及SynthID功能同步發(fā)布的,還有一款面向公眾開放的驗證工具,用戶可通過該工具檢測某張圖像是否由OpenAI旗下AI工具生成。
該工具的訪問地址為:https://openai.com/research/verify/
目前仍有諸多值得深入探索的問題:這款工具的邊界在哪里?它與SynthID聯(lián)動效果如何?例如,若從ChatGPT生成的圖像中截取部分內(nèi)容,與真實照片合成Photoshop作品,工具能否識別出其中AI生成的比例?這些問題有待后續(xù)真實測試來驗證。
對于此次系列舉措,OpenAI總結道:"沒有任何單一的溯源技術能夠單獨奏效。我們認為,一套強有力的方案應將共享標準、持久水印信號與公共驗證機制有機結合。通過持續(xù)支持Content Credentials、取得C2PA合規(guī)認證、采用SynthID,并預告公共驗證工具的上線,我們希望從長遠來看,為構建一個更具互操作性的溯源生態(tài)系統(tǒng)貢獻力量。"
Q&A
Q1:OpenAI的SynthID圖像水印技術有什么特別之處?
A:SynthID是谷歌DeepMind開發(fā)的多模態(tài)數(shù)字水印機制,其特別之處在于水印嵌入方式基于像素層面,在圖像生成瞬間即將信號均勻分布于整幅圖像中,人眼無法察覺但檢測工具可讀取。即便圖像經(jīng)過裁剪、壓縮、調(diào)色甚至截圖處理,水印依然保留,不會因常規(guī)后期處理而消失。OpenAI目前已將SynthID整合至ChatGPT、Codex及OpenAI API生成的所有圖像中。
Q2:C2PA合規(guī)認證對普通用戶有什么實際意義?
A:C2PA是內(nèi)容溯源與真實性聯(lián)盟制定的行業(yè)標準,取得該認證意味著圖像中嵌入的元數(shù)據(jù)具備標準化、安全化的特點,且信息量足夠豐富。對普通用戶而言,這意味著通過Content Credentials等工具查看圖像來源時,能獲得更可靠、更完整的信息,從而更容易判斷一張圖是否為AI生成,有助于識別AI合成內(nèi)容與真實圖像。
Q3:OpenAI的公共圖像驗證工具怎么用?能檢測什么?
A:OpenAI推出的公共驗證工具地址為https://openai.com/research/verify/,用戶可通過該工具檢測某張圖像是否由OpenAI旗下AI工具(包括ChatGPT、Codex、OpenAI API等)生成。目前該工具的具體能力邊界尚待進一步測試,例如對于將AI圖像局部與真實照片合成的作品,能否準確識別其中的AI成分,仍有待驗證。
本文為澎湃號作者或機構在澎湃新聞上傳并發(fā)布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務許可證:31120170006
增值電信業(yè)務經(jīng)營許可證:滬B2-2017116
? 2014-2026 上海東方報業(yè)有限公司




