OpenAI推出圖像水印新技術，AI生成內(nèi)容將更易被識別

2026-05-22 16:10

來源：澎湃新聞·澎湃號·湃客

聽全文

今日，OpenAI宣布在其圖像生態(tài)系統(tǒng)中全面引入內(nèi)容溯源信號機制，簡而言之，就是為AI生成的圖像打上專屬標記。

這一方向并非全新嘗試。自2024年起，OpenAI及其他AI工具便已開始在AI生成圖像中嵌入元數(shù)據(jù)。然而，彼時的元數(shù)據(jù)標記方式相對簡單，極易被規(guī)避。此次的真正突破在于，OpenAI借助多項前沿技術，大幅提升了圖像身份識別的安全性。

要理解這一技術的深層邏輯，不妨先將時間撥回公元前440年。

隱寫術的前世今生

隱寫術是一種將加密信息隱藏于公開載體中的技術手段，其核心在于讓信息的存在本身不易被察覺。換句話說，一旦有人知道某處藏有密碼，破解就已成功了一半。

據(jù)現(xiàn)代研究記載，公元前5世紀，古希臘歷史學家哈利卡納蘇斯的希羅多德在其著作《歷史》中記述了這樣一個故事："約公元前440年，希斯提亞斯剃光了他最信任的助手的頭發(fā)，在其頭皮上刺上密信，待頭發(fā)重新長出后，密信便隱于無形。此舉的目的是煽動一場反抗波斯人的起義。"據(jù)記載，這一技術甚至在二戰(zhàn)期間仍有使用。

如果你看過電視偵探劇，劇中常有人從一封普通信件中每隔幾個字母讀出一條隱藏信息，這便是文字版隱寫術的典型案例。這種加密方式雖然強度較低，但若無人知曉信中有玄機，自然也不會去嘗試破解。

在數(shù)字圖像領域，隱寫術已被應用多年，可將文字信息嵌入構成圖片的數(shù)百萬像素之中。這使得創(chuàng)作者能夠以極難被破除的方式，將所有權與來源信息植入圖像之中。

這一技術正是此次OpenAI重大公告的核心所在。

從元數(shù)據(jù)到可信標準

自2024年起，OpenAI便已在DALL-E 3、ImageGen及Sora生成的圖像中嵌入元數(shù)據(jù)。用戶可借助Content Credentials等工具查看這些信息。谷歌的Nano Banana及其他圖像生成AI工具同樣在生成圖像中嵌入了一定的元數(shù)據(jù)。

以ChatGPT和Nano Banana生成的圖像為例：左側(cè)為ChatGPT生成圖，右側(cè)為Nano Banana生成圖，兩者的元數(shù)據(jù)均可通過Content Credentials工具正常讀取。

然而，當對這些圖像進行截圖操作后——截圖僅捕獲像素，不包含底層元數(shù)據(jù)——Content Credentials工具只會報錯提示"出現(xiàn)錯誤"。截圖操作會徹底抹去原始圖像文件所攜帶的元數(shù)據(jù)信息。

這正是OpenAI和谷歌努力尋求解決的核心問題之一。

對此，OpenAI表示："我們?yōu)榇艘雅α讼喈旈L的時間。我們已在Sora中使用可見水印，在Voice Engine中加入音頻水印，并在部署過程中持續(xù)對準確性和可靠性進行測試與研究。"

OpenAI還宣布："我們近期正式成為C2PA合規(guī)生成產(chǎn)品。通過取得C2PA合規(guī)認證，我們?yōu)楦髌脚_提供了一種可信的方式，以讀取、保留并傳遞我們附加在內(nèi)容上的溯源信息。"

C2PA，即內(nèi)容溯源與真實性聯(lián)盟，下設C2PA合規(guī)計劃，旨在"為產(chǎn)品符合Content Credentials規(guī)范提供保證，并通過一系列安全要求，確保產(chǎn)品能夠正確生成和驗證C2PA數(shù)據(jù)"。

通俗而言，這意味著內(nèi)容元數(shù)據(jù)已實現(xiàn)標準化、安全化，且信息量足以發(fā)揮實際價值。OpenAI已將此機制應用于旗下所有圖像產(chǎn)品。其公關代表告知："ChatGPT和OpenAI生成的所有圖像（包括通過OpenAI API和Codex生成的圖像）均包含這些溯源信號。"

引入SynthID：水印技術的重大升級

"信號"，注意這里是復數(shù)形式，這正引出了此次公告的重磅核心。

谷歌DeepMind的SynthID是一種多模態(tài)數(shù)字水印機制，能夠在文本、圖像、視頻和音頻中嵌入不可見的數(shù)字水印，技術相當精妙。值得注意的是，盡管谷歌與OpenAI在商業(yè)上是直接競爭對手，OpenAI如今也已將SynthID技術整合至其生成的所有圖像中。

對于圖像而言，SynthID基于像素層面運作。在圖像生成的瞬間，一種類似隱寫術的微妙信號便被嵌入其中。這一身份數(shù)據(jù)對人眼完全不可見，但檢測工具可輕松讀取。即便經(jīng)過裁剪、壓縮、調(diào)色等后期處理乃至截圖操作，這一數(shù)字水印依然完整保留。更為關鍵的是，數(shù)字簽名被均勻分布于整幅圖像之中，而非僅集中在某一局部區(qū)域。

因此，Nano Banana在其生成圖像角落添加的小小菱形標志之外，同樣在整幅圖像中嵌入了更為全面、完整的溯源信號。

SynthID還有一項極為強大的功能，此次OpenAI并未在公告中特別提及：SynthID能夠?qū)ξ谋具M行水印處理，且顯然不會影響文本質(zhì)量。其原理是極為微妙地在每段文本中選擇特定的Token，使生成內(nèi)容中蘊含一種可被檢測軟件識別的統(tǒng)計特征。這一功能目前尚未被OpenAI正式宣布用于ChatGPT，但已在Gemini中投入使用。

與C2PA合規(guī)措施相同，OpenAI已在通過ChatGPT、Codex及OpenAI API生成的圖像中全面嵌入SynthID。

公共驗證工具正式上線

與C2PA合規(guī)及SynthID功能同步發(fā)布的，還有一款面向公眾開放的驗證工具，用戶可通過該工具檢測某張圖像是否由OpenAI旗下AI工具生成。

該工具的訪問地址為：https://openai.com/research/verify/

目前仍有諸多值得深入探索的問題：這款工具的邊界在哪里？它與SynthID聯(lián)動效果如何？例如，若從ChatGPT生成的圖像中截取部分內(nèi)容，與真實照片合成Photoshop作品，工具能否識別出其中AI生成的比例？這些問題有待后續(xù)真實測試來驗證。

對于此次系列舉措，OpenAI總結道："沒有任何單一的溯源技術能夠單獨奏效。我們認為，一套強有力的方案應將共享標準、持久水印信號與公共驗證機制有機結合。通過持續(xù)支持Content Credentials、取得C2PA合規(guī)認證、采用SynthID，并預告公共驗證工具的上線，我們希望從長遠來看，為構建一個更具互操作性的溯源生態(tài)系統(tǒng)貢獻力量。"

Q&A

Q1：OpenAI的SynthID圖像水印技術有什么特別之處？

A：SynthID是谷歌DeepMind開發(fā)的多模態(tài)數(shù)字水印機制，其特別之處在于水印嵌入方式基于像素層面，在圖像生成瞬間即將信號均勻分布于整幅圖像中，人眼無法察覺但檢測工具可讀取。即便圖像經(jīng)過裁剪、壓縮、調(diào)色甚至截圖處理，水印依然保留，不會因常規(guī)后期處理而消失。OpenAI目前已將SynthID整合至ChatGPT、Codex及OpenAI API生成的所有圖像中。

Q2：C2PA合規(guī)認證對普通用戶有什么實際意義？

A：C2PA是內(nèi)容溯源與真實性聯(lián)盟制定的行業(yè)標準，取得該認證意味著圖像中嵌入的元數(shù)據(jù)具備標準化、安全化的特點，且信息量足夠豐富。對普通用戶而言，這意味著通過Content Credentials等工具查看圖像來源時，能獲得更可靠、更完整的信息，從而更容易判斷一張圖是否為AI生成，有助于識別AI合成內(nèi)容與真實圖像。

Q3：OpenAI的公共圖像驗證工具怎么用？能檢測什么？

A：OpenAI推出的公共驗證工具地址為https://openai.com/research/verify/，用戶可通過該工具檢測某張圖像是否由OpenAI旗下AI工具（包括ChatGPT、Codex、OpenAI API等）生成。目前該工具的具體能力邊界尚待進一步測試，例如對于將AI圖像局部與真實照片合成的作品，能否準確識別其中的AI成分，仍有待驗證。

特別聲明

本文為澎湃號作者或機構在澎湃新聞上傳并發(fā)布，僅代表該作者或機構觀點，不代表澎湃新聞的觀點或立場，澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

我要舉報

#OpenAI