AI之用②｜從全能神筆到“一鍵生成”下丟失的人

競菲 Jingfei Li

2025-08-14 10:59

來源：澎湃新聞

? 思想市場 >

聽全文

我們小時候可能聽過這樣一個故事：

從前有個窮孩子。他非常喜歡畫畫，可是家里太窮，連一支筆都買不起。白天他幫人放牛，晚上就用樹枝在地上畫畫，用煤炭在墻上畫畫。他的畫非常像真的，但他一直沒法擁有一支真正的畫筆。

有一天夜里，他夢見一位白胡子老人送給他一支神奇的毛筆。醒來后，他發(fā)現(xiàn)那支筆真的在自己的床邊。從此，他畫什么，什么就會變成真的。他畫鳥，鳥就飛走；畫魚，魚就游走。他開始用這支神筆幫助村里窮苦的人們畫吃的、用的、農(nóng)具、耕牛。他從不為富人作畫。

消息傳到了一個貪婪的皇帝耳中。皇帝命人來抓他，逼他用神筆為自己畫金山銀山。窮孩子假意答應，卻用神筆畫了一座海島，把金山銀山畫在遠遠的島上?；实圩洗Z寶，他卻畫起了狂風巨浪，巨浪把皇帝卷走了。

從此，他自由地四處流浪，用神筆幫助更多需要幫助的人。

神筆馬良創(chuàng)作于上個世紀50年代，它原本是一個帶有階級批判色彩的兒童故事，今天我們引用它，卻是為了談談這個故事中技術和人的關系。

馬良是一個像達·芬奇一樣的畫家，因為“他畫什么都像真的”，這是他與生俱來的本事，不因為“樹枝”，或者“煤炭”等技術工具不同而發(fā)生改變。他具有斯蒂格勒所說的識做（“savoir - faire”，知道怎樣做事的知識），類似于種地，打獵，制作桌椅，這是一種通過實踐或勞動而獲得的身體知識。馬良所擁有的是一種經(jīng)驗的知識，而不是形而上的、抽象的，關于知識的知識。此外，盡管畫鳥畫魚沒有什么實際用途，但我們依然可以想象，畫畫給馬良帶來了很大的快樂，否則，他就不會寢食俱廢地“白天放牛，晚上畫畫”。

而在馬良獲得了先進的技術工具之后，神筆加持了他原本的能力，帶來令人炫目的結果。然而，使用超級技術的代價，是讓他原本無目的的精神活動，變得必須要服務于“吃的，用的，農(nóng)具和耕?！钡葘嶋H生活目標。這些未必都是馬良喜歡的，然而，當技術成為主導時，馬良的主觀好惡，以及繪畫的精神性需要就變得毫不重要。就這樣，他從一個純粹的業(yè)余愛好者（amateur）變成了功利化的職業(yè)人士（professional）。此時，他的新身份，新自我，已經(jīng)不由他說了算，而是由技術工具來定義和指導。對于馬良而言，似乎“是媒介技術決定了我們能說什么，能思考什么”。

同時，技術在奪取了人的一部分主體性之后，要回過頭來修改歷史。最初，馬良只是想要一支普通畫筆，但他得到的卻是“在夢中由一位白胡子老人授予”的神筆，因為“神授”的起源和神話般的開始，讓人更加無法質(zhì)疑這項技術的正當性和合理性了。

再接下來，馬良使用神筆懲罰了貪婪的皇帝，技術不僅是強大的，還是善良的，是反抗暴政和階級壓迫的象征。這樣一來，技術不再是中性的，而是染上了道德和政治的色彩，是一種必須由正確的人掌握的“好”技術。

最后，馬良攜帶著這項“好”的技術繼續(xù)在大地上自由地流浪，幫助他想幫助的人。不過，我們盡可以想象，擁有這種超級技術的馬良，是不可能，也沒有辦法再次“自由地四處流浪”的。他可能會被覬覦技術的人殺死，被需索無度的人們利用，又或者再次被其他貪婪的皇帝所征召。

我們無意討論故事進入現(xiàn)實主義后的展開。事實上，對于具備畫畫能力的人來說，“真正的畫筆”不僅是毫不重要的，更是不會存在的?？扑估囱ㄖ挟嬕芭５娜丝梢杂米约旱氖种缸鳟?，德加用的是色粉筆，顧愷之用同時是寫字工具的毛筆，布魯蓋爾用碳粉或別的工具，孩子們更是用石塊，樹枝，沙子……一切可以用來留下痕跡的東西來 “畫畫”。他們都不像故事中的馬良那么需要所謂“真正的畫筆”。

為此，我們不禁要問，這個故事究竟是從誰的視角講述的？它最終又是關于誰的呢？我們不難發(fā)現(xiàn)，故事的主角是神筆而不是馬良，是技術而不是人類，甚至連這個故事本身，也是神筆自己講給我們聽的。就像1956年的動畫片的片名里就根本沒有馬良這個人，而就叫《神筆》。

在故事中，技術先將自己變成了一個被欲望的對象，賦予自己真理性（相對于它，樹枝和煤塊怎么能算畫筆呢？），然后，它為自己安排了一個神圣的起源（白胡子老爺爺），最后，它占據(jù)了一種鮮明的道德和政治立場（用畫筆懲惡揚善，劫富濟貧），如此一來，馬良這個人類反倒成了被套上了轡頭的馬，再也無法擺脫它了。

20世紀以來，我們已然意識到，技術不僅積極構建我們的環(huán)境，還塑造我們的感知和存在方式，甚至構造話語，控制社會，形成與社會的共構。21世紀的AI，則毫無疑問在自動化技術的程度上走得更為激進和深遠。為此，我們嘗試采納媒介考古（Media Archaeology）的視角，尋找在圖像自動化生成這一領域的歷史幽靈，比較它們和今天的AI所處歷史條件的異同，然后我們才能嘗試著去認識，我們今天面對的AI圖像技術竟能何為？在這樣的條件下，我們又應該如何去警惕和反思，去理解和創(chuàng)造。

如果我們把圖像自動化技術想象成一個會畫畫的機器人，那它本就是一個古老的，文藝復興式的夢想，在啟蒙時代，它則代表了技術理性和模仿人類的機械的典范——就像馬丁·西科塞斯在《雨果》中所呈現(xiàn)的那樣，一個黃金般閃閃發(fā)亮的精巧偶像，由發(fā)條和齒輪構成，一個蒸汽時代的“自我行動之物”（ Automaton，a self-moving being），滿足人們對能夠模擬人類精細行為（繪畫，唱歌，跳舞，作詩）的機器的全部期待。

然而，對于《雨果》中的機器人，我們連問都不會問一句，能夠畫畫和它是否具有自我意識之間能有什么聯(lián)系？就算它能畫出最細致，準確的線條和最準確的炮彈打在月亮臉上的圖像，這僅僅也是因為它被雨果的父親內(nèi)置了程序。當小雨果和伊莎貝爾無意中激發(fā)了這個程序，它便自動開啟了作畫過程。

因此，問題的關鍵并不在于機器人是否能夠畫畫，或能否畫得和人類一樣好，甚至比人類更好。而在于機器作畫的過程始終是一個程序化，自動化的過程。從歷史上看，生成式圖像大規(guī)模出現(xiàn)的時代，也正是本雅明所說的那個“機械復制的時代”，那時，世界上出現(xiàn)了一種我們已經(jīng)非常熟悉的現(xiàn)代圖像生成技術：膠片攝影。

假如我們比較一下膠片攝影術和AI生圖的步驟和概念，就會驚訝地發(fā)現(xiàn)它們是何其相似。

比如，在傳統(tǒng)攝影中，一張空白的底片也被叫作潛影，一種等待被召喚出來的圖像形式，意味著不包含任何信息的“空”，反過來看，在擴散模型（stable diffusion，下稱SD）中，圖像的顯現(xiàn)則依賴于潛空間 (Latent space，壓縮圖像特征的向量空間) 的“滿”。所謂包含一切亦意味著一切都不顯現(xiàn)，這兩者在信息層面可以被看作是等價的。在化學過程中，我們通過控制進光量，在空白底片上加載信息得到圖像；而在SD中，潛空間則需要通過clip的指示，在充滿噪聲的潛空間內(nèi)“去噪”得到圖像。在化學攝影中，最終還要通過化學解碼的方式，將圖像在相紙上顯影出來；在SD中，也要通過VAE解碼器來再次將抽象的計算機語言向圖像文件還原。兩者都可以看作是從全然混亂的高熵走向穩(wěn)定的，高可讀性的，結構化的低熵圖像的過程。

在這里，“曝光”這一和真實世界關聯(lián)的概念對計算機沒有任何意義。我們完全可以把一張圖片的“去噪”算法過程，關聯(lián)為化學底片的“顯影”，假如你觀察過MidJourney（下稱MJ）或SD生圖時算法逐漸由模糊轉(zhuǎn)向清晰的過程，可能會對此更有感觸，連SD所創(chuàng)建的基礎工作流（workflow），都多少和傳統(tǒng)的暗房流程有不少相似之處。

然而，這絕不意味著，AI生圖是攝影技術迭代后的產(chǎn)物。之所以進行這樣的比較，是為了考察攝影術這一最早的自動化圖像技術出現(xiàn)時的歷史條件與當下時代的相似之處，以及它的歷史內(nèi)涵，及其造成的全部結果。

我們看到，最早作為畫家輔助工具而開啟的“暗箱”（camera obsura）已經(jīng)可以被看作是一部內(nèi)生的照相機，到了1839年8月19日，法國科學院和研究院正式公布達蓋爾銀版法照相技術（Daguerreotype），并將之稱為“來自法國的，贈予全人類的禮物”。伴隨著照相機誕生的，還有英法德的國家級鐵路網(wǎng)，以及鐵與玻璃的建筑技術，這些全面化的現(xiàn)代技術以光和電的形態(tài)，速度，以非常侵略性的姿態(tài)，極為迅速，毫不留情地終結了傳統(tǒng)的一切。正如攝影術終結了繪畫的歷程，剝奪了繪畫作為知識性存在的價值，迫使藝術史發(fā)生了最為深刻的現(xiàn)代化轉(zhuǎn)向，然而這一切所依靠的，正是程序化和自動化這兩樣東西。

或許不是計算機像相機，而是相機本身就是計算機。列夫·馬諾維奇在他那本《新媒體的語言》中，曾經(jīng)詳述過現(xiàn)代媒體和計算機的歷史是如何發(fā)端于同一歷史時期，最終又如何經(jīng)歷半個多世紀相遇融合。從此，計算機不僅僅是一臺“計算”機器，它還成為了一臺媒體機器。這就是新媒體的起源。

照相機其實就是一部讓“人人都可以繪畫”的計算機。傳統(tǒng)畫師經(jīng)年累月訓練的能力并沒有在一瞬間被攝影技術的偉力所摧毀，但已經(jīng)變得毫不重要。本雅明所說的“靈光”（aura）的消失，不正是從柯達公司的廣告詞開始的嗎？——“你所需要做的，就是按下快門”“You press the button, we do the rest.”。這句話給予普羅大眾一個美妙的承諾：人人都可以成為專業(yè)級別的圖像生產(chǎn)者。只不過，它的前提是不斷地封裝程序化人們“識做（savoir-faire）”的能力，并將其推入生產(chǎn)，流通在資本主義鏈條中，為欲望經(jīng)濟提供源源不斷的圖像動力。

且放下攝影是否是一門藝術的爭論，我們看到在21世紀，攝影會異化成為這樣的事件：在杭州曲院荷風的一處月亮橋，成千上萬的人，愿意在凌晨四五點，趕火車坐飛機地到這里來，為了在日出穿過橋洞的時候，拍到一張“金光穿洞”的風景照片。為了滿足“出片”的需要，快到那個最完美時刻的時候，就有人舉起喇叭，對著手持相機的人們發(fā)出統(tǒng)一的號令，光圈，ISO，快門的參數(shù)，三，二，一，一起按下快門。

咔嚓。人人都可以畫出最美麗的風景畫。而代價是什么呢？獨特性消失了，正如通過AI作圖，使用同樣的prompt, 給予同樣的參數(shù)設定（在MJ中被總結為幾個—refs 風格代碼），無論是誰，都能毫無困難地復原出和原圖一模一樣的作品。

我們變得不需要了解圖像具體的生產(chǎn)機制，也不需要獲取和任何媒材打交道的知識，僅僅通過預留的少量接口，就能輕易地跨過個人經(jīng)驗的護城河。在今天，代替相機的ISO, Shutter和IRIS的恰是Prompt框，畫幅比，和幾個少量的變量調(diào)節(jié)滑塊。

何況，AI和照相機有著更加根本性的不同， AI（大公司們）無一例外都具有更為強烈的驅(qū)力和侵入性。它所欲望的，是封裝打包人類所有的經(jīng)驗，知識和技能，是承諾將一切都標準化，程序化和自動化，并以一種前所未有的福特主義通過標準流程分發(fā)給所有人，將其表述為技術賦權。在今天，我們可以輕易地把“專業(yè)圖像生產(chǎn)者” 換成導演，攝影師，設計師，作曲家，詩人，小說家。代替傻瓜相機按鈕的，是今天“一鍵生成”所有。我們每多體會一次機械按鍵的快感，每多享受一次電子封裝帶來的便捷，我們就更加將自己托管給機器一些，就更加依賴這個中介化的環(huán)境。事實上，GPT-4o的omin一詞就毫不掩飾它自己這種全能的野心。假如這種全能技術的幻想最終成為現(xiàn)實，那我們所面臨的，恐怕就是完全喪失不使用它的權利，而只有必須使用它的義務了。

特別是，當我們下意識地使用“AI繪畫”來表述AI生圖，似乎已經(jīng)承認了AI是具有自生意識的創(chuàng)作者，就像在《底特律·變?nèi)恕分?，機器人馬庫斯的父親所犯的錯誤——這位笛卡爾式的人類老父，試圖通過指導他的機器人畫自畫像來獲得“成為人類”的啟蒙。然而，我們常常忘記，沒有靈魂的技術本身就是一種誘惑和召喚。與其說，是人們在拍照，不如說，是照相機需要人們在那里為它按下快門。與其說，是人們通過AI來創(chuàng)作，不如說，是AI需要人們?nèi)ジ嗟厥褂盟?/p>

所以，回到神筆馬良的故事里，在經(jīng)歷了漫長的現(xiàn)代技術的浸染之后，我們是否還要不假思索地相信這個關于“神筆”的技術神話？我們是否要相信，AI在我們今天的社會和生活里，就應該是不可或缺，人人渴望的對象？具有能夠作曲，寫詩，繪畫諸種神奇能力，和神話般的起源？我們是否還堅持，只要由正確的人用于正確的目的，AI就一定是能夠帶來福祉的，中性客觀的“好”技術？

對于AI最普遍的擔憂，往往會被引入到AI會造成大規(guī)模失業(yè)的討論上，這是科幻小說的題材，也是最容易滑入的討論陷阱。然而，“人能夠被替代”本身就是一種資本主義式的思考方式，我們需要小心這個討論預設的前提，不能夠不假思索地接受這樣的條件。

技術的向上進步，同時帶來的是不間斷的生命下墜，這也迫使我們不能夠再停留在舊有的框架內(nèi)，僅僅去注意AI和人類能力的替換問題。我們必須重新認識在科技神話掩飾下的資源掠奪，注意力剝削和主體性喪失等問題。在此前提下，我們需要重新為自己工作，在一個被過度中介化的世界里，在一個大力鼓吹全能技術的地方，開拓出新的知識，新的方法，以個人技術為出發(fā)點，尋找新的與技術相關的共存之道。

責任編輯：龔思量

圖片編輯：張穎

校對：張艷

澎湃新聞報料：021-962866

澎湃新聞，未經(jīng)授權不得轉(zhuǎn)載

我要舉報

#神筆馬良 #技術 #AI圖像生成