- +1
AI之用②|從全能神筆到“一鍵生成”下丟失的人
我們小時候可能聽過這樣一個故事:
從前有個窮孩子。他非常喜歡畫畫,可是家里太窮,連一支筆都買不起。白天他幫人放牛,晚上就用樹枝在地上畫畫,用煤炭在墻上畫畫。他的畫非常像真的,但他一直沒法擁有一支真正的畫筆。
有一天夜里,他夢見一位白胡子老人送給他一支神奇的毛筆。醒來后,他發(fā)現(xiàn)那支筆真的在自己的床邊。從此,他畫什么,什么就會變成真的。他畫鳥,鳥就飛走;畫魚,魚就游走。他開始用這支神筆幫助村里窮苦的人們畫吃的、用的、農(nóng)具、耕牛。他從不為富人作畫。
消息傳到了一個貪婪的皇帝耳中。皇帝命人來抓他,逼他用神筆為自己畫金山銀山。窮孩子假意答應,卻用神筆畫了一座海島,把金山銀山畫在遠遠的島上?;实圩洗Z寶,他卻畫起了狂風巨浪,巨浪把皇帝卷走了。
從此,他自由地四處流浪,用神筆幫助更多需要幫助的人。
神筆馬良創(chuàng)作于上個世紀50年代,它原本是一個帶有階級批判色彩的兒童故事,今天我們引用它,卻是為了談談這個故事中技術和人的關系。
馬良是一個像達·芬奇一樣的畫家,因為“他畫什么都像真的”,這是他與生俱來的本事,不因為“樹枝”,或者“煤炭”等技術工具不同而發(fā)生改變。他具有斯蒂格勒所說的識做(“savoir - faire”,知道怎樣做事的知識),類似于種地,打獵,制作桌椅,這是一種通過實踐或勞動而獲得的身體知識。馬良所擁有的是一種經(jīng)驗的知識,而不是形而上的、抽象的,關于知識的知識。此外,盡管畫鳥畫魚沒有什么實際用途,但我們依然可以想象,畫畫給馬良帶來了很大的快樂,否則,他就不會寢食俱廢地“白天放牛,晚上畫畫”。
而在馬良獲得了先進的技術工具之后,神筆加持了他原本的能力,帶來令人炫目的結果。然而,使用超級技術的代價,是讓他原本無目的的精神活動,變得必須要服務于“吃的,用的,農(nóng)具和耕?!钡葘嶋H生活目標。這些未必都是馬良喜歡的,然而,當技術成為主導時,馬良的主觀好惡,以及繪畫的精神性需要就變得毫不重要。就這樣,他從一個純粹的業(yè)余愛好者(amateur)變成了功利化的職業(yè)人士(professional)。此時,他的新身份,新自我,已經(jīng)不由他說了算,而是由技術工具來定義和指導。對于馬良而言,似乎“是媒介技術決定了我們能說什么,能思考什么”。
同時,技術在奪取了人的一部分主體性之后,要回過頭來修改歷史。最初,馬良只是想要一支普通畫筆,但他得到的卻是“在夢中由一位白胡子老人授予”的神筆,因為“神授”的起源和神話般的開始,讓人更加無法質(zhì)疑這項技術的正當性和合理性了。
再接下來,馬良使用神筆懲罰了貪婪的皇帝,技術不僅是強大的,還是善良的,是反抗暴政和階級壓迫的象征。這樣一來,技術不再是中性的,而是染上了道德和政治的色彩,是一種必須由正確的人掌握的“好”技術。
最后,馬良攜帶著這項“好”的技術繼續(xù)在大地上自由地流浪,幫助他想幫助的人。不過,我們盡可以想象,擁有這種超級技術的馬良,是不可能,也沒有辦法再次“自由地四處流浪”的。他可能會被覬覦技術的人殺死,被需索無度的人們利用,又或者再次被其他貪婪的皇帝所征召。
我們無意討論故事進入現(xiàn)實主義后的展開。事實上,對于具備畫畫能力的人來說,“真正的畫筆”不僅是毫不重要的,更是不會存在的??扑估囱ㄖ挟嬕芭5娜丝梢杂米约旱氖种缸鳟?,德加用的是色粉筆,顧愷之用同時是寫字工具的毛筆,布魯蓋爾用碳粉或別的工具,孩子們更是用石塊,樹枝,沙子……一切可以用來留下痕跡的東西來 “畫畫”。他們都不像故事中的馬良那么需要所謂“真正的畫筆”。
為此,我們不禁要問,這個故事究竟是從誰的視角講述的?它最終又是關于誰的呢?我們不難發(fā)現(xiàn),故事的主角是神筆而不是馬良,是技術而不是人類,甚至連這個故事本身,也是神筆自己講給我們聽的。就像1956年的動畫片的片名里就根本沒有馬良這個人,而就叫《神筆》。


在故事中,技術先將自己變成了一個被欲望的對象,賦予自己真理性(相對于它,樹枝和煤塊怎么能算畫筆呢?),然后,它為自己安排了一個神圣的起源(白胡子老爺爺),最后,它占據(jù)了一種鮮明的道德和政治立場(用畫筆懲惡揚善,劫富濟貧),如此一來,馬良這個人類反倒成了被套上了轡頭的馬,再也無法擺脫它了。

20世紀以來,我們已然意識到,技術不僅積極構建我們的環(huán)境,還塑造我們的感知和存在方式,甚至構造話語,控制社會,形成與社會的共構。21世紀的AI,則毫無疑問在自動化技術的程度上走得更為激進和深遠。為此,我們嘗試采納媒介考古(Media Archaeology)的視角,尋找在圖像自動化生成這一領域的歷史幽靈,比較它們和今天的AI所處歷史條件的異同,然后我們才能嘗試著去認識,我們今天面對的AI圖像技術竟能何為?在這樣的條件下,我們又應該如何去警惕和反思,去理解和創(chuàng)造。
如果我們把圖像自動化技術想象成一個會畫畫的機器人,那它本就是一個古老的,文藝復興式的夢想,在啟蒙時代,它則代表了技術理性和模仿人類的機械的典范——就像馬丁·西科塞斯在《雨果》中所呈現(xiàn)的那樣,一個黃金般閃閃發(fā)亮的精巧偶像,由發(fā)條和齒輪構成,一個蒸汽時代的“自我行動之物”( Automaton,a self-moving being),滿足人們對能夠模擬人類精細行為(繪畫,唱歌,跳舞,作詩)的機器的全部期待。
然而,對于《雨果》中的機器人,我們連問都不會問一句,能夠畫畫和它是否具有自我意識之間能有什么聯(lián)系?就算它能畫出最細致,準確的線條和最準確的炮彈打在月亮臉上的圖像,這僅僅也是因為它被雨果的父親內(nèi)置了程序。當小雨果和伊莎貝爾無意中激發(fā)了這個程序,它便自動開啟了作畫過程。

因此,問題的關鍵并不在于機器人是否能夠畫畫,或能否畫得和人類一樣好,甚至比人類更好。而在于機器作畫的過程始終是一個程序化,自動化的過程。從歷史上看,生成式圖像大規(guī)模出現(xiàn)的時代,也正是本雅明所說的那個“機械復制的時代”,那時,世界上出現(xiàn)了一種我們已經(jīng)非常熟悉的現(xiàn)代圖像生成技術:膠片攝影。
假如我們比較一下膠片攝影術和AI生圖的步驟和概念,就會驚訝地發(fā)現(xiàn)它們是何其相似。
比如,在傳統(tǒng)攝影中,一張空白的底片也被叫作潛影,一種等待被召喚出來的圖像形式,意味著不包含任何信息的“空”,反過來看,在擴散模型(stable diffusion,下稱SD)中,圖像的顯現(xiàn)則依賴于潛空間 (Latent space,壓縮圖像特征的向量空間) 的“滿”。 所謂包含一切亦意味著一切都不顯現(xiàn),這兩者在信息層面可以被看作是等價的。在化學過程中,我們通過控制進光量,在空白底片上加載信息得到圖像;而在SD中,潛空間則需要通過clip的指示,在充滿噪聲的潛空間內(nèi)“去噪”得到圖像。在化學攝影中,最終還要通過化學解碼的方式,將圖像在相紙上顯影出來;在SD中,也要通過VAE解碼器來再次將抽象的計算機語言向圖像文件還原。兩者都可以看作是從全然混亂的高熵走向穩(wěn)定的,高可讀性的,結構化的低熵圖像的過程。

在這里,“曝光”這一和真實世界關聯(lián)的概念對計算機沒有任何意義。我們完全可以把一張圖片的“去噪”算法過程,關聯(lián)為化學底片的“顯影”,假如你觀察過MidJourney(下稱MJ)或SD生圖時算法逐漸由模糊轉(zhuǎn)向清晰的過程,可能會對此更有感觸,連SD所創(chuàng)建的基礎工作流(workflow),都多少和傳統(tǒng)的暗房流程有不少相似之處。
然而,這絕不意味著,AI生圖是攝影技術迭代后的產(chǎn)物。之所以進行這樣的比較,是為了考察攝影術這一最早的自動化圖像技術出現(xiàn)時的歷史條件與當下時代的相似之處,以及它的歷史內(nèi)涵,及其造成的全部結果。
我們看到,最早作為畫家輔助工具而開啟的“暗箱”(camera obsura)已經(jīng)可以被看作是一部內(nèi)生的照相機,到了1839年8月19日,法國科學院和研究院正式公布達蓋爾銀版法照相技術(Daguerreotype),并將之稱為“來自法國的,贈予全人類的禮物”。伴隨著照相機誕生的,還有英法德的國家級鐵路網(wǎng),以及鐵與玻璃的建筑技術,這些全面化的現(xiàn)代技術以光和電的形態(tài),速度,以非常侵略性的姿態(tài),極為迅速,毫不留情地終結了傳統(tǒng)的一切。正如攝影術終結了繪畫的歷程,剝奪了繪畫作為知識性存在的價值,迫使藝術史發(fā)生了最為深刻的現(xiàn)代化轉(zhuǎn)向,然而這一切所依靠的,正是程序化和自動化這兩樣東西。
或許不是計算機像相機,而是相機本身就是計算機。列夫·馬諾維奇在他那本《新媒體的語言》中,曾經(jīng)詳述過現(xiàn)代媒體和計算機的歷史是如何發(fā)端于同一歷史時期,最終又如何經(jīng)歷半個多世紀相遇融合。從此,計算機不僅僅是一臺“計算”機器,它還成為了一臺媒體機器。這就是新媒體的起源。
照相機其實就是一部讓“人人都可以繪畫”的計算機。傳統(tǒng)畫師經(jīng)年累月訓練的能力并沒有在一瞬間被攝影技術的偉力所摧毀,但已經(jīng)變得毫不重要。本雅明所說的“靈光”(aura)的消失,不正是從柯達公司的廣告詞開始的嗎?——“你所需要做的,就是按下快門”“You press the button, we do the rest.”。這句話給予普羅大眾一個美妙的承諾:人人都可以成為專業(yè)級別的圖像生產(chǎn)者。只不過,它的前提是不斷地封裝程序化人們“識做 (savoir-faire)”的能力,并將其推入生產(chǎn),流通在資本主義鏈條中,為欲望經(jīng)濟提供源源不斷的圖像動力。
且放下攝影是否是一門藝術的爭論,我們看到在21世紀,攝影會異化成為這樣的事件:在杭州曲院荷風的一處月亮橋,成千上萬的人,愿意在凌晨四五點,趕火車坐飛機地到這里來,為了在日出穿過橋洞的時候,拍到一張“金光穿洞”的風景照片。為了滿足“出片”的需要,快到那個最完美時刻的時候,就有人舉起喇叭,對著手持相機的人們發(fā)出統(tǒng)一的號令,光圈,ISO,快門的參數(shù),三,二,一,一起按下快門。

咔嚓。人人都可以畫出最美麗的風景畫。而代價是什么呢?獨特性消失了,正如通過AI作圖,使用同樣的prompt, 給予同樣的參數(shù)設定(在MJ中被總結為幾個—refs 風格代碼),無論是誰,都能毫無困難地復原出和原圖一模一樣的作品。
我們變得不需要了解圖像具體的生產(chǎn)機制,也不需要獲取和任何媒材打交道的知識,僅僅通過預留的少量接口,就能輕易地跨過個人經(jīng)驗的護城河。在今天,代替相機的ISO, Shutter和IRIS的恰是Prompt框,畫幅比,和幾個少量的變量調(diào)節(jié)滑塊。
何況,AI和照相機有著更加根本性的不同, AI(大公司們)無一例外都具有更為強烈的驅(qū)力和侵入性。它所欲望的,是封裝打包人類所有的經(jīng)驗,知識和技能,是承諾將一切都標準化,程序化和自動化,并以一種前所未有的福特主義通過標準流程分發(fā)給所有人,將其表述為技術賦權。在今天,我們可以輕易地把“專業(yè)圖像生產(chǎn)者” 換成導演,攝影師,設計師,作曲家,詩人,小說家。代替傻瓜相機按鈕的,是今天“一鍵生成”所有。我們每多體會一次機械按鍵的快感,每多享受一次電子封裝帶來的便捷,我們就更加將自己托管給機器一些,就更加依賴這個中介化的環(huán)境。事實上,GPT-4o的omin一詞就毫不掩飾它自己這種全能的野心。假如這種全能技術的幻想最終成為現(xiàn)實,那我們所面臨的,恐怕就是完全喪失不使用它的權利,而只有必須使用它的義務了。
特別是,當我們下意識地使用“AI繪畫”來表述AI生圖,似乎已經(jīng)承認了AI是具有自生意識的創(chuàng)作者, 就像在《底特律·變?nèi)恕分?,機器人馬庫斯的父親所犯的錯誤——這位笛卡爾式的人類老父,試圖通過指導他的機器人畫自畫像來獲得“成為人類”的啟蒙。然而,我們常常忘記,沒有靈魂的技術本身就是一種誘惑和召喚。與其說,是人們在拍照,不如說,是照相機需要人們在那里為它按下快門。與其說,是人們通過AI來創(chuàng)作,不如說,是AI需要人們?nèi)ジ嗟厥褂盟?/p>
所以,回到神筆馬良的故事里,在經(jīng)歷了漫長的現(xiàn)代技術的浸染之后,我們是否還要不假思索地相信這個關于“神筆”的技術神話?我們是否要相信,AI在我們今天的社會和生活里,就應該是不可或缺,人人渴望的對象?具有能夠作曲,寫詩,繪畫諸種神奇能力,和神話般的起源?我們是否還堅持,只要由正確的人用于正確的目的,AI就一定是能夠帶來福祉的,中性客觀的“好”技術?
對于AI最普遍的擔憂,往往會被引入到AI會造成大規(guī)模失業(yè)的討論上,這是科幻小說的題材,也是最容易滑入的討論陷阱。然而,“人能夠被替代”本身就是一種資本主義式的思考方式,我們需要小心這個討論預設的前提,不能夠不假思索地接受這樣的條件。
技術的向上進步,同時帶來的是不間斷的生命下墜,這也迫使我們不能夠再停留在舊有的框架內(nèi),僅僅去注意AI和人類能力的替換問題。我們必須重新認識在科技神話掩飾下的資源掠奪,注意力剝削和主體性喪失等問題。在此前提下,我們需要重新為自己工作,在一個被過度中介化的世界里,在一個大力鼓吹全能技術的地方,開拓出新的知識,新的方法,以個人技術為出發(fā)點,尋找新的與技術相關的共存之道。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務許可證:31120170006
增值電信業(yè)務經(jīng)營許可證:滬B2-2017116
? 2014-2026 上海東方報業(yè)有限公司




