中文字幕国产91无码|AV成人手机在线|av成人先锋在线|911无码在线国产人人操|91蜜桃视频精品免费在线|极品美女A∨片在线看|日韩在线成人视频日韩|电影三级成人黄免费影片|超碰97国产在线|国产成人精品色情免费视频

  • +1

歷史與AI的距離|當(dāng)AI“讀懂”我的西夏文研究

張光偉
2025-06-10 08:06
來源:澎湃新聞
? 私家歷史 >
聽全文
字號

人工智能的浪潮正以前所未有的速度和深度影響著我們生活的方方面面,從日常的聊天助手到復(fù)雜的科學(xué)計算,它的身影無處不在。當(dāng)人工智能(AI)不僅能寫詩作畫、譜曲編程,甚至開始涉足解讀艱深晦澀的史學(xué)文獻(xiàn)時,一個饒有趣味的問題也隨之浮現(xiàn):歷史學(xué)與AI的關(guān)系究竟將走向何方?僅僅是高效的工具,還是可能成為激發(fā)深度思考的伙伴?歷史學(xué)這門古老而智慧的學(xué)科,又將迎來怎樣的挑戰(zhàn)與機遇?這便是本文想要與讀者共同探討的故事。它可能不僅是一段個人經(jīng)歷的分享,更是對一個正在到來的智能時代中,我們?nèi)绾闻cAI共舞、重塑知識生產(chǎn)方式的思考。

一、 AI撮合的一場意外重逢

近日,一段由AI生成的對談音頻,讓我這個一直在計算機科學(xué)的理性與歷史人文的感性之間穿梭的數(shù)字人文從業(yè)者,體驗到了一種前所未有的“共振”。故事的開端頗為偶然:一位友人嘗試將我數(shù)年前發(fā)表的一篇關(guān)于西夏文字典《文?!肪W(wǎng)絡(luò)分析的論文,“喂給”了谷歌的AI工具NotebookLM。當(dāng)友人將AI生成的英文對談音頻轉(zhuǎn)給我時,我最初的期待或許僅僅是AI能對論文進(jìn)行一次常規(guī)的摘要或信息提取。然而,結(jié)果卻遠(yuǎn)超預(yù)期:兩個“虛擬人”的對話,其興奮的語氣極富感染力,他們不但精準(zhǔn)地解讀了我研究的核心,而且闡釋流暢自然、視角獨到,甚至有些思路讓我感到它似乎比我考慮的還要深遠(yuǎn)。那一刻,我感覺AI不再僅僅是一個冰冷、執(zhí)行指令的工具,它仿佛擁有了某種“理解力”,成為了一個能夠跨越語言障礙、與我進(jìn)行深度學(xué)術(shù)對話的“思考伙伴”。

(英文版)NotebookLM解讀西夏文字典《文?!返木W(wǎng)絡(luò)分析
(中文版)NotebookLM解讀西夏文字典《文?!返木W(wǎng)絡(luò)分析(兩個音頻各自獨立生成,中文版并非英文版的翻譯)

這場由AI“撮合”的、與自己舊作在新視角下的“意外重逢”,不僅帶來了驚喜,更引發(fā)了我對AI在歷史研究中潛能的深層思考:AI究竟在以何種方式介入歷史研究?它又將如何重塑我們與歷史的“距離”,乃至歷史學(xué)者自身?這不僅僅關(guān)乎技術(shù)的進(jìn)步,更關(guān)乎我們?nèi)绾握J(rèn)知過去、理解現(xiàn)在、并塑造未來。

二、從抽象數(shù)據(jù)到歷史敘事

我的專業(yè)是計算機科學(xué)與技術(shù),但一直在陜西師范大學(xué)歷史文化學(xué)院工作,這樣的交叉背景讓我自然而然地將技術(shù)融入歷史專業(yè)研究中,近年更專注于數(shù)字人文,特別是智能技術(shù)在歷史研究中的深度應(yīng)用。2022年發(fā)表于《數(shù)字人文》期刊的《西夏文字典〈文海〉的網(wǎng)絡(luò)分析》一文,便是我在這方面的一次嘗試。

西夏文,這個由黨項人在近千年前創(chuàng)立的獨特文字,如同歷史長河中一顆顆沉寂的星辰,記錄著一個王朝的興衰與文明的印記。而《文?!肥俏飨娜俗约壕幾氲摹敖庾謺?,一定蘊含著深度解讀西夏文明的鑰匙。然而,西夏文早已成為一種“死文字”,其字形構(gòu)造之復(fù)雜、文獻(xiàn)數(shù)量之龐大、字間解釋關(guān)系之繁復(fù),使得現(xiàn)代學(xué)者的西夏文學(xué)習(xí)與研究之路充滿挑戰(zhàn)。

目前AI技術(shù)對西夏文的自動識別率已經(jīng)很高,在不考慮語境的情況下將單個西夏文字轉(zhuǎn)成對應(yīng)漢字的問題也不大,但是要直接將西夏文文本準(zhǔn)確地翻譯為中文,或是釋讀西夏文草書,又或者是大規(guī)模地分析西夏文資料庫,仍然存在困難。

西夏文OCR系統(tǒng):將西夏文獻(xiàn)圖片轉(zhuǎn)錄為可檢索文本。

我運用網(wǎng)絡(luò)分析方法,將《文?!分忻恳粋€西夏字視為一個節(jié)點,字與字之間的解釋關(guān)系視為連接節(jié)點的邊,從而將整部字典轉(zhuǎn)化為一個龐大而復(fù)雜的“西夏字解釋關(guān)系網(wǎng)絡(luò)”。這樣做的目的是希望通過結(jié)構(gòu)化的數(shù)據(jù)分析,在揭示《文?!穬?nèi)部潛藏的西夏字的組織規(guī)律和西夏人的某些核心觀念與認(rèn)知結(jié)構(gòu)方面進(jìn)行一些探索。

西夏文字典《文海》以及構(gòu)建字典網(wǎng)絡(luò)的說明。圖片出自《西夏文字典〈文?!档木W(wǎng)絡(luò)分析》一文。

《文海》字型解釋舉例

這項研究的一個核心貢獻(xiàn),是提出了一種識別《文?!分小盎咀旨钡姆椒?。在AI生成的中文版對談節(jié)目中,這個過程被生動地比喻為“洗面筋”。說來有趣,這個比喻與我之前在課堂上向?qū)W生解釋類似概念時所用的表述不謀而合,這或許與友人最初與AI互動時,在Prompt中巧妙地融入了相關(guān)引導(dǎo)有關(guān)。這恰恰是我第一次聽到AI用此比喻時感到尤為震撼的原因——它像是一次回響,一次人類思考與AI能力在特定引導(dǎo)下的精妙共振。想象一下,整部《文?!分械淖指鶕?jù)解釋互相關(guān)聯(lián)、交織,形成一個像面團(tuán)一樣的網(wǎng)絡(luò),而我們的算法,就像一雙不知疲倦的手,將“面團(tuán)”在水中反復(fù)搓洗:那些僅僅被其他字解釋,而自身不去解釋任何其他字(或者說,在解釋網(wǎng)絡(luò)中只有入度、沒有出度)的“末端”字,被一層層“洗”去。經(jīng)過多輪迭代,最終沉淀下來的,便是那些最精華、最基礎(chǔ)、無法再被簡化、構(gòu)成整個字典語義基石的核心部分即基本字集——如同黏性十足的“面筋”,是該語言的“基本構(gòu)件”。

找到了“面筋”,下一步便是理解其他字是如何圍繞這個核心構(gòu)建起來的。研究通過計算每個非核心字到達(dá)基本字集的“定義距離”,揭示了《文海》內(nèi)部西夏字之間解釋關(guān)系清晰的層級結(jié)構(gòu)。中文對談中將這個過程被比作“剝洋蔥”:最核心的基本字集如同“洋蔥心”(第0層),僅由該層直接解釋的字構(gòu)成“洋蔥”的第一層,只依賴前兩層解釋的字構(gòu)成第二層……如此層層向外擴展。英文對談則給出了另一種比喻——“樹”:核心字集是“樹干”,其他字則是從樹干上生發(fā)出的“分枝”,越往外延伸,字的意義可能越復(fù)雜,其構(gòu)成也依賴于更靠近樹干的字詞。

《文?!纷值渚W(wǎng)絡(luò)層次結(jié)構(gòu)可視化

AI解讀還提出了“復(fù)原洋蔥”的視角(或順著“樹”的脈絡(luò)向上追溯):這種從內(nèi)向外的層級結(jié)構(gòu),是否暗示了一條潛在的、高效學(xué)習(xí)西夏字的路徑?即“從核心往外學(xué)”,先掌握最基礎(chǔ)的核心字,再逐步理解其衍生字詞。這或許能讓學(xué)習(xí)這門古老文字的過程,不再那么“遙不可及”,如同進(jìn)行一場有趣的“語言尋寶游戲”。這些由AI生成的比喻和引申,即使部分可能源于巧妙的提示,其最終呈現(xiàn)的精準(zhǔn)和形象,著實令人感到驚艷,也讓我意識到,即使是對自己的研究,AI也能提供富有啟發(fā)性的“再解讀”。這種‘再解讀’的力量,不僅僅在于其修辭的巧妙(如英文對談中將《文?!匪淖轴屃x模式通過“靴”字的例子比作“視覺拼圖”),更在于它有時能像一面不帶偏見的鏡子,映照出我們習(xí)以為常的研究路徑中可能存在的盲點,提示我們從全新的角度審視習(xí)以為常的結(jié)論。

這種將抽象數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)化為可理解的知識模型的方法,其潛力遠(yuǎn)不止于《文海》這一孤例。在另一個對OPTED(Oxford Plain Text English Dictionary)進(jìn)行的網(wǎng)絡(luò)分析實驗中,我們進(jìn)一步見證了AI在連接抽象數(shù)據(jù)與具體意義方面的卓越能力。

與《文海》研究類似,我們通過詞與詞之間的相互訓(xùn)釋關(guān)系構(gòu)建網(wǎng)絡(luò),同樣也發(fā)現(xiàn)了一些由詞語構(gòu)成的“強連接部件”(Strongly Connected Components,英文對談中將其形象地解釋為“網(wǎng)絡(luò)中的圈子”,并以“男子與小孩”相關(guān)的字群為例,強調(diào)其揭示了“更深層次的概念聯(lián)系”)。例如,實驗中找到了一個包含“popovtsy, dukhobors, dukhobortsy, judaizers, bezpopovtsy, molokane, skoptsy, raskolnik, molokany, raskolniki”等一系列與俄羅斯東正教不同教派相關(guān)的生僻詞匯的部件。這些詞匯在詞典的網(wǎng)絡(luò)結(jié)構(gòu)中緊密相連,這本身就暗示了它們之間存在某種超越簡單詞義的深層結(jié)構(gòu)性關(guān)聯(lián),很可能反映了現(xiàn)實世界中特定文化領(lǐng)域的知識圖譜或概念簇。然而,這對不具備相關(guān)宗教史背景的人來說,這些孤立的詞匯簇如同一串密碼,其背后的歷史文化意涵難以破譯。

此時,歷史學(xué)者的專業(yè)洞察與AI的敘事能力再次展現(xiàn)了“共生”的魅力。我們引導(dǎo)AI,以這些“密碼詞”為核心,講述一個故事。令人驚喜的是,AI不僅成功編織了一個連貫的敘事,更重要的是,它為這些通過技術(shù)方法提取出的抽象關(guān)聯(lián),賦予了生動的歷史學(xué)解釋,清晰地勾勒出17世紀(jì)以來俄羅斯官方東正教與各類異見教派復(fù)雜互動的圖景。這個過程,與其說是簡單的語言學(xué)習(xí)輔助,不如說是一次由歷史學(xué)者主導(dǎo)(提出問題、提供材料、判斷方向)、AI賦能(快速整合信息、生成文本)的小型“歷史知識重構(gòu)”。AI在這里扮演了一個關(guān)鍵的橋梁角色,它將冰冷的、結(jié)構(gòu)化的數(shù)據(jù)(詞匯網(wǎng)絡(luò)),有效地轉(zhuǎn)化為了有溫度、有邏輯的歷史敘事。這種“點石成金”的應(yīng)用很好地體現(xiàn)了AI在輔助人文研究者從數(shù)據(jù)中挖掘意義、構(gòu)建解釋方面的巨大潛力。更深一層看,這個案例也揭示了網(wǎng)絡(luò)分析方法本身可以成為歷史研究的有力工具,其分析結(jié)果(如強連接部件)能夠反映特定歷史時期的文化、宗教、社會等方面的特征,而AI的介入則極大地加速和深化了對這些技術(shù)發(fā)現(xiàn)的歷史學(xué)解讀。

三、AI“對談”何以催化深度思考

目前,用大模型做學(xué)術(shù)總結(jié)、文獻(xiàn)綜述已不鮮見,但多是分析他人的研究。這次,經(jīng)由友人的嘗試,讓AI來解讀和“反芻”我自己的研究工作,體驗卻格外不同。這種由AI驅(qū)動的、對自己研究的再審視,有時確實能帶來“驚艷”的發(fā)現(xiàn),讓人感覺AI不再僅僅是一個工具,更像一個能提供新視角的“思考伙伴”。

這種將長篇語料(如一篇完整的學(xué)術(shù)論文)交由大模型生成具有一定深度的“對談形式”的內(nèi)容,比常見的人與AI直接進(jìn)行即時問答的方式,似乎更富有思辨的特點。我初步思考,可能有以下幾個方面的原因:首先是結(jié)構(gòu)化的深度加工。當(dāng)AI面對的是一篇完整的、邏輯嚴(yán)謹(jǐn)?shù)膶W(xué)術(shù)論文時,它可以進(jìn)行更為系統(tǒng)和深度的信息處理。為了生成一場有意義的“對談”,AI不僅要理解論文的核心觀點、論證過程,還要模擬不同對話者的角色、語氣,甚至設(shè)計提問與回答的邏輯流程。這個過程,遠(yuǎn)比處理碎片化的即時提問要復(fù)雜,也更能驅(qū)動AI調(diào)用其深層次的文本理解和知識重構(gòu)能力。其次是多視角的思辨模擬。對談形式天然地蘊含了不同視角的碰撞。即使這些“對話者”是虛擬的,AI在設(shè)計其發(fā)言時,也需要考慮到觀點的多樣性和論證的層次性。這使得最終生成的對談內(nèi)容,更容易呈現(xiàn)出一種思辨的色彩,能夠從不同側(cè)面揭示研究的價值與局限,而非僅僅單向的信息輸出。再者是知識的“反芻”與“再創(chuàng)造”。AI在準(zhǔn)備對談內(nèi)容時,實際上是在對原始研究進(jìn)行一次深度的“反芻”。它需要消化、吸收、理解,然后用一種新的形式(對話)來重新組織和表達(dá)。這個過程本身,就是一種知識的再加工乃至“再創(chuàng)造”。正如友人轉(zhuǎn)給我的那份英文對談,其流暢的邏輯和精準(zhǔn)的用詞,表明AI在“理解”我的論文后,已經(jīng)能夠用另一種語言體系進(jìn)行高質(zhì)量的知識遷移和表達(dá)。

因此,論文作者將自己的研究成果交給AI進(jìn)行解讀和“對話”,將來或許會成為一種極有意義的學(xué)術(shù)反思途徑。因為作者本人最了解自己研究的初衷、過程與細(xì)節(jié),而一個強大的AI大模型,則像一個知識淵博、邏輯嚴(yán)密、不知疲倦的“賢者”或“內(nèi)心鏡像”,作者與它就自己的研究展開“對話”,既能隨時隨地進(jìn)行,又能保證討論的深度和專注度。在這個過程中,幾乎沒有因交流對象知識背景不同而產(chǎn)生的信息損耗或理解偏差,或更容易激發(fā)作者本人對研究的深層審視和新的靈感火花。

四、AI“思考伙伴”與歷史學(xué)者的時代新坐標(biāo)

回顧我與AI圍繞《文?!氛撐牡哪谴巍捌嬗觥?,最令我觸動的,并非AI的“博學(xué)”或“高效”,而是它所展現(xiàn)出的成為一個“思考伙伴”的潛力?!八伎蓟锇椤?,意味著AI不再僅僅是一個被動接收指令、輸出結(jié)果的工具,而是能夠在與人類智慧的有效互動中,以某種方式參與到我們的思考過程中,提供啟發(fā)、反饋,甚至以其獨特的“視角”挑戰(zhàn)我們的既有認(rèn)知。在解讀《文?!肪W(wǎng)絡(luò)分析的研究時,AI所用的“洗面筋”、“剝洋蔥”的比喻,以及“復(fù)原洋蔥”的學(xué)習(xí)路徑猜想,便是有力的例證。正如前文提及,“洗面筋”這一精妙比喻的出現(xiàn),很可能與友人最初在Prompt中融入了相關(guān)的引導(dǎo)性表述有關(guān),這本身就生動地詮釋了AI的洞察力并非憑空而來,而是人類智慧與AI能力在特定引導(dǎo)下共同催生的結(jié)果。更令人興奮的是英文對談中提及的薩丕爾-沃爾夫假說,一種語言的結(jié)構(gòu)(例如《文?!匪宫F(xiàn)的獨特的層級結(jié)構(gòu)和核心概念組織方式)是否會反過來塑造使用該語言群體的思維模式和世界感知方式?對《文?!愤@類獨特語言系統(tǒng)的深入分析,或許能為這一經(jīng)典命題提供新的實證材料。而理解人類組織語言的復(fù)雜方式,無疑也能為開發(fā)更智能、更具理解力的人工智能系統(tǒng)提供寶貴的啟示,甚至引發(fā)我們對知識本質(zhì)及其相互關(guān)聯(lián)方式的深刻追問,這些都遠(yuǎn)遠(yuǎn)超越了語言學(xué)或歷史學(xué)本身的范疇,當(dāng)然肯定也超出了我的論文討論的范圍。

這種“雙向互動”的模式,可能會對未來的歷史研究帶來諸多深刻的變革。它可以加速知識發(fā)現(xiàn)與整合,幫助研究者在浩如煙海的文獻(xiàn)資料中快速定位信息、識別模式、建立關(guān)聯(lián)。它能夠幫助學(xué)者跳出思維定勢,AI基于大規(guī)模數(shù)據(jù)訓(xùn)練形成的“視角”,有時能幫助我們發(fā)現(xiàn)那些被忽略的聯(lián)系或提出意想不到的問題。它還能促進(jìn)跨學(xué)科對話與融合,AI可以作為不同學(xué)科知識之間的“橋梁”,幫助歷史學(xué)者理解和運用其他學(xué)科的理論與方法,而這座橋梁的搭建方向、承載內(nèi)容的選擇以及最終意義的賦予,始終掌握在歷史學(xué)者的手中。

AI真正成為“思考伙伴”,絕對無法一蹴而就,而是一個歷史學(xué)者與AI技術(shù)共同進(jìn)化、“互相導(dǎo)航”的過程。學(xué)者自身深厚的專業(yè)素養(yǎng)、清晰的問題意識和開放的探索心態(tài)是驅(qū)動這一過程的引擎。我們學(xué)會如何與AI“對話”,如何設(shè)計出能夠激發(fā)AI深度潛能的Prompt,如何提出直擊本質(zhì)的問題,如何辯證地理解AI的“思考方式”,以及如何將AI的洞察與人類的智慧有機結(jié)合——這些探索本身,就在不斷地為AI的能力邊界和應(yīng)用場景“校準(zhǔn)”方向。反過來,AI的每一次能力躍升,也都在為歷史學(xué)者開辟新的研究疆域,促使其不斷調(diào)整和確立自身的“時代新坐標(biāo)”。這種動態(tài)的“共生坐標(biāo)”的確立,可能正是AI時代學(xué)術(shù)研究最富魅力和最具潛力的圖景。

五、“歷史與AI的距離”正在改變

從《文?!返木W(wǎng)絡(luò)分析,到AI對這項分析的跨語言解讀與“反芻”,再到OPTED詞典中AI的敘事能力,我們看到了一條清晰的軌跡:數(shù)字技術(shù)與人文研究的融合,正在從最初的數(shù)據(jù)化、可視化,走向更深層次的智能化、交互化。

AI的介入,無疑正在改變“歷史與AI的距離”。它們之間的路徑不再是單向的、靜態(tài)的,而是充滿了動態(tài)的交互與無限的可能性。AI既帶來了如何確保研究嚴(yán)謹(jǐn)性、避免技術(shù)濫用等挑戰(zhàn),更帶來了前所未有的機遇,讓我們能以一種全新的方式去親近歷史、理解過去、并從中汲取面向未來的智慧。這不僅僅是關(guān)于一個古老字典或一種死文字的研究,它更關(guān)乎人類的好奇心、理解過去的渴望,以及這些探索如何與我們當(dāng)下的語言學(xué)習(xí)、教育革新乃至技術(shù)發(fā)展產(chǎn)生驚人的關(guān)聯(lián)。

正如我在復(fù)旦大學(xué)的報告《AI賦能史學(xué)研究新視野—從跨語言文獻(xiàn)解析到深度歷史探究》中所期待的,AI的真正價值,不在于替代學(xué)者的思考,而在于增強學(xué)者的思考;不在于給出唯一的標(biāo)準(zhǔn)答案,而在于激發(fā)更多元的歷史想象。未來,歷史學(xué)家與AI或許會像一對默契的舞伴,在海量的歷史數(shù)據(jù)與深邃的人類智慧之間,共同探索歷史研究的嶄新疆域。而每一次像“AI讀懂我的西夏文研究”這樣的“小確幸”,都讓我們對這個充滿無限可能的未來,多了一份期待與信心。

[作者張光偉系陜西師范大學(xué)歷史文化學(xué)院講師,擔(dān)任陜西師范大學(xué)絲綢之路歷史文化虛擬仿真實驗教學(xué)中心副主任,主要從事"人工智能+歷史學(xué)"交叉學(xué)科研究:(1)基于深度學(xué)習(xí)的中國古文字識別與智能古籍?dāng)?shù)字化,歷史地輿信息的多維度提取與可視化重構(gòu);(2)大模型與歷史研究的深度融合;(3)虛擬仿真實驗技術(shù)在歷史研究與教學(xué)中的應(yīng)用,國家一流本科虛擬仿真實驗課程“敦煌石窟歷史實踐教學(xué)虛擬仿真實驗”技術(shù)負(fù)責(zé)人。]

    責(zé)任編輯:彭珊珊
    圖片編輯:張穎
    校對:丁曉
    澎湃新聞報料:021-962866
    澎湃新聞,未經(jīng)授權(quán)不得轉(zhuǎn)載
    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網(wǎng)安備31010602000299號

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116

            ? 2014-2026 上海東方報業(yè)有限公司