中文字幕国产91无码|AV成人手机在线|av成人先锋在线|911无码在线国产人人操|91蜜桃视频精品免费在线|极品美女A∨片在线看|日韩在线成人视频日韩|电影三级成人黄免费影片|超碰97国产在线|国产成人精品色情免费视频

  • +1

信息視角下的生命是什么:橫跨生命和非生命集群系統(tǒng)的信息化架構

2021-05-14 11:10
來源:澎湃新聞·澎湃號·湃客
聽全文
字號

原創(chuàng) Hyunju Kim等 集智俱樂部 收錄于話題#生命復雜性20個

導語

生命是什么?這一追問至今仍在進行中,目前的答案以定性居多。而隨著在自然界發(fā)現(xiàn)越來越多新型生命形態(tài),以及新技術所創(chuàng)造的許多類生命系統(tǒng),生命系統(tǒng)與非生命系統(tǒng)之間的明確邊界正在不斷受到質(zhì)疑。近日發(fā)表在Theory in Biosciences雜志的一項研究,用信息論分析生命系統(tǒng)與非生命系統(tǒng)在信息架構上的區(qū)別,并討論量化構建“生命光譜”的可能性。論文通訊作者Sara I. Walker任職于亞利桑那州立大學和圣塔菲研究所,從事復雜系統(tǒng)和生命起源、天體生物學研究。

Hyunju Kim, Gabriele Valentini, Jake Hanson & Sara Imari Walker | 作者

十三維 | 譯者

趙雨亭、章彥博 | 審校

鄧一雪 | 編輯

1. 摘要

集群行為(Collective behavior)被廣泛視為生命和智能系統(tǒng)的標志屬性。但在許多已知的無生命純物理系統(tǒng)中,也有表現(xiàn)出集群行為的例子。這導致人們傾向于接受使用簡單物理模型來解釋生命的集群行為。為理解發(fā)生在生命實例中的真實情況,重要的是確定生命和非生命系統(tǒng)的集群行為之間,是否存在根本性的差異,以及從簡單的物理實例建立對生命現(xiàn)象解釋時直覺的局限。在這里,我們提出了一個框架,將生命和非生命集群作為基于各自信息架構的連續(xù)體進行比較:即信息究竟是如何跨越不同自由度進行存儲和處理的?我們回顧了從信息論角度描述集群現(xiàn)象的各種例子,并對未來基于信息架構量化生命集群行為的方向提出了建議。

2. 介紹

被我們冠稱為"生命"的這一大類現(xiàn)象,迄今仍無法進行具體的科學定性。雖然此前已經(jīng)提出了許多關于生命的定義(Clel& & Chyba 2002; Tirard et al. 2010; Benner 2010; Walker & Davies 2013),但幾乎都是描述性而非定量的。人工生命和系統(tǒng)化學方法正在推動我們越來越接近在實驗室中實現(xiàn)"類生命"(life-like)系統(tǒng)?;谝呀?jīng)發(fā)現(xiàn)的、幾十顆圍繞在其它恒星運轉的宜居星球,人類在地外世界尋找生命的努力也在加快步伐(Kopparapu et al. 2014; Dressing & Charbonneau 2015; Anglada-Escudé et al. 2012, 2016; Gillon et al. 2017),一些新近投資的航天項目,例如龍飛船(Dragonfly),甚至即將訪問土衛(wèi)六去搜尋地外生命的痕跡。

在沒有量化指標確定我們發(fā)現(xiàn)的東西是否真是"生命"的情況下,我們尋找生命新樣例的努力很大程度上是盲目的。因此制定嚴格、量化的方法來描述生命是什么,變得越來越迫切。以往大多數(shù)努力都采用現(xiàn)象學方法來定義生命最重要的屬性,例如將復制、新陳代謝活動、進化能力、細胞邊界等作為關鍵屬性(Clel& & Chyba 2002)。鑒于尋找生命最終還是需要客觀標準來對存在證據(jù)進行評估,因此有必要采用新的、定量的方法來理解和測量一個系統(tǒng)是否是“活的”,以及若是活的則哪些因素是必需的。這項任務的根本挑戰(zhàn)在于,我們能用什么來度量?

在眾多可以為定量方法提供基礎的屬性中,生命系統(tǒng)存儲和處理信息的能力有潛力成為最基本和最獨特的屬性(Szathmáry 1989; Küppers 1990; Yockey 2005; Davies & Walker 2016)。生命通過操控信息來重塑物質(zhì)結構并使其發(fā)揮功能的能力,與其它任何種類物理系統(tǒng)中看到的情況都非常不同。雖然這種觀點確實在各種流派中越來越受到青睞,但它仍然存在很多問題有待說明:我們可以給生命系統(tǒng)賦予什么可度量的指標?它會是信息論的嗎?會基于信息流下的網(wǎng)絡結構嗎?抑或只是一種全新的形式主義?

為解決這些問題,重要的是現(xiàn)在就開始用我們目前手頭的工具來重構“生命是什么”的問題,即使隨著理論和實驗的迭代進展,這些工具最終可能會被更細致的量化數(shù)學理論所取代。發(fā)展任何理論都應該有可驗證的結果,相關可觀測物要有明確的定義。對比下其中最有希望的數(shù)學工具,就是信息論和網(wǎng)絡科學的工具,以及最近對信息理論的擴展。這些工具能允許評估因果交互作用;此外迄今為止,還沒有其它任何方法有機會完成量化一般生命過程的使命。

任何科學方法若想在諸如量化生命及其特性這樣困難的領域取得進展,必將遭致嚴重的批評和挑戰(zhàn)。例如,人們可能反對專注于生命信息的一面,認為信息論方法不僅適用細胞內(nèi)發(fā)生的過程,同時也能用于描述社會和城市過程,范圍過于寬泛將導致定義不清。此外,從信息方法中得出的結論也受測量樣本數(shù)的限制,并且并沒有一個有效方案來解決這個問題。

但我們認為,這兩方面都是優(yōu)點而非缺點。沒有理由認為"生命"只是一種在天體生物學假設下、僅發(fā)生在化學中的現(xiàn)象。尤其是在人工生命或復雜系統(tǒng)領域中,前面假設并不重要。我們反而認為化學僅僅是相關的、只是生命涌現(xiàn)的物理學尺度,而生命本身是一個更廣泛的現(xiàn)象,會在不同尺度上反復出現(xiàn):從化學到細胞,再到社會——它會普遍地涉及信息(抽象屬性)與物質(zhì)間的交互作用。若確實如此的話,這就給我們提供了一個契機,使我們能在僅有一個生物圈的有限樣本內(nèi),也能研究各種跨越不同尺度的生命實例(Walker 2017)。我們期望這種普遍性方法不僅能闡明地球上不同系統(tǒng)和尺度的生命結構,也能揭示其它生命系統(tǒng)的可能性——即有哪些別的物理系統(tǒng)也支持與已知生命實例具有相同的信息結構。

在本文中,我們提出了這樣的觀點:在有生命系統(tǒng)和無生命的系統(tǒng)之間可能沒有明確的、非黑即白的區(qū)別,二者之間不存在鴻溝和界限。執(zhí)著于生命/非生命的二元對立一直在阻礙著研究進步,相反,順著如圖1那樣可能存在狀態(tài)漸變的"生命光譜",可以看到,即使復雜程度相似,有些系統(tǒng)也比其他系統(tǒng)更有生命力(alive)。而要衡量“生命力”(aliveness),信息就是一種很好的度量,畢竟它與尺度無關,且集群系統(tǒng)向更有生命力系統(tǒng)的過渡也可能需要信息。對此測量可以集中于給定物理系統(tǒng)中可能發(fā)生的轉變:更有“生命力”的系統(tǒng)允許更多可能的轉變,并經(jīng)常促成更多不可能的轉變。一個例子是,利用農(nóng)業(yè)信息的農(nóng)耕活動如何改造了我們?nèi)祟惖奈拿鳎瑢е庐a(chǎn)生了改造物質(zhì)的能力,而這些能力在這一革新之前是不存在的;或者人文學科對科學的發(fā)明如何導致人類物理上實現(xiàn)從地球發(fā)射到太空的能力,顯然這在萬有引力定律的知識之前也是不可能的(Walker 2016)。在這方面,生命可以說是在探索足以導致事物發(fā)生的相鄰可能性(adjacent possible,Kauffman 2019)。其中轉變可能性的數(shù)量與生命物質(zhì)的信息結構有著深刻的聯(lián)系,因為只有當生命系統(tǒng)獲得了物理世界的信息,它們才可能控制與這些信息相關的過程:更多的信息意味著對更多自由度的控制。

圖1:生命光譜中的信息。該圖闡明了一個如何將生命系統(tǒng)視為同一物理現(xiàn)象不同層級例子的概念框架,關鍵在于信息結構的區(qū)別。以這樣的尺度上對生命系統(tǒng)進行排序是否可能;以及若可能,哪種度量更能刻畫這個尺度的特點,目前仍是一個懸而未決的問題。圖中復雜系統(tǒng)分別代表:一組非生物的化學化合物、細胞內(nèi)的生化反應、由多達5萬個細胞組成的團藻球形種群、螞蟻群體的集群行為,以及嵌入城市的社會結構。這當然并不全面,但說明了代表不同"生命力"程度的系統(tǒng)在不同尺度縮放下可能的樣子

生命可能存在一個光譜的想法是信息方法的自然結果:如果信息蘊含的某種概念確實是生命物質(zhì)最基本屬性的基礎,那么生命就應該能用其信息結構和因果結構來量化(Walker & Davies,2013)。然而,作為圍繞生命屬性的信息和因果結構,一旦延伸到純物理系統(tǒng),就開啟了統(tǒng)一描述生命和非生命系統(tǒng)并量化它們相似和差異的可能性。當我們把目光投向行恒星和星系等大質(zhì)量天體來研究引力物理學時,就像承認引力是宇宙的一個普遍屬性一樣,我們應該認識到信息也是,而生命過程就是研究信息物理學最典型的例子。

可見重要的是,任何量化生命的嘗試都必須能處理非生命模仿生命系統(tǒng)行為的情況。因此在這篇文章中我們關注集群行為——它被廣泛認為是生命的標志屬性,同時又能在許多非生命系統(tǒng)中觀察到。事實上簡單的物理模型經(jīng)常被用來模擬生命的集群行為,這就引出了它們是否存在根本差異的問題。我們認為,通過研究集群中的信息流,將獲得信息理論是否能夠區(qū)分生命和非生命系統(tǒng)的深刻見解:假設兩個系統(tǒng),通過不同機制表現(xiàn)出相同的聚集行為(aggregate behavior),一個是活的而另一個不是,信息論就能發(fā)現(xiàn)這些差異。信息論關注的是捕捉空間和時間相關的結構,因此可以使用信息論度量來確定兩個系統(tǒng)是否使用了相同的規(guī)則集合。我們的假設是,生命能通過各種相關操縱(例如,對自身狀態(tài)的干預)主動控制自身的狀態(tài),而非生命則不能。因此信息理論將成為辨別非生命和生命集群相關性結構差異的有用工具。就此而言,生命過程的光譜可能由控制(因果)和信息結構的組合決定,組合沿著從生命力較少到生命力較多的頻譜對各種實體進行量化。雖然"生命光譜"的精確度量和尺度仍有待確定,但我們將在本文概述一些可能進一步有用的關鍵思想。

3. 用信息論揭示生命中的物理學

信息是一個抽象的概念。雖然由克勞德·香農(nóng)(Claude Shannon)開創(chuàng)的信息數(shù)學理論將某些方面形式化了,但它并非對“信息是什么”的完整描述。尤其,我們并沒有一個具體的框架來理解對信息之于物理究竟是什么。信息可以在不同的物理介質(zhì)之間復制,這意味著它并不是嚴格意義上只與物理質(zhì)料相聯(lián)系的物質(zhì)屬性。例如,信息可以從作者的頭腦中復制到這一頁文字上(通過寫在電腦),或者復制到印刷的紙張上,并最終按照預期功能復制到讀者的大腦中(例如這里你閱讀到的)。這些事件在空間和時間上是分離的,并且發(fā)生在完全不同的物理介質(zhì)上。就像許多信息傳輸?shù)睦右粯樱@表明信息不可能僅僅是大腦的化學濕件、或計算機處理芯片上的一種屬性。正是在這個意義上,信息才是“抽象的”(同樣人們也可以認為“能量”是抽象的,因為它能在不同的物理系統(tǒng)之間流動,并以不同的方式儲存或使用——如化學能、機械能等。但相比之下,我們確實對什么是物理上的能量有一個非常清晰的認識)。

然而,信息也必然是物理的。為了使信息存在,它必須在物理自由度中實例化(L&auer et al. 1991),因此信息的動力學取決于物理自由度下動力學。在生物學中,信息的作用更為突出,它似乎具有“自己的生命”(Davies&Walker 2016),對生物過程的解釋暗示“信息”本身就具有因果效應(Davies 2011)。生命擁有能夠存儲和處理信息的驚人能力,不僅對于理解生命本身的起源(Yockey 2005;Walker&Davies 2013),對于理解生命系統(tǒng)如何在我們觀察到的時空尺度中組織起來,也是一個具有核心意義的課題。信息傳遞和信息處理通常被認為是集群行為背后的驅(qū)動力,例如螞蟻和蜜蜂的尋巢行為(house-hunting)、椋鳥群和魚群的奇妙運動、人類群體中的車道形成等等,直到細胞群的水平(Franks et al. 2002;Couzin,2009;Deisboeck&Couzin,2009;Moussaid et al. 2009;Couzin et al. 2011)。然而,雖然已被大量實驗和分析研究過,以上這些集群的信息機制卻往往只以生物體的具體物理量為特征、僅以非形式化方式就被定義了。

信息論下形式定義

為超越單純的描述性分析,或具體的案例研究,有必要引入形式化信息內(nèi)容和信息流的方法。物質(zhì)屬性已經(jīng)被量化了幾個世紀,信息則相對是更新的進展,它始于香農(nóng)的開創(chuàng)性工作。在信息論中最基本的量稱為熵,H(x) 被定義為(Shannon 1948):

其中 p(x) 是隨機變量 X 處于狀態(tài) x 的概率。當 p(x) 是所有可能狀態(tài)的均勻分布時,H(X) 是最大化的,它通常稱為香農(nóng)熵。香農(nóng)熵可以被描述為你在得知一個事件結果時可能體驗到的驚訝程度:事件越不可能發(fā)生,你在得知事件時就感覺越驚訝。從這個角度來看,信息的概念與減少不確定性密切相關,因為一個事件的不確定性越小,你對事件結果的驚訝程度就越小,它所包含的信息量也就越少。香農(nóng)熵構成了信息論的基礎,其它大多數(shù)信息概念和度量都是基于香農(nóng)所發(fā)展的一般信息概念的基礎上衍生出來的。然而僅僅用熵并不能完全體現(xiàn)"信息"的概念,因為信息還需要發(fā)送者和接收者(Adami 2016)。在這方面,信息被定義為給定其它過程下某個隨機過程不確定性的降低,并由所考慮過程間共享的熵的大小來表示(Cover & Thomas 2005),這被量化為互信息(mutual information):互信息可以很方便用維恩圖來可視化,即每個過程的熵相互重疊的區(qū)域(圖2a)。當考慮某個過程的熵,去掉與其它所有過程的互信息,我們就得到了條件熵:即了解其它所有過程知識時,該過程還剩下的不確定性。因此,互信息度量的是我們從所有其它過程知識中獲得有關某個過程的信息。圖2:維恩圖表示的 a 互信息;b 傳遞熵。

互信息也被用來量化存儲在一個系統(tǒng)和/與它各個組成部分中的信息量。最常用的測量方法是超額熵(excess entropy)和主動信息(active information)。超額熵(Crutchfield & Feldman 2003)被定義為一個過程過去和未來之間的互信息,衡量某個過程可以通過觀察其過去的行為來解釋的未來的不確定性;主動信息 A(X) 也提供了類似的度量,但它不考慮整個過程的未來,而只關注和預測過程中即將抵達的下一個狀態(tài)(Lizier et al. 2012a):

(其中

代表 X 中從時間點 n 開始過去 k 個狀態(tài):{x??-??+1, ..., x??-1, x??}。)

雖然互信息允許定義和量化信息,但它只是一個對稱的量,不能捕捉到隨機過程之間的方向性關系(如信息傳遞)。為克服這一信息量化處理的局限性,Schreiber(2000)引入了傳遞熵(transfer entropy)的概念,它是給定某個隨機過程過去(如歷史信息)和一個或多個其它過程當前知識了解下,對該過程未來狀態(tài)的不確定性減少的一種度量(Schreiber 2000; Kaiser & Schreiber 2002):

其維恩圖表示如圖2。傳遞熵利用時間方向性來克服互信息對稱性的限制,它是對兩個或多個過程之間的定向傳遞的預測信息的度量(Lizier&&Prokopenko 2010),因此也不一定就意味著因果作用(James et al. 2016);但它的逐點變量(point-wise,或局部變量)可以為集群行為的時空動力學提供有用的洞見(Lizier et al. 2008b)。

5. 信息論可以度量什么?

有關信息在生物過程中的作用,以及生物學是否需要一種不同類型信息的形式化(在現(xiàn)代信息論中通常被稱為功能信息或語義信息),一直存在著長期爭論 [例如, Yockey (2005) & Godfrey-Smith & Sterelny(2007)]。我們認為,目前闡述的信息理論,特別是考慮到分布相關性(Schreiber 2000)和因果信息(Hoel et al. 2013; Ay & Polani 2008)測量方面的最新研究,足以在信息如何構成生命的問題上取得進展。

具體而言,我們認為生命系統(tǒng)最與眾不同之處是它們的因果結構和信息架構(Walker 2017)。現(xiàn)代信息測量方法,如傳遞熵(Schreiber 2000)、因果信息流(Ay&Polani 2008)、有效信息(Hoel et al. 2013)、因果特異性(Griffiths et al. 2015)、整合信息(Oizumi et al. 2014)和整合時空模式(Polani et al. 2016)等等,所有這些都有希望從信息論角度對生物過程提供多樣而豐富的見解,使我們有能力了解如何在各種時空尺度上描述生命的信息架構和因果結構。

例如,速度和方向信息通常是在魚群(H&egard et al. 2012)和椋鳥群(Cavagna et al. 2010)協(xié)調(diào)運動的背景下研究的物理量,此類信息在群體中的傳播已經(jīng)用統(tǒng)計物理工具進行了建模(Bialek et al. 2012),各種行為機制 [如群感響應(quorum response)——許多動物采用的一種共識機制(Pratt et al. 2002;Wardal et al. 2008;Sumpter&Pratt,2009)] ——也進行了類似的研究。這些機制允許集體中的個體建立反饋回路,以放大或抑制信息的傳遞(Couzin 2009)。盡管研究這些群體信息傳遞、存儲和處理的形式化方法還不太成熟(Dall et al. 2005),但對這些現(xiàn)象的大量關注為形式化應用方法和發(fā)展新理論提供了有力依據(jù)。

在下面內(nèi)容中,我們并不認為存在一種量化生物集群行為"正確的信息度量"立場,而是主張在適當?shù)目刂葡拢ㄟ^在不同的生物數(shù)據(jù)集上應用多樣化的測量方法,解決生物系統(tǒng)如何在空間和時間上操縱因果相關結構以執(zhí)行功能。我們會通過解析生物系統(tǒng)區(qū)別于非生物系統(tǒng)的信息架構(Walker et al. 2016),并希望利用這些見解構建解釋“生命是什么”的新理論。

信息架構

形式上就我們旨在本節(jié)中提出的意義而言,集群行為的信息結構(以生命作為旨趣實例)是相對未被探索的開放的研究領域。盡管如此,一些研究已經(jīng)概述了它的一些顯著特征。例如,Danchin 等(2004)將個體可獲得的信息分成個體信息(personal information)和社會信息(social information),前者通過與環(huán)境的直接互動獲得的,后者則受益于其他同伴的行為獲得。進一步又可以將社會信息分為通過信號傳遞(signaling)和間接觀察(indirect observation)獲得的社會線索或公共信息。信號傳遞是有意傳遞的信息,而社會線索(如覓食者的位置揭示了食物來源)和公共信息(如覓食者的表現(xiàn)提供了食物來源質(zhì)量的信息)則缺乏此類特征。在集群行為背景下,Moussaid等(2009)強調(diào)了直接信息傳遞和間接信息傳遞的區(qū)別。按照 Danchin等(2004)的說法,直接信息傳遞對應明確的信號傳遞以及對社會線索和公共信息的間接觀察,間接信息傳遞則是個人信息的一個子集(Danchin et al. 2004),它只包括個體之間通過環(huán)境中介傳遞的信息。間接信息傳遞通常被稱為共識自主性(stigmergy),它包含了一種溝通形式,在這種形式中環(huán)境的功能是一塊共享的黑板,個人可以修改黑板來書寫信息,也可以感知閱讀信息(Grassé 1959)。間接信息傳遞最突出的例子無疑是某些種類螞蟻的信息素鋪設和跟隨行為(Goss et al. 1989;H?lldobler & Wilson 1990)。

然而上述定義,主要關注的是個體獲取與可能傳遞信息的不同方式。一個量化集群行為信息結構的形式框架,還應該考慮信息加工的其它基本方面。事實上,一個集群系統(tǒng)的內(nèi)部計算不僅是組成部分之間信息傳遞的結果,還可能要求它們具有存儲和轉換信息的能力(Crutchfield 1994;Feldman et al. 2008)。這其中一些特征可能存在爭議,例如目前還不清楚,在什么意義上,集體趨化作用(collective chemotaxis)會要求個體存儲它們位置以外的信息,或可能只是要求它們做出反應——無論這是否是由進化編程存儲的一組反應之一。

因此,集群行為信息架構的正式框架可以包含所有這些元素,重點在它們間的相互作用及隨時間的演變。在這個方向上的第一步是接受一種獨立于應用領域的通用語言,使我們有可能對信息處理的所有方面進行正式建模。當然這種共同語言要由信息論提供。

度量復雜系統(tǒng)的信息架構

信息論度量方法引入后不久就首先被用于研究集群行為:推斷蜜蜂的搖擺舞(Haldane & Spurway 1954)和螞蟻信息素蹤跡(Wilson,1962)所編碼食物來源的方向信息大小。但應用信息論對集群現(xiàn)象進行系統(tǒng)研究卻相當零散(Dall et al. 2005) 。例如,統(tǒng)計物理學將互信息用于研究二維伊辛模型(Ising model)中的相變(Matsuda et al. 1996;Gu et al. 2007),由維切克模型 [1](Vicsek model)驅(qū)動的自推進粒子蜂群模擬(Wicks al.,2007),以及調(diào)節(jié)模型(regulatory models)中的隨機布爾網(wǎng)絡(Ribeiro et al. 2008)。在所有這些情況下,互信息在無序或接近相變階段時均達到峰值?;バ畔⒑蛪K熵(block-entropy)——一種測量有限連續(xù)事件不確定性熵的變體(Shannon 1948),已被用于研究螞蟻信息素鋪設模擬中的群體決策(Klyubin et al. 2004),此項研究表明有限的噪聲有利于信息傳遞(Meyer 2017)。最近,Gelblum 等人(2015)的研究則顯示,附著在集體運輸上的螞蟻會向系統(tǒng)輸入信息,但這種信息只在短時間內(nèi)有效。以上這些測量方法不僅被用作分析工具,還被應用于人工進化控制器,設計模塊化的集群運動行為(Prokopenko et al. 2006)和多機器人系統(tǒng)(Sperati al et al. 2008)等等。

信息論涉及大量不同科技領域信息的量化、存儲和傳遞(Cover & Thomas 2005)。例如在生物學的背景下,信息論被廣泛用于研究神經(jīng)系統(tǒng)的功能并確定相關腦區(qū)結構(Honey et al. 2007;Vakorin et al. 2009;Nigam et al. 2016;Ito et al. 2011;Lizier et al. 2011;Vicente et al. 2011)。主動信息(見前面公式)被用于研究元胞自動機的信息存儲(Lizier et al. 2012b)、神經(jīng)信息處理(Wibral et al. 2014)以及蜂群動力學(Wang et al. 2012)等,而超額熵則主要應用于復雜物理現(xiàn)象的研究(Crutchfield&Feldman 2003)。

雖然其它信息流和因果信息度量方法的應用將為我們討論的問題提供更多見解,但這里我們主要會關注傳遞熵的信息處理的方法。并在后面為所選的傳遞熵提供了一個說明性的示例,驅(qū)動來自大量不同領域傳遞熵的應用,如神經(jīng)科學和金融(Bossomaier et al. 2016),包括互信息及傳遞熵都已被用于研究二維伊辛模型不同階段的信息流(Barnett et al. 2013)。Lizier 等(2008b)用它來研究元胞自動機,并表明質(zhì)點(particles,定義為滑翔機(gliders)和域壁(domain walls))是這類模型中傳遞信息的主要手段。

Wang 等(2012)研究了人工粒子群體運動模擬中的信息級聯(lián),表明它們以波浪的形式在群中蕩漾。在模擬中使用傳遞熵框架研究的其它集群行為還包括酵母細胞周期的動態(tài)調(diào)節(jié)網(wǎng)絡(Kim et al. 2015;Walker et al. 2016)(見下文討論)和多代理系統(tǒng)中的共識實現(xiàn)(Valentini et al 2018)。此外在動物集群行為研究中也得到了一些應用。例如,研究成對和小群的斑馬魚的信息傳遞,為識別領導關系提供了有用的工具(Butail et al. 2014,2016;Mwaffo et al. 2017),以及魚類U型轉彎過程中的信息和錯誤信息交互作用(Crosato et al. 2018);還有研究蝙蝠(Orange & Abaid 2015)或螞蟻和白蟻的引導者-追隨者關系(Valentini et al. 2020),粘液霉中的信息傳遞(Ray et al. 2019),以及成對魚群之間的捕食者-獵物關系(Hu et al. 2015)。

既然不同度量指標如此寬泛且還都具有廣泛適用性,對在不同系統(tǒng)中應用信息理論見解的最佳方法、甚至對這種方法是否可能,目前都尚無明確的共識,每種度量都提供了一種動力系統(tǒng)因果與相關結構在較低維度上的投影,因此并不能捕捉系統(tǒng)全貌。而將不同度量方法結合在一起,可以提供對生命和非生命系統(tǒng)結構更深的洞察,進而可以利用這些度量方法采取下一步行動,再發(fā)展出新的理論和度量方法,以了解生命究竟是什么。

例子:行為相似但機制不同集群的信息架構

集群系統(tǒng)經(jīng)常面臨需要做出集體層面共同協(xié)商的決定。這種決定是由大量的代理體作出的,往往遵循簡單的互動機制:收集、傳遞和處理集體決定所需要的信息。群體決策過程中的信息傳遞最重要:沒有信息的交流,集體之間就無法達成共識。盡管我們目前對群體決策機制有很好地理解,但個體規(guī)則在群體決策信息傳遞中的貢獻卻還鮮為人知。

為了解決這個問題,更好理解不同決策機制的信息狀況,我們研究了源自同一決策問題(Valentini et et al. 2018)信息傳遞應用情況下的不同決策策略:從兩個選項中價值較高的一個達成共識(Valentini et al. 2017)。我們考慮了兩種決策機制,多數(shù)決規(guī)則(majority-rule)和選舉模型(voter model),均通過集體中100個代理人產(chǎn)生意見。在我們的模型中(Valentini et al. 2016),代理人總是偏好兩個選擇中的一個。設其中地點 A 的質(zhì)量為 1,地點 B ∈ {0.5,0.9}。代理人會在兩個階段交替行動:在探索期前往與當前意見相符的環(huán)境區(qū)域,對該選項質(zhì)量進行采樣;另外是根據(jù)估測的傳播質(zhì)量,在當?shù)叵蚬餐貐^(qū)其他代理人廣播其意見的傳播期。在傳播期和探索期之間,代理人應用決策機制,并可能改變意見。當使用多數(shù)決規(guī)則時,代理人將把意見切換到大多數(shù)鄰居所喜歡的意見(Valentini et al. 2015)。當使用選舉模型時,代理人會簡單地隨機選擇鄰居的意見(Valentini et al. 2014)。在這兩種情況下,我們都考慮了鄰域構成,它會根據(jù)代理人的運動動態(tài)變化,但具有固定的基數(shù)(cardinality),通常一個代理會有5個鄰居左右。

圖3. 地點A(紅色區(qū)域)、巢穴(白色區(qū)域)和地點B(藍色區(qū)域)的模擬環(huán)境圖示。實心圓代表處于傳播狀態(tài)的代理體,空圓圈代表處于探索狀態(tài)的代理體。顏色代表選擇的意見,紅色表示選擇 A,藍色表示選擇 B。圖自 Valentini et al. 2018

多數(shù)決規(guī)則和選舉模型之間的機制差異導致了不同的表現(xiàn):前者比后者更快(圖4a),但準確度更低(圖4b)(這一結果更深刻的討論參見 Valentini et al. 2018)。

圖4. a 共識時間(對數(shù)尺度),b 模擬收斂于地點A的共識比例,c 在N=100的群體中初始偏好地點A代理數(shù)(如 {10,11,...,90} )的傳遞熵。問題配置:多數(shù)決規(guī)則 ????(????) ∈ {0.5,0.9},選舉模型????(????) ∈ {0.5,0.9} 。數(shù)字報告了使用LOESS回歸計算平滑條件均值和置信區(qū)間估計,數(shù)據(jù)跨度為0.1。圖自 Valentini et al 2018

在此基礎上,我們可以解釋應用決策規(guī)則(即多數(shù)決規(guī)則和選舉模型)的代理體從周圍鄰居那里接收的信息流。通過將傳遞熵應用于從空間多體模擬中收集的數(shù)據(jù)實現(xiàn)這點(見圖3),我們發(fā)現(xiàn),與速度和準確度一樣,代理體之間傳輸?shù)男畔⑷Q于決策機制。隨著集體達成共識的決策時間增加,從鄰居傳遞到應用決策規(guī)則的某個焦點代理體的信息量也會增加,并隨著最終結果的不確定性寬松調(diào)整。這個例子突出了信息結構和局域規(guī)則之間的關系,即使在集群行為最終可能導致類似決策的情況下。它強調(diào)信息結構不僅是要做出決策的屬性,同樣是以各組成部分之間相關結構來說明微觀動態(tài)和宏觀尺度特征關系的一個屬性。

為進一步說明這一點,可以使用我們中一些人的最近工作,將泰諾胸蟻(Temnothorax ants)縱隊行進行為(tandem running behavior)的信息流結構與另外兩種白蟻進行比較(Valentini et al. 2020),分別是精巢散白蟻(Reticulitermes speratus)和臺灣乳白蟻(Coptotermes formosanus)。通過聚焦泰諾胸蟻的縱隊行進行為,使用傳遞熵來研究引導者和跟隨者螞蟻之間的信息流??v隊行進允許對潛在地點知情的螞蟻(引導者)引導不知情的螞蟻(追隨者)了解其獲得的位置??v隊行進過程中,引導者會進行小段直線運動,跟隨者則會進行更多種不同運動(如當記憶地標的時候)(Bowens et al. 2013),期間跟隨者與引導者的身體接觸會觸發(fā)一系列重復動作。這種雙向反饋(引導者引導跟隨者跟隨)被假設為實現(xiàn)了一種類似于人類教學的學習過程。與泰諾胸蟻不同,白蟻縱隊行進的目的是確保新成對的雌雄白蟻夫婦在探索環(huán)境、尋找新巢址時不會失去對方。白蟻縱隊行進的引導者并不知道潛在的巢址,因此并不試圖將這些信息傳遞給跟隨者。我們用傳遞熵分析了蟻群縱列對之間信息交流的幅度和方向,考慮了三種通信通道:運動、旋轉和運動-旋轉結合。根據(jù)相關信道的不同編碼方案,對縱列對的空間連續(xù)軌跡進行了離散化處理:

運動信道:移動或不移動

旋轉通道:順時針或逆時針

運動-旋轉通道:不動,順時針移動或逆時針移動

我們發(fā)現(xiàn),在胸蟻和白蟻的縱隊行進中,引導者和追隨者之間的信息交換存在以前未知的顯著差異。在白蟻中,縱隊行進的引導者操控著這對螞蟻行為的所有方面(運動和旋轉),而泰諾胸蟻卻并非如此。與目前觀點相反,我們的分析顯示引導者和跟隨者螞蟻都扮演著不同的"領導"角色。從信息流的方向性看,雖然引導者指揮著蟻對的旋轉模式,但決定蟻對運動模式的是跟隨者。以這種方式,泰諾胸蟻的引導者-追隨者組合通過不同的信道交換不同的信息,蟻對組合的交互作用為不同自由度的信息流編碼了不同的方向。這是一個突出而明確的的例子,表明通過共享信息來進行群體決策是必要。因此對群體系統(tǒng)中信息流的嚴格量化有可能提供新的見解,揭示由于微觀和宏觀層面行為的微妙差異,新的計算類型(如決策)是如何從每個代理體的行動中產(chǎn)生的。

5. 集群系統(tǒng)全局因果結構的特征

人們已經(jīng)采用多種方法來刻畫復雜系統(tǒng),尤其是生物系統(tǒng)的因果結構特征。大多數(shù)人認為至少存在一些因果結構特性對生命過程的運行至關重要(Ellis et al. 2011; Griffiths et al. 2015; Auletta et al. 2008; Davies 2011; Roederer 2006)。為將生命系統(tǒng)的集群行為與非生命系統(tǒng)區(qū)分開,有必要了解信息架構與這些特征之間的關系。在這里我們提出,能夠?qū)⑸到y(tǒng)的集群行為與其它復雜物理系統(tǒng)區(qū)分開來的,是信息架構和它物理實例的因果計算結構是否耦是合的。

在上一節(jié),我們看到了一個通過改變局部交互規(guī)則來改變信息結構的例子。這里我們所說關注的因果結構,是指狀態(tài)轉換圖的全局結構,它與系統(tǒng)的功能有關。在這方面,對相同的"行為"(狀態(tài)轉換圖的因果結構)有多種可能的微觀實現(xiàn)(Hanson & Walker 2019)。在本節(jié)中,我們將回顧以前有關復雜系統(tǒng)因果結構涌現(xiàn)特性的研究,如臨界性、可控性和因果涌現(xiàn),以展示它們與生物系統(tǒng)信息處理之間關系。我們的目標是具體討論這些工作與因果結構在架構生物過程特有信息流中的作用,從而向量化生命的方向邁進。關于復雜系統(tǒng)和我們在這里涉及特定主題更廣泛的討論,請讀者參考更普遍的研究(Munoz 2018; Liu & Barabási 2016; Oizumi et al. 2014)。

Criticality 臨界性

復雜系統(tǒng)往往表現(xiàn)出多種類型的集群行為,被稱為相位(phases),這些彼此之間的行為與組成系統(tǒng)的單個實體行為往往截然不同,甚至大相徑庭。當相變(phase transitions)發(fā)生時,即使系統(tǒng)一個微小的局部擾動,也可能導致全局狀態(tài)從一個相變?yōu)橥耆煌南啵?amp;erson 1972;Stanley 1971;Chaikin & Lubensky 2000)。大量文獻都假設生命狀態(tài)可能與某一類特定的相位相關,其含義是,生命狀態(tài)的動態(tài)變化或非生命(隨機)聚集態(tài)中生命的出現(xiàn)可以被描述為一種相變過程(&erson 1972;Hopfield 1994;Pollack & Clegg 2008)。

在這里,我們專注于文獻中廣泛討論的兩種不同動力系統(tǒng)系之間的相變:穩(wěn)定和混沌,以及這兩個區(qū)域之間平衡的臨界系統(tǒng)。據(jù)研究從神經(jīng)放電到細胞基因調(diào)控、動物運動的各種生物系統(tǒng)都是臨界性的(Beggs 2007; Haldeman & Beggs 2005; Mora & Bialek 2011)。研究還表明,與臨界點附近的系統(tǒng)相比,遠離臨界點的系統(tǒng)要么在有序階段過于穩(wěn)定而不能自適應,要么在混沌階段過于不穩(wěn)定而缺少魯棒性。因此,生命系統(tǒng)的趨勢是調(diào)整(例如通過進化選擇)到臨界點,這種臨界動力機制被認為是內(nèi)穩(wěn)態(tài)和可進化性的驅(qū)動因素,以及生命過程的基本標志(Kauffman 1993)。

此外,復雜系統(tǒng)的計算能力,被定義為在執(zhí)行某些任務時,內(nèi)部邏輯結構輸入和輸出映射的數(shù)量和多樣性,推測會在臨界階段最大化(Turing 1950; Crutchfield & Young 1988; Packard 1988)。這個猜想是作為與支持計算信息操作有關的問題而提出的,認為計算可能會在信息存儲、傳播和處理能力最大化的情況下(Kauffman 1993)更自然地在臨界點(Langton 1990)附近發(fā)生。此外,Mitchell(2006)強調(diào)了通過網(wǎng)絡系統(tǒng)中動態(tài)時間序列來理解信息動態(tài)的重要性。隨后一些研究報告結果也表明,復雜網(wǎng)絡中的信息處理在其臨界階段被最大化(Solé & Valverde 2001; Kinouchi & Copelli 2006; Ribeiro et al. 2008)。特別是 Lizier 等人(2008a)曾嘗試改進以前這些計算特性的測量,對隨機布爾網(wǎng)絡(RBNs,Kauffman 1993)中的信息動態(tài)進行了徹底的定量研究。隨機布爾網(wǎng)絡被廣泛接受為基因調(diào)控網(wǎng)絡(GRNs)的模型,研究表明,量化存儲和處理的主動信息和傳遞熵的平均值各自在臨界點附近會達到最大值(Lizier et al. 2008a)。

從這里,我們可以看到一些典型物理模型局限性的暗示,例如平均場近似(mean-field approximations)和重整化群(renormalization group)方法,由于生物和非生物系統(tǒng)集群行為的差異,這些方法并不總是能轉化為生物學所使用 [例如,向生命過渡過程的信息屬性可能是不連續(xù)的,見 Walker & Davies (2013)]。也就是說,目前還不清楚平均場近似是否適用于包括生物學在內(nèi)的一般情況,也不清楚通常應用于連續(xù)相變的重整化群是否適用于刻畫生物相變的不連續(xù)性特征。解決方法之一是研究與生物功能相關臨界系統(tǒng)的特征,以及這些特征如何表現(xiàn)出生物網(wǎng)絡。例如,Daniels 等人(2018)最近證明了67個基因的調(diào)控網(wǎng)絡是臨界性的,而具有相似因果和信息架構的隨機集合則不是臨界性的,這顯示了特定的因果和信息屬性功能、與生物網(wǎng)絡是如何通過其臨界特性區(qū)分的。臨界性甚至已被證明是隨機基因網(wǎng)絡模型中的一個可選擇性質(zhì)(Serra 2019)。

我們和其他小組最近的一些研究,強調(diào)了在與環(huán)境的因果互動和內(nèi)部信息處理中適應性和魯棒性之間的平衡(Walker et al. 2016),已知信息處理特性表現(xiàn)出從穩(wěn)定階段(以信息存儲為主)到混沌階段(以信息傳遞為主)之間臨界轉變距離的強烈依賴性。眾所周知,臨界系統(tǒng)具有生物系統(tǒng)的兩個基本特征:對各種不同環(huán)境條件的適應性和魯棒性。我們期望基因調(diào)控中的臨界性普遍存在,這將為生物網(wǎng)絡獨特的信息處理和控制特性研究提供參考。

Control kernel 控制核

復雜系統(tǒng)研究的主旨之一是理解并理預測出系統(tǒng)涌現(xiàn)的全局動態(tài),例如動態(tài)軌跡或最終狀態(tài)(Liu & Barabási 2016)。這些代表系統(tǒng)集群行為的全局狀態(tài)可以通過施加外部因果干預來改變。引導整個系統(tǒng)從初始狀態(tài)到達期望的最終狀態(tài)。這為許多領域應用都提供了強大的工具,包括從輿論動態(tài)相關的問題到流行病,從細胞的分化到社會性昆蟲的巢穴選擇問題等等。

最近的研究發(fā)展了復雜網(wǎng)絡控制相關的數(shù)學基礎,試圖通過理解因果結構與各組成部分動態(tài)的更新規(guī)則來尋找嚴格的控制機制。Liu 等人(2011)發(fā)展了他們的前瞻性框架,將具有線性動態(tài)過程的有向復雜網(wǎng)絡可控性問題簡化為一個圖論問題。利用他們的理論可以確定一組能夠完全控制整個網(wǎng)絡動態(tài)的驅(qū)動節(jié)點(driver nodes)。他們還發(fā)現(xiàn),所確定的驅(qū)動節(jié)點往往是低度節(jié)點,并且總數(shù)主要由網(wǎng)絡的度分布決定。

生物系統(tǒng)模型大多是非線性動力學系統(tǒng),完全可控性既不可行也沒有必要。相反,找到一種特定的控制機制,能夠?qū)⒁粋€給定的系統(tǒng)從特定的初始狀態(tài)或軌跡引導到另一組期望狀態(tài)或軌跡集合,是更為現(xiàn)實的,往往也足夠的(Cornelius et al. 2013)。例如,控制基因調(diào)控網(wǎng)絡的主要目的之一是將系統(tǒng)引導到特定的細胞狀態(tài),而非任意的表達水平。這種表型控制通常被定位在整個網(wǎng)絡的一小部分中,以能驅(qū)動系統(tǒng)到期望吸引子的控制核來定義。不過,控制核的大小通常比一般隨機網(wǎng)絡還要更大(Liu et al. 2011; Kim et al. 2013; Gates & Rocha 2016; Choo et al. 2018)。這表明生物系統(tǒng)的可控性程度可能存在一定的范圍,可以通過控制核的大小來量化。因此我們會將可控性程度視為生物系統(tǒng)信息架構的基本特征(Walker et al. 2016; Kim et al. 2015),以區(qū)別于所有非生物集群。

Causal emergence 因果涌現(xiàn)

識別復雜系統(tǒng)中的因果關系是理解其涌現(xiàn)行為最基本的方法之一。然而這卻是一項艱巨的任務:不僅因為復雜系統(tǒng)中的因果結構很復雜(坦率地講它們確實很復雜),而且因為因果結構可以在多個時空尺度上進行分析,往往讓我們搞不清楚哪種尺度是分析的首選(如果有的話)。長期以來,人們一直認為主因結構只能在最低(微觀)尺度上定義,更高尺度上的因果結構是有用的,但只是對主因結構的粗略描述。即認為微觀層面的因果關系確定了所有更高層次的因果結構,更高(宏觀)層次的因果并沒有實際上的因果貢獻(Kim 1993,2000)。

這種觀念下的還原論方法在科學各領域取得了廣泛的成功,包括物理學和化學的重大發(fā)展。盡管如此,因果涌現(xiàn)的另一種可能——宏觀尺度是因果結構的重要驅(qū)動,被一再提出來,因為它能對各種類型的生物集群行為提供更簡單的解釋:從表觀遺傳學到蟻群的群體決策,再到大腦中的心理狀態(tài)等等。以往對這種因果涌現(xiàn)的研究大多局限于定性論證,而最近 Hoel 等人(2013)和 Hoel(2017)所做的定量研究表明,在一些系統(tǒng)中,因果結構可能無法完全被微觀尺度結構捕獲,相反宏觀層面的因果結構會更有效、具有更豐富的信息。

如上所述,我們認為尋找一種復雜系統(tǒng)的控制機制,可以成為研究不同層次因果結構的有用工具,它能從局部(微觀)層次因果深入洞悉驅(qū)動節(jié)點對全局(宏觀)系統(tǒng)動態(tài)轉向的影響。

生物集群系統(tǒng)信息架構與因果結構之間的耦合關系

如上節(jié)所討論,在以往研究中已經(jīng)暗示了生命系統(tǒng)信息架構與因果結構之間的關系。然而它們之間是否存在有意義的關系、若存在是否能夠區(qū)分不同生物集群行為,這些問題卻仍然是模糊、沒有定論的。在這里我們提供了一個定量的例子,基于經(jīng)驗數(shù)據(jù)集建立了一個生物網(wǎng)絡的動力模型,其規(guī)模較小故允許進行統(tǒng)計分析。由于系統(tǒng)生物學中高通量技術和數(shù)據(jù)驅(qū)動方法的出現(xiàn),細胞生物通路的布爾網(wǎng)絡模型是滿足這一必要條件的最佳候選之一。

基于最近 Daniels 等人(2018)提供的迄今為止最全面的臨界性調(diào)查,對從細胞集群數(shù)據(jù)庫(Helikar et al. 2012)中獲得的67個細胞調(diào)控布爾網(wǎng)絡進行了研究,顯示所有網(wǎng)絡都接近臨界狀態(tài)。另一方面,Kim 等(2013)分析了各種生物分子的調(diào)控布爾網(wǎng)絡,并確定了控制核——控制細胞網(wǎng)絡達到預期狀態(tài)所必需的最小節(jié)點集。研究表明,對于大多數(shù)網(wǎng)絡而言,控制核只是網(wǎng)絡組件的一小部分。因此,利用同類生物分子的調(diào)控布爾網(wǎng)絡來研究生物系統(tǒng)、并將信息架構與其因果機制結合起來,是我們自然的選擇。

在這里,我們以粟酒裂殖酵母(S.pombe,F(xiàn)ission Yeast)的細胞周期過程為案例,展示了如何在生物系統(tǒng)中研究信息架構與因果機制之間的關系(Walker al. 2016;Kim al. 2015),并作為生物中心功能體現(xiàn)的一個簡單實例。

裂殖酵母細胞周期的布爾模型描述

以布爾網(wǎng)絡對裂殖酵母的細胞周期進行建模(圖5),共有9個關鍵蛋白組成(Davidich & Bornholdt,2008),通過被稱為 G1-S-G2-M 四個步驟的細胞功能進行控制:從細胞生長到DNA復制,再到細胞分裂成兩個子細胞。在網(wǎng)絡中,每個代表蛋白質(zhì)的節(jié)點都有一個0或1的布爾值,分別表示其缺失或存在,每個節(jié)點狀態(tài)的組合集被稱為網(wǎng)絡狀態(tài)或網(wǎng)絡配置。單個節(jié)點的狀態(tài),是與其它節(jié)點生化作用狀態(tài)的函數(shù),類型包括交互、抑制和激活。

將局部動力規(guī)則應用于每個節(jié)點,以模擬系統(tǒng)一個時間步長的演化。在對應細胞周期起點的特定網(wǎng)絡配置上重復進行時間演化,從而以準確的順序再現(xiàn)生物過程各個階段序列。從512種可能的網(wǎng)絡狀態(tài)中的每一種開始生成網(wǎng)絡狀態(tài)空間,即所有可能時間演化的動力學軌跡,其景觀就代表了裂變酵母細胞周期布爾網(wǎng)絡的全局動態(tài)。網(wǎng)絡狀態(tài)空間包括13個吸引子、一個或一組多個網(wǎng)絡狀態(tài),其中任意時間演化軌跡都會收斂。由于動力特性是確定性的,根據(jù)每個網(wǎng)絡狀態(tài)收斂到哪個吸引子,整個網(wǎng)絡狀態(tài)空間可以劃分為13個不相交的子群。其中,約74%網(wǎng)絡狀態(tài)結束所在的主吸引子是唯一具有生物功能的吸引子(Davidich & Bornholdt 2008)。

Kim 等人(2013)最近關于控制這些生物調(diào)控布爾網(wǎng)絡的時間演化軌跡的研究表明,存在一個控制核——能通過改變所有吸引子狀態(tài)景觀收斂到主吸引子,從而決定整個系統(tǒng)命運節(jié)點的最小子集。對于裂殖酵母細胞周期網(wǎng)絡,研究表明整個網(wǎng)絡中有4個蛋白是控制核——即當 Rum1、 we1、 Ste9 和 Cdc25 的狀態(tài)固定為1、1、1、0 ,與它們所在生物功能主吸引子中的狀態(tài)相同時,從每種可能網(wǎng)絡配置開始的所有時間進化軌跡都會趨于生物功能吸引子。

信息傳遞與控制核的關系——以裂變酵母細胞周期網(wǎng)絡為例

在最近的工作中(Kim et al. 2015),我們通過計算網(wǎng)絡中每一對節(jié)點之間的傳遞熵來量化裂變細胞周期網(wǎng)絡的信息架構,從結果中識別出生物學的特有的模式,并通過控制核證明它與控制機制之間的密切關系。為了區(qū)分生物系統(tǒng)表征的信息模式,我們將傳遞熵的分析結果與對隨機網(wǎng)絡集成進行的相同分析進行了比較,這些網(wǎng)絡被構建為與每個酵母網(wǎng)絡共享某些相同拓撲特征,但不執(zhí)行相同的生物功能。

為了進行比較,我們利用了 Erd?s-Rényi (ER)和無標度(SF)兩種類型的隨機網(wǎng)絡集成。ER隨機網(wǎng)絡與裂變酵母網(wǎng)絡,除了網(wǎng)絡大小外沒有共同的結構偏向。相比之下,SF隨機網(wǎng)絡集成與細胞周期網(wǎng)絡一樣,每個節(jié)點保持相同數(shù)量的激活和抑制連接,這使得SF與生物網(wǎng)絡有相同的拓撲度分布。我們將單個網(wǎng)絡處理的總信息定義為其中所有節(jié)點對之間傳遞熵的總和。結果顯示,酵母細胞周期網(wǎng)絡處理的信息量比任何集合中大多數(shù)隨機網(wǎng)絡都多(圖6a)。這是一個直接測量結果,支持了與信息處理和臨界點相關的假設,即在生物系統(tǒng)中臨界點附近存在著信息傳輸?shù)膬?yōu)化,不像以前沒有基于經(jīng)驗數(shù)據(jù)集的定性或一般模型的研究,在這里這點被定量地清楚展示了出來。

通過根據(jù)每對節(jié)點傳遞熵的測量值分析縮放標度,我們還研究了處理后的信息在各個網(wǎng)絡中的分布。標度關系表明,與隨機網(wǎng)絡相比,生物網(wǎng)絡具有明顯異常的值(圖6b),生物管理信息最顯著的特點是,生物網(wǎng)絡中信息被處理得更加均勻。標度模式還表現(xiàn)出了統(tǒng)計學上獨特的高-中等級節(jié)點對范圍,與隨機網(wǎng)絡中相應尺度的節(jié)點相比,生物網(wǎng)絡的傳遞熵明顯更大。并且我們發(fā)現(xiàn),這種生物學上獨特的范圍是由控制核節(jié)點和非控制核節(jié)點之間的信息處理主導的(圖6c)。

細胞周期網(wǎng)絡在信息結構上表現(xiàn)出與隨機網(wǎng)絡相區(qū)別的特征模式,控制核節(jié)點通過控制有關結構的全局因果(狀態(tài)轉換圖中的因果流),在網(wǎng)絡信息傳遞中起主導作用,調(diào)節(jié)著系統(tǒng)全局狀態(tài)轉換。

圖5:裂殖酵母細胞周期調(diào)節(jié)的布爾網(wǎng)絡模型。節(jié)點代表調(diào)控蛋白,邊緣表示節(jié)點之間的兩種生化作用:激活(以箭頭結尾)和抑制(以條形結尾)。其中紅色節(jié)點是控制核,當固定在特定值時,它可以調(diào)節(jié)網(wǎng)絡的全局行為。該圖根據(jù) Davidich 和 Bornholdt(2008)和 Kim 等人(2013)的數(shù)據(jù)重新生成。圖6:裂變酵母細胞周期網(wǎng)絡中的信息架構和因果結構。a ER(綠色)和 SF(藍色)網(wǎng)絡集成處理總信息的分布。每個數(shù)據(jù)點表示在x軸上,傳輸?shù)慕o定信息總量的各個集合中的單個網(wǎng)絡的數(shù)量。b 裂變酵母細胞周期中成對節(jié)點間傳遞熵的標度,ER和SF網(wǎng)絡分別用紅色、綠色和藍色表示。對于1000個網(wǎng)絡的樣本,計算每個隨機網(wǎng)絡集合的平均值和標準差。虛線之間的區(qū)域表示裂變酵母的信息標度在生物學上獨特的范圍。c 裂變酵母細胞周期網(wǎng)絡信息傳遞的標度關系。CK 表示控制核節(jié)點,而 NCK 則是一組不包含在控制核內(nèi)的節(jié)點。所示數(shù)據(jù)與中間面板中裂變酵母傳遞熵的標度模式相同。根據(jù)一對中每個節(jié)點是在CK還是在NCK中,標度模式被分為四類信息傳輸。這些數(shù)字來自 Kim 等(2015)(在線彩色圖)

6. 非生命物理系統(tǒng)

到目前為止,我們主要討論的都是生物學的例子,但為了進一步實現(xiàn)理解生物集群獨有特征的目標,我們還必須理解所關心這些特性在非生命系統(tǒng)中出現(xiàn)在哪里。例如,有些非生命的、純物理系統(tǒng)允許我們在沒有生物組織的情況下研究可控性。引力體(Gravitating bodies)、范德瓦爾斯氣體(Van der Waals gases)和自旋玻璃(spin glasses)都是潛在作為純物理復雜系統(tǒng)的例子。不幸的是,這些系統(tǒng)中的絕大多數(shù)從未進行過任何形式的可控性分析,因為幾乎沒有控制它們的實際需求。耦合量子系統(tǒng)是個例外,由于量子計算的潛力人們對其可控性進行了嚴格的核查。

盡管對量子系統(tǒng)可控性的全面回顧超出了本文的范圍,但值得指出一些與網(wǎng)絡可控性相關比較突出的結果。最值得注意的是,許多耦合的量子系統(tǒng)只需通過操縱一個或兩個量子比特就可以實現(xiàn)完全可控性,其作用類似于網(wǎng)絡控制理論中的驅(qū)動節(jié)點。若通過使用某種形式的外部控制可以訪問整個希爾伯特空間,那么一個量子系統(tǒng)就被稱為是完全可控的(Schirmer et al. 2003)。

給定足夠的外部控制量,任何系統(tǒng)都應該是完全可控的。例如如果可以控制一個系統(tǒng)每個單獨的自旋,那么一個耦合的自旋-1/2粒子鏈將是在極其精細下完全可控的。更有趣是,為了完全控制系統(tǒng),量子系統(tǒng)需要的最小外部控制是什么,這與Liu 等人(2011)等人在網(wǎng)絡可控性方面提出的問題一樣,答案也驚人的相似。具體來說,Burgarth 等人(2009)研究了一種通過各向同性海森堡型(isotropic Heisenberg-type)相互作用耦合在一起自旋為-1/2的粒子鏈的完全可控性條件,發(fā)現(xiàn)通過兩個非對易(non-commuting)的外部控制對鏈末端單個節(jié)點的狀態(tài),就足以對網(wǎng)絡實現(xiàn)完全可控性。

類似地,在具有XY型相互作用的海森堡型自旋鏈中(Z自旋分量之間沒有耦合),只需操縱單個位點及與鄰近位點的相互作用就可以實現(xiàn)完全可控性(Schirmer et al. 2008;Kay & Pemberton-Ross 2010)。然而也并非所有自旋鏈系統(tǒng)都如此容易控制。例如,伊辛型(Ising-type)的相互作用需要對每個局部自旋進行控制才能實現(xiàn)完全可控(Wang et al. 2016)。事實上,就像網(wǎng)絡可控性一樣,很難判斷給定的拓撲結構和交互類型是否能在少數(shù)驅(qū)動節(jié)點上產(chǎn)生完全可控性,量子可控性領域的許多研究都集中在解決這個問題上。

現(xiàn)在還很難知道量子系統(tǒng)的非經(jīng)典性是否會影響我們對純物理系統(tǒng)控制的理解。但可以明確的是,這些系統(tǒng)中的一些系統(tǒng)要么通過少量的局部相互作用實現(xiàn)全局控制,要么需要對每個組件進行操縱。這與"控制核"部分提到的對復雜網(wǎng)絡可控性的研究是一致的:與隨機網(wǎng)絡相比,包括生物網(wǎng)絡在內(nèi)的無標度網(wǎng)絡往往需要更多的驅(qū)動節(jié)點來實現(xiàn)完全可控性,但又少于完全斷開連接的網(wǎng)絡,僅僅需要對每個節(jié)點進行操縱。這可能表明,生物系統(tǒng)的可控性特征程度在于臨界狀態(tài),與很多時候生物系統(tǒng)動力學中的臨界的狀態(tài)相似(見“臨界性”部分)。因此總的來說,在對生命群體進行分析的同時,對物理集群系統(tǒng)進行更廣泛的分析,可能會被證明更富有成效,可以準確確定哪些特征是生命中物理所特有的,而非作為物理宇宙中一個更廣泛的屬性。

7. 討論

我們當前對所有尺度生命更深的理解,都正趨向于將決定生命屬性的概念定義在信息上(Nurse 2008),即使它可能并非真的最重要。正如本文已經(jīng)部分回顧那樣,信息理論的工具已經(jīng)被用來解釋各種生物現(xiàn)象,從大腦神經(jīng)元的放電(Honey et al. 2007;Vakorin et al. 2009;Ito et al. 2011;Lizier et al. 2011),到魚群的行為(Butail et al. 2014,2016;Mwaffo et al 2017;Crosato et al. 2018),再到細胞內(nèi)的化學信號傳遞(Chong et al. 2011;Rhee et al. 2012;Selimkhanov et al. 2014)。與此同時,要實現(xiàn)真正的“生命系統(tǒng)物理學”,需要對生命有比目前已知的更基本的理解(Bialek 2012)。其中懸而未決最具挑戰(zhàn)性的問題之一是缺乏區(qū)分生命系統(tǒng)和非生命系統(tǒng)的可量化指標(Clel& & Chyba 2002; Davies & Walker 2016)。雖然現(xiàn)代生物學的大部分研究內(nèi)容,可以在沒有對生命是什么(以及不是什么)有深入的數(shù)學理解的情況下進行,但在某些科學領域,客觀的、可測量的生命構成標準是絕對關鍵的:這些標準包括生命的起源和對外星生命的探索(Walker 2017)。在我們努力在實驗室(Cronin & Walker,2016)或其他星球(Walker et al. 2018)尋找新生命實例的過程中,可量化的指標將成為決定性因素——允許在實驗室中設計可進化的化學系統(tǒng),穿越從非生命到生命的小徑,或允許對生命進行明確探測,即使它可能存在于與已知生命完全不同的化學成分中。

在建立對生命的定量理解方面,最大的障礙之一是我們?nèi)狈m當?shù)目刂苼砀綦x生命過程的物理機制。雖然標準物理學對生命的運作有了一定合理的理解(Schr?dinger 1992; Hoffmann 2012),但我們迄今為止還沒有設計出有效的實驗隔離,證明生物系統(tǒng)和非生物系統(tǒng)屬性是否能夠進行直接比較,或是否能解決非生命和生命系統(tǒng)之間集群行為的差異。亦或許沒有這樣的區(qū)分更有意義。為解決研究生命過程中物理機制需要更好的控制的問題,我們提出了一套想法,建立了一個框架,在這個框架中讓生命存在于一個連續(xù)譜上,從我們目前認為可能表現(xiàn)出一些“類生命”行為的非生命系統(tǒng),一直到行星規(guī)模的文明。這是生命可能存在于一個光譜中想法的自然結果,在這個光譜中,其中一些系統(tǒng)比另一些更有生命力,關鍵的區(qū)別屬性是它們的信息架構。雖然我們認為這樣尺度的生命可能存在,但還沒能為這種尺度建立適當?shù)亩攘繕藴剩矝]有在上面放置特定的例子。

其中面臨的挑戰(zhàn)之一是,對許多群體系統(tǒng)之間的比較分析仍有待嚴格制定和界定。我們認為信息論方法是最有前途的,因為它們捕捉到了物理系統(tǒng)在時空中存在相關的因果結構,提供了一個足夠抽象和嚴格的數(shù)學框架,是我們發(fā)現(xiàn)生命過程的各種物理介質(zhì)和尺度中量化生命的候選方法。而為了做出群體決策,個體必須共享信息,因此對群體系統(tǒng)中信息流的嚴格量化是可能提供新見解的一種途徑,使人們了解新的計算類型(例如決策)如何從單個代理的行動中產(chǎn)生。

隨著人工智能和信息理論應用的發(fā)展,現(xiàn)在可以通過許多不同的渠道提取生物行為的算法來處理生命系統(tǒng)中的信息,例如運動、形態(tài)學和生物電場。然而,盡管在概念和技術應用方面都取得了進展,但尚未進行系統(tǒng)的分析,直接將生命系統(tǒng)的信息特性與非生命系統(tǒng)進行比較,對生命系統(tǒng)的信息特性進行量化。大多數(shù)生物模型都是用硅片樹脂或機器人建造的,這意味著不可能直接將這些模擬系統(tǒng)的物理性質(zhì)與生物系統(tǒng)進行比較,畢竟后者存在于潮濕、混亂的化學環(huán)境中。

這在很大程度上限制了當前人工生命模型區(qū)分表現(xiàn)為“類生命”和嚴格作為生命物質(zhì)的能力。

“一個例子:行為相似但機制不同的跨集體的信息架構”一節(jié)中的例子表明,如果它不能捕獲局部級別的規(guī)則,那么不同系統(tǒng)中相同模擬的行為可能是不夠的,因為信息流將有所不同。因此,如果只是天真地構建硅片模擬系統(tǒng),可能不足以理解真實生物過程中的物理信息流。我們已經(jīng)證明信息理論對特定規(guī)則選擇是敏感的,而在計算機中建模者會顯式地選擇規(guī)則,這就使得計算機模擬生命中的信息結構與真實世界生物系統(tǒng)相比會直接存在差異。特別是,真實生命不允許孤立系統(tǒng)中的信息流結構(譯注:如封閉的計算機中),不會超越或超出物理和化學法則進行外顯編碼(譯注:如人工智能軟件系統(tǒng)的特殊規(guī)則),我們假設這是理解生命物理學的關鍵一步(Walker&Davies 2013)。

此外,計算機模型通常是真實世界過程的低維表示,因此不能捕捉到生物體們處理信息的所有多重信道。向前推進的一條可能道路是建立活體系統(tǒng)的物理模擬。例如,油滴混合物中演化的集體行為提供了一種非生命系統(tǒng)物理中模擬生物特性的方法,而不僅僅是在計算機中模擬(Taylor et al. 2017;Points et al. 2018)。因此,解決我們在這里提出的問題的一條途徑是開發(fā)活體系統(tǒng)的物理模擬,作為探索信息流物理的一種手段。

當然,要確定這種方法是否會最終能取得成果,還有很多工作要做;但我們認為,為理解集群行為,何時可歸因于生命過程、何時又不能,朝這個方向邁出步伐的努力,尤其是研究并提供新的定量理論和工具,將源源不斷提供新的見解并促使生物學持續(xù)發(fā)展。

原文:

https://link.springer.com/article/10.1007/s12064-020-00331-5

復雜科學最新論文

集智斑圖頂刊論文速遞欄目上線以來,持續(xù)收錄來自Nature、Science等頂刊的最新論文,追蹤復雜系統(tǒng)、網(wǎng)絡科學、計算社會科學等領域的前沿進展?,F(xiàn)在正式推出訂閱功能,每周通過微信服務號「集智斑圖」推送論文信息。掃描下方二維碼即可一鍵訂閱:

原標題:《信息視角下的生命是什么:橫跨生命和非生命集群系統(tǒng)的信息化架構》

閱讀原文

    本文為澎湃號作者或機構在澎湃新聞上傳并發(fā)布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網(wǎng)安備31010602000299號

            互聯(lián)網(wǎng)新聞信息服務許可證:31120170006

            增值電信業(yè)務經(jīng)營許可證:滬B2-2017116

            ? 2014-2026 上海東方報業(yè)有限公司