中文字幕国产91无码|AV成人手机在线|av成人先锋在线|911无码在线国产人人操|91蜜桃视频精品免费在线|极品美女A∨片在线看|日韩在线成人视频日韩|电影三级成人黄免费影片|超碰97国产在线|国产成人精品色情免费视频

  • +1

輸入疾病信息快速生成靶點(diǎn),百圖生科發(fā)布AI生成蛋白質(zhì)平臺(tái)

澎湃新聞?dòng)浾?邵文
2023-03-23 21:17
來(lái)源:澎湃新聞
? 未來(lái)2% >
聽全文
字號(hào)

“輸入病人疾病相關(guān)的多組學(xué)數(shù)據(jù),如胃癌病人,AIGP平臺(tái)能夠分析其多組學(xué)數(shù)據(jù),找到針對(duì)這個(gè)胃癌病人的靶點(diǎn),根據(jù)這個(gè)靶點(diǎn)生成一個(gè)抗體甚至一系列有多樣性的蛋白。最后,一鍵式生成的蛋白回到自動(dòng)實(shí)驗(yàn)室里合成蛋白?!?/u>

“大家以前覺得AlphaFold 2已經(jīng)非常準(zhǔn)了,但在與進(jìn)化不相關(guān)的蛋白,即在人和病毒斗爭(zhēng)過(guò)程中演化的蛋白方面,實(shí)際建模得不太好。而通過(guò)大模型的訓(xùn)練以及下游的結(jié)構(gòu)預(yù)測(cè),我們得到一個(gè)模型比AlphaFold 2還要準(zhǔn)三倍,在預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)時(shí)的速度比AlphaFold快100多倍?!?/u>

AI Generated Protein(AI生成蛋白質(zhì))平臺(tái)能力。

3月23日,百圖生科發(fā)布生命科學(xué)大模型驅(qū)動(dòng)的AIGP —— AI Generated Protein(AI生成蛋白質(zhì))平臺(tái),旨在利用AI設(shè)計(jì)創(chuàng)新蛋白質(zhì)的能力與行業(yè)伙伴共同研發(fā)更多前沿藥物和其他生命科學(xué)項(xiàng)目,同時(shí)驅(qū)動(dòng)AIGP平臺(tái)的技術(shù)進(jìn)步。

“AIGP平臺(tái)第一個(gè)功能是,根據(jù)形狀及理化性質(zhì)(物理性質(zhì)和化學(xué)性質(zhì))需求,生成一系列滿足需求的蛋白。第二類功能是根據(jù)一個(gè)蛋白質(zhì)靶點(diǎn)生成對(duì)應(yīng)和靶點(diǎn)結(jié)合的蛋白,比如針對(duì)新冠生成一個(gè)蛋白,甚至針對(duì)石油相關(guān)的分子生成一個(gè)酶。第三類功能是輸入病人疾病相關(guān)的多組學(xué)數(shù)據(jù),如胃癌病人,AIGP平臺(tái)能夠分析其多組學(xué)數(shù)據(jù),找到針對(duì)這個(gè)胃癌病人的靶點(diǎn),根據(jù)這個(gè)靶點(diǎn)生成一個(gè)抗體甚至一系列有多樣性的蛋白。最后,一鍵式生成的蛋白回到自動(dòng)實(shí)驗(yàn)室里合成蛋白?!卑賵D生科CTO宋樂對(duì)澎湃科技(www.nxos.com.cn)介紹道。

百圖生科(BioMap)是生物計(jì)算引擎驅(qū)動(dòng)的創(chuàng)新藥物研發(fā)平臺(tái),由百度創(chuàng)始人李彥宏發(fā)起創(chuàng)立,致力于將先進(jìn)AI技術(shù)與前沿生物技術(shù)相結(jié)合,構(gòu)建獨(dú)特的靶點(diǎn)挖掘及藥物設(shè)計(jì)能力,開發(fā)創(chuàng)新藥物。

對(duì)于百圖生科AIGP平臺(tái)的發(fā)布,世界生物信息學(xué)界的著名學(xué)者、哈佛醫(yī)學(xué)院計(jì)算生物醫(yī)學(xué)中心創(chuàng)始主任、R語(yǔ)言的主要發(fā)明人、百圖生科科學(xué)顧問(wèn)委員會(huì)委員羅伯特?杰特曼(Robert Gentleman)表示,在哈佛,他的團(tuán)隊(duì)同樣在進(jìn)行蛋白質(zhì)生成/預(yù)測(cè)模型的相關(guān)研究,“百圖生科在這個(gè)方向上走得很遠(yuǎn)了”。

杰特曼期待,AIGP會(huì)帶來(lái)更多的蛋白質(zhì)/抗體生成模型,抗體工程師們可能會(huì)從這些模型的預(yù)測(cè)中發(fā)現(xiàn)自己從未注意過(guò)的細(xì)節(jié),“如果將這些模型視作‘idea generator(想法生成器)’,一切會(huì)變得更加美妙”。

目前,百圖生科AIGP平臺(tái)設(shè)置了3類功能模塊,分別是Function to Protein Design(F2P,根據(jù)結(jié)構(gòu)、功能、可開發(fā)性等功能指標(biāo)設(shè)計(jì)/優(yōu)化蛋白質(zhì))、Protein to Protein Design(P2P,給定抗原等目標(biāo)蛋白,設(shè)計(jì)與之以特定方式結(jié)合的抗體等蛋白),以及Cell to Protein Design(C2P,給定細(xì)胞,發(fā)現(xiàn)調(diào)控細(xì)胞功能的靶點(diǎn)蛋白并設(shè)計(jì)相應(yīng)的調(diào)控蛋白)。

這個(gè)平臺(tái)背后是百圖生科打造了兩年多的千億參數(shù)跨模態(tài)大模型“xTrimo”(The Cross-Modal Transformer Representation of Interactome and Multi-Omics)。其從跨物種、跨模態(tài)的生命信息中學(xué)習(xí)蛋白質(zhì)如何構(gòu)成和實(shí)現(xiàn)功能、如何相互作用、如何組合和調(diào)控細(xì)胞功能的關(guān)鍵規(guī)律,從而破解生命的自然語(yǔ)言——蛋白質(zhì)。

對(duì)于近期由ChatGPT引起的對(duì)“涌現(xiàn)”的關(guān)注,在這個(gè)千億參數(shù)AI大模型中有何體現(xiàn)?

宋樂對(duì)澎湃科技解答道,第一個(gè)例子體現(xiàn)在蛋白質(zhì)自然度,即輸入一個(gè)蛋白質(zhì)模型可以評(píng)估這個(gè)距離自然的蛋白有多接近,蛋白表達(dá)體系能不能表達(dá)這個(gè)蛋白?!拔覀儼l(fā)現(xiàn)大模型的預(yù)測(cè)值和真實(shí)實(shí)驗(yàn)體系測(cè)出來(lái)的結(jié)果有非常好的相關(guān)性,甚至超過(guò)了60%、70%,如果變成分類問(wèn)題,則可以達(dá)到80%以上。在經(jīng)過(guò)海量蛋白質(zhì)的訓(xùn)練之后,模型似乎學(xué)到了蛋白質(zhì)或生物進(jìn)化的過(guò)程,學(xué)到了什么樣是蛋白質(zhì)。這是我們驚喜的地方,但同時(shí)也是大模型自然的結(jié)果?!?/p>

第二個(gè)例子體現(xiàn)在抗體抗原方面,“大家以前覺得AlphaFold 2已經(jīng)非常準(zhǔn)了,但在與進(jìn)化不相關(guān)的蛋白,即在人和病毒斗爭(zhēng)過(guò)程中演化的蛋白方面,實(shí)際建模得不太好。而通過(guò)大模型的訓(xùn)練以及下游的結(jié)構(gòu)預(yù)測(cè),我們得到一個(gè)模型比AlphaFold 2還要準(zhǔn)三倍,在預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)時(shí)的速度比AlphaFold快100多倍?!彼螛氛f(shuō)。

中國(guó)科學(xué)院院士、著名免疫學(xué)家董晨教授認(rèn)為,“AI能夠解決的問(wèn)題,就是對(duì)大數(shù)據(jù)的分析和進(jìn)一步的演繹和應(yīng)用。在當(dāng)下的時(shí)間節(jié)點(diǎn),AIGP確實(shí)是一個(gè)呼之欲出的平臺(tái)。相信AIGP對(duì)于我們理解蛋白質(zhì),以及在生物系統(tǒng)中研究和發(fā)現(xiàn)它的功能和調(diào)控,乃至于將來(lái)研發(fā)新藥,都會(huì)有非常大的作用?!?/p>

不過(guò)百圖生科CEO劉維也坦言,現(xiàn)在的AIGP只相當(dāng)于1.0階段,遠(yuǎn)不完美。

那為何要在當(dāng)下發(fā)布?“擺在面前的既有機(jī)遇也有挑戰(zhàn)。”劉維說(shuō)。

機(jī)遇在于,通過(guò)蛋白質(zhì)大模型對(duì)于任務(wù)模型的賦能,其發(fā)現(xiàn)AI預(yù)訓(xùn)練大模型確實(shí)對(duì)多樣化蛋白質(zhì)問(wèn)題有非??焖俚馁x能和提升。他舉例稱,哪怕在具體問(wèn)題如某一個(gè)靶點(diǎn)或蛋白上,原來(lái)積累的數(shù)據(jù)并不夠,在任務(wù)模型上的積累并不夠。但通過(guò)AI大模型對(duì)任務(wù)的賦能,在有些問(wèn)題上就能比較快達(dá)到今天的SOTA(state of the art,在特定任務(wù)中目前表現(xiàn)最好的方法或模型)能力。

挑戰(zhàn)在于,現(xiàn)在多種任務(wù)的成功率普遍有限,比如蛋白質(zhì)彈頭(“彈頭”是抗體)設(shè)計(jì)能力,“將7000個(gè)膜表面蛋白上都輸入到AIGP平臺(tái),只有一小部分在一兩個(gè)輪次內(nèi)可以找到成功的彈頭。如何從開始展露一些能力到提高其泛化能力,提高速度,這需要專業(yè)伙伴的合作,他們往往帶來(lái)對(duì)問(wèn)題更好的定義,在生物學(xué)領(lǐng)域的know-how(專門知識(shí))也有非常強(qiáng)大的積累?!彼螛氛f(shuō)。

而如果每一種蛋白需要重新搭實(shí)驗(yàn)體系,那可能10年的時(shí)間也只夠在很小的領(lǐng)域向前走幾步。

“雖然我們今天很自豪有高通量干濕閉環(huán)的能力,但我們的濕實(shí)驗(yàn)基本只到蛋白本身的高性能制備,以及局限在我們自己關(guān)注的一小類免疫學(xué)問(wèn)題上。而如果專業(yè)伙伴帶來(lái)一些前沿項(xiàng)目,即用現(xiàn)在業(yè)內(nèi)主流方法無(wú)法設(shè)計(jì)的蛋白,我們的合作伙伴可以更快加速前沿項(xiàng)目的研發(fā),我們也可以把其想要的前沿蛋白質(zhì)變成現(xiàn)實(shí)?!彼螛方又f(shuō),“這是我們今天鼓足勇氣走出這一步,向整個(gè)業(yè)界發(fā)布AIGP平臺(tái)的原因,希望大家一起迭代和打磨它?!?/p>

據(jù)劉維透露,6月開始會(huì)進(jìn)一步發(fā)布AIGP 1.5版本,請(qǐng)公眾的專業(yè)用戶使用。一年內(nèi)發(fā)布AIGP 2.0版本,在蛋白質(zhì)彈頭設(shè)計(jì)等一些核心功能上提供更多自主使用能力,為廣大開發(fā)者提供普及化的蛋白質(zhì)生成能力,“讓做蛋白質(zhì)的門檻從專門的Biotech(生物科技公司)降到生命科學(xué)的研究者都能使用的水平?!?/p>

 

    責(zé)任編輯:鄭潔
    校對(duì):欒夢(mèng)
    澎湃新聞報(bào)料:021-962866
    澎湃新聞,未經(jīng)授權(quán)不得轉(zhuǎn)載
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號(hào)

            滬公網(wǎng)安備31010602000299號(hào)

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116

            ? 2014-2026 上海東方報(bào)業(yè)有限公司