搜尋
首頁科技週邊人工智慧中國科學院研究團隊發布了兩篇重要論文:首個跨物種生命基礎大模型問世,以及新型細胞命運預測AI模型的發布

中國科學院研究團隊發布了兩篇重要論文:首個跨物種生命基礎大模型問世,以及新型細胞命運預測AI模型的發布

作者| 中國科學院多元學科交叉研究團隊

編輯 | ScienceAI

被稱為20世紀人類三大科學計畫之一的人類基因組計劃,拉開了深度解析生命奧秘的序幕。由於生命過程具有多維度、高度動態的特點,傳統實驗研究手段難以系統精準地破解基因密碼的底層共性規律,亟需運用強大的計算技術來實現基因數據的表徵建模與知識發現。

目前,以大型模型為核心的人工智慧技術在電腦視覺和自然語言理解等領域引發了革命,展示了對數據和知識的深入理解能力,並有望應用於生命科學研究領域,系統地精準破解基因密碼的底層共性規律

近日,由中國科學院多學科交叉研究團隊組成的「指南針聯盟」(Xcompass Consortium)在人工智慧賦能生命科學研究方面取得了重要突破,成功建構了世界首個跨物種生命基礎大模型-GeneCompass。該模型整合了人類和小鼠超過1.26億個單細胞的轉錄組數據、融合了包括啟動子序列和基因共表達關係等四種先驗知識、基礎模型參數量達到1.3億,實現了對基因表達調控規律的全景式學習理解,同時支持細胞狀態變化預測及多種生命過程的精準分析,展現了人工智慧賦能生命科學研究的巨大潛力。

研究以《GeneCompass: Deciphering Universal Gene Regulatory Mechanisms with Knowledge-Informed Cross-Species Foundation Model》為題,發佈在bioRxiv

中國科學院研究團隊發布了兩篇重要論文:首個跨物種生命基礎大模型問世,以及新型細胞命運預測AI模型的發布

論文連結:https://www.biorxiv.org/content/10.1101/2023.09.26.559542v1

#另外,該團隊還同步發布了一個基於遷移學習的基因調控網絡生成模型, CellPolaris,該模型能夠準確識別細胞命運轉換核心因子,並具有轉錄因子擾動模擬能力。

研究以《CellPolaris: Decoding Cell Fate through Generalization Transfer Learning of Gene Regulatory Networks》為題,發佈在bioRxiv上。

中國科學院研究團隊發布了兩篇重要論文:首個跨物種生命基礎大模型問世,以及新型細胞命運預測AI模型的發布

論文連結:https://www.biorxiv.org/content/10.1101/2023.09.25.559244v1

#GeneCompass:首個跨物種生命基礎大模型

中國科學院研究團隊發布了兩篇重要論文:首個跨物種生命基礎大模型問世,以及新型細胞命運預測AI模型的發布

#哺乳動物個體一般包含數萬到數十兆個細胞。儘管個體中的所有細胞都含有相同的基因序列,但是每個細胞的命運和功能卻因其獨特的時空背景而千差萬別。如此精密的生命過程是由複雜的基因表現調控系統所控制

為了增進對生命本質規律的理解,並創新各種重大疾病的診療手段,需要對生命普遍存在的基因調控機制進行深入探索。然而,傳統的研究方法通量低且局限於單一模式生物,無法揭示複雜的基因調控機制

近年來,單細胞組學技術的突破產生了大量不同類型細胞的基因表現譜數據,為解讀基因-基因交互作用提供了數據基礎。同時深度學習的發展,尤其是生成式大模型的出現,可以綜合匯總海量不同細胞狀態下的資料學習非線性調控機制,為生命科學研究帶來了前所未有的機會。

一個跨越物種的生命基礎大模型,包含了1.2億個細胞數量和1.3億個參數

目前,全世界範圍內在單一物種上已獲得的單細胞轉錄組資料規模僅為千萬個級別,難以充分支撐用於解析複雜生命過程的生命基礎大模型訓練。

該團隊收集了不同物種的單細胞轉錄組開源數據,經過篩選、清洗、均一化等預處理流程,建立了目前已知最大規模、包含小鼠和人類的超過1.26億細胞的高質量訓練資料集scCompass-126M;採用了基於Transformer自註意力機制的深度學習架構,可捕捉不同基因之間在不同細胞背景下的長程動態關聯關係,模型參數規模達1.3億。為實現針對生命過程的高解析度刻畫,GeneCompass首次將基因編號和表現量進行雙重編碼,以便能夠有效、靈敏地提取基因之間的關聯關係。這使得GeneCompass對各種特定條件,如細胞類型和擾動狀態的基因-基因交互作用提供更精準分析。

預訓練時嵌入先驗知識可有效提升模型表現

模型透過有效整合啟動子序列、已知基因調控網絡、基因家族資訊與基因共表達關係四種生物學先驗知識,加入人類註釋資訊編碼,提升了對生物資料間複雜特徵關聯關係的理解。透過訓練整合不同物種的資料資訊及先驗知識,GeneCompass有望提高傳統生物學研究的效率和精準性為尚無法突破的複雜生命科學難題帶來新的切入點。

中國科學院研究團隊發布了兩篇重要論文:首個跨物種生命基礎大模型問世,以及新型細胞命運預測AI模型的發布

GeneCompass融入四種生物學先驗知識。

規模效應提示模型訓練捕捉生物演化的保守規律

團隊發現,針對大規模跨物種資料進行預訓練的模型,在單一物種的子任務上符合尺度定律(scaling law):即較大規模的多物種預訓練資料能夠產生更好的預訓練表徵,並進一步提高下游任務的表現。這項發現表明,物種之間存在保守的基因調控規律,而這些規律可以被預訓練模型所學習和理解。同時,這也意味著隨著物種和資料的擴展,模型效能可望不斷提升

中國科學院研究團隊發布了兩篇重要論文:首個跨物種生命基礎大模型問世,以及新型細胞命運預測AI模型的發布

#增加跨物種資料規模可提升模型效能

#多任務表現優勢展現基礎大模型強大泛化能力

作為迄今為止最大規模的、具有知識嵌入的跨物種預訓練生命基礎大模型,GeneCompass可實現多個跨物種下游任務的遷移學習,並在細胞類型註釋、定量基因擾動預測、藥物敏感性分析等方面,相比已有方法取得更優性能。這充分展示了基於多物種無標註大數據預訓練,再利用不同子任務數據進行模型微調的策略優勢,有望成為實現基因-細胞特徵相關聯的各種生物問題分析預測的通用解決方案。

中國科學院研究團隊發布了兩篇重要論文:首個跨物種生命基礎大模型問世,以及新型細胞命運預測AI模型的發布

細胞極化:遷移學習解碼基因調控網絡,預測細胞命運變化

利用遷移學習產生細胞特異的基因調控網絡

團隊也開發了一套基於泛化遷移學習的基因調控網絡建構AI模型,稱為CellPolaris。模型首先整理數百套匹配細胞場景下的轉錄組及染色質可及性數據,建構高品質的基因調控網絡,接著透過泛化遷移學習模型,僅使用轉錄組數據產生更多細胞場景下的基因調控網路。進而利用產生的高可信度基因調控網絡,開發了細胞命運轉換核心轉錄因子識別工具以及基於機率圖模型的轉錄因子擾動模擬工具。此模型能有效辨識細胞命運轉換核心因子,並實現轉錄因子擾動的模擬,在基因調控機制解析及致病基因發現方面均有重要應用價值。





##模擬胎盤發育過程中轉錄因子敲除對細胞命運的影響

CellPolaris模型產生的基因調控網絡,提供了豐富的分子相互作用信息,可以作為深度學習大模型的先驗知識。而深度學習大模型所產生的低維度嵌入向量,將為基因調控機制解析及致病基因發現提供重要資訊。

上述兩項研究由「指南針聯盟」團隊完成,「指南針聯盟」團隊目前主要由中國科學院動物研究所聯合電腦網路資訊中心,自動化研究所,計算技術研究所,數學與系統科學研究院等組成,聯盟的目標是建立數智驅動的生命科學研究新範式,解析生命的本質法則。

人工智慧 

×
 [ 生物神經科學 數學物理化學材料]
############################################################################################################################################################### # ##############

以上是中國科學院研究團隊發布了兩篇重要論文:首個跨物種生命基礎大模型問世,以及新型細胞命運預測AI模型的發布的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:机器之心。如有侵權,請聯絡admin@php.cn刪除
Laravel入门教程:从零开始学习最流行的PHP框架Laravel入门教程:从零开始学习最流行的PHP框架Aug 13, 2023 pm 01:21 PM

Laravel入门教程:从零开始学习最流行的PHP框架引言:Laravel是当前最流行的PHP框架之一,它易于上手、功能强大且拥有活跃的开发社区。本文将带您从零开始学习Laravel框架,并提供一些实例代码,帮助您更好地理解和掌握这个强大的工具。第一步:安装Laravel在开始之前,您需要在计算机上安装Laravel框架。最简单的方法是通过Composer进

VUE3入门实例:制作一个简单的图片裁剪器VUE3入门实例:制作一个简单的图片裁剪器Jun 15, 2023 pm 08:45 PM

Vue.js是一款流行的JavaScript前端框架,目前已经推出了最新的版本——Vue3,新版Vue在性能、体积以及开发体验上均有所提升,受到越来越多的开发者欢迎。本文将介绍如何使用Vue3制作一个简单的图片裁剪器。首先,我们需要创建一个Vue项目并安装所需的插件。可以使用VueCLI来创建项目,也可以手动搭建。这里我们以使用VueCLI的方式为例:#

从入门到精通:掌握go-zero框架从入门到精通:掌握go-zero框架Jun 23, 2023 am 11:37 AM

Go-zero是一款优秀的Go语言框架,它提供了一整套解决方案,包括RPC、缓存、定时任务等功能。事实上,使用go-zero建立一个高性能的服务非常简单,甚至可以在数小时内从入门到精通。本文旨在介绍使用go-zero框架构建高性能服务的过程,并帮助读者快速掌握该框架的核心概念。一、安装和配置在开始使用go-zero之前,我们需要安装它并配置一些必要的环境。1

快速入门:使用Go语言函数实现简单的数据可视化功能快速入门:使用Go语言函数实现简单的数据可视化功能Aug 02, 2023 pm 04:25 PM

快速入门:使用Go语言函数实现简单的数据可视化功能随着数据的快速增长和复杂性的提高,数据可视化成为了数据分析和数据表达的重要手段。在数据可视化中,我们需要使用合适的工具和技术来将数据转化为易读且易理解的图表或图形。Go语言作为一种高效且易于使用的编程语言,在数据科学领域也有着广泛的应用。本文将介绍如何使用Go语言函数来实现简单的数据可视化功能。我们将使用Go

如何快速入门Beego开发框架?如何快速入门Beego开发框架?Jun 22, 2023 am 09:15 AM

Beego是一个基于Go语言的开发框架,它提供了一套完整的Web开发工具链,包括路由、模板引擎、ORM等。如果你想快速入门Beego开发框架,以下是一些简单易懂的步骤和建议。第一步:安装Beego和Bee工具安装Beego和Bee工具是开始学习Beego的第一步。你可以在Beego官网上找到详细的安装步骤,也可以使用以下命令来安装:gogetgithub

PHP中的人脸识别入门指南PHP中的人脸识别入门指南Jun 11, 2023 am 09:16 AM

随着科技的不断发展,人脸识别技术也越来越得到了广泛的应用。而在Web开发领域中,PHP是一种被广泛采用的技术,因此PHP中的人脸识别技术也备受关注。本文将介绍PHP中的人脸识别入门指南,帮助初学者快速掌握这一领域。一、什么是人脸识别技术人脸识别技术是一种基于计算机视觉技术的生物特征识别技术,其主要应用领域包括安防、金融、电商等。人脸识别技术的核心就是对人脸进

Laravel 8:快速入门指南Laravel 8:快速入门指南Jun 20, 2023 am 09:37 AM

Laravel是一个流行的PHP框架,它提供了许多工具和功能,以使开发Web应用程序变得更加轻松和快速。Laravel8已经发布,它带来了许多新的功能和改进。在本文中,我们将学习如何快速入门Laravel8。安装Laravel8要安装Laravel8,您需要满足以下要求:PHP>=7.3MySQL>=5.6或MariaDB>=10.

PHP摄像头调用教程:快速入门指南PHP摄像头调用教程:快速入门指南Jul 29, 2023 pm 11:13 PM

PHP摄像头调用教程:快速入门指南引言:在当今的数字时代,摄像头成为了人们生活中不可或缺的设备之一。在Web开发中,如何通过PHP调用摄像头,实现视频流的显示和处理,成为了很多开发者关注的问题。本文将为大家介绍如何快速入门使用PHP来调用摄像头。一、环境准备要使用PHP调用摄像头,我们需要准备以下环境:PHP:确保已经安装了PHP,并且安装了相应的扩展库,如

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
2 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
2 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
2 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

VSCode Windows 64位元 下載

VSCode Windows 64位元 下載

微軟推出的免費、功能強大的一款IDE編輯器

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

EditPlus 中文破解版

EditPlus 中文破解版

體積小,語法高亮,不支援程式碼提示功能

MantisBT

MantisBT

Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

mPDF

mPDF

mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),