



Pengarang | Pasukan Penyelidikan Pelbagai Disiplin Akademi Sains China
Editor | ScienceAI
dipanggil manusia abad ke-20 Projek Genom Manusia, salah satu daripada tiga projek saintifik utama, telah memulakan analisis mendalam tentang misteri kehidupan. Oleh kerana sifat proses kehidupan yang berbilang dimensi dan sangat dinamik, adalah sukar bagi kaedah penyelidikan eksperimen tradisional untuk menguraikan secara sistematik dan tepat undang-undang lazim yang mendasari kod genetik penemuan data genetik.
Pada masa ini, teknologi kecerdasan buatan dengan model besar sebagai teras telah mencetuskan revolusi dalam bidang seperti penglihatan komputer dan pemahaman bahasa semula jadi, menunjukkan pemahaman yang mendalam tentang data dan pengetahuan, dan dijangka akan digunakan dalam bidang penyelidikan sains hayat , secara sistematik dan tepat menghurai undang-undang lazim asas kod genetik
Baru-baru ini, "Konsortium Xcompass" (Konsortium Xcompass) yang terdiri daripada pasukan penyelidikan antara disiplin berbilang disiplin Cina Akademi Sains telah mencapai pencapaian hebat dalam kecerdasan buatan memperkasakan penyelidikan sains hayat Satu kejayaan penting, model asas hidupan berskala besar berskala besar yang pertama di dunia - GeneCompass telah berjaya dibina. Model ini menyepadukan data transkrip lebih daripada 126 juta sel tunggal manusia dan tikus, mengintegrasikan empat jenis pengetahuan sedia ada termasuk jujukan promoter dan hubungan ekspresi bersama gen, dan mempunyai jumlah parameter model asas sebanyak 130 juta, merealisasikan ramalan gen ungkapan. Pembelajaran panoramik dan pemahaman undang-undang kawal selia serentak menyokong ramalan perubahan keadaan sel dan analisis yang tepat bagi pelbagai proses kehidupan, menunjukkan potensi besar kecerdasan buatan dalam memperkasakan penyelidikan sains hayat.
Kajian ini bertajuk "GeneCompass: Mentafsir Mekanisme Pengawalseliaan Gen Universal dengan Model Asas Silang Spesies Bermaklumat Pengetahuan" dan telah diterbitkan dalam 🎜#bioRxis #superior.
https://www.biorxiv.org/content/10.1101/2023.09.22.5595# 🎜🎜# Selain itu, pasukan itu juga pada masa yang sama mengeluarkan model penjanaan rangkaian pengawalseliaan gen berdasarkan pembelajaran pemindahan, CellPolaris, yang boleh mengenal pasti dengan tepat faktor teras untuk penukaran nasib sel dan mempunyai keupayaan untuk mensimulasikan gangguan faktor transkripsi.
Kajian ini bertajuk "CellPolaris: Decoding Cell Fate through Generalization Transfer Learning of Gene Regulatory Networks
" dan diterbitkan padabioRxiv#🎜🎜
Pautan kertas:https://www.biorxiv.org/content/10.1101/2023.09.24.5592.592. 🎜🎜#
#🎜 Individu mamalia umumnya merangkumi puluhan ribu hingga puluhan trilion sel. Walaupun semua sel dalam individu mengandungi urutan genetik yang sama, nasib dan fungsi setiap sel berbeza secara meluas disebabkan oleh konteks spatiotemporalnya yang unik. Proses kehidupan yang tepat seperti ini dikawal oleh sistem peraturan ekspresi gen yang kompleksUntuk meningkatkan pemahaman undang-undang penting kehidupan dan menginovasi diagnosis dan rawatan pelbagai penyakit utama, adalah perlu untuk mengawal selia. gen yang ada di mana-mana dalam kehidupan diterokai secara mendalam. Walau bagaimanapun, kaedah penyelidikan tradisional mempunyai daya pemprosesan yang rendah dan terhad kepada organisma model tunggal, dan tidak dapat mendedahkan mekanisme pengawalseliaan gen yang kompleks
Dalam beberapa tahun kebelakangan ini, penemuan dalam teknologi omik sel tunggal telah menghasilkan ekspresi gen dalam skala besar. bilangan jenis sel yang berbeza Data spektrum menyediakan asas data untuk mentafsir interaksi gen-gen. Pada masa yang sama, pembangunan pembelajaran mendalam, terutamanya kemunculan model generatif yang besar, boleh meringkaskan secara komprehensif mekanisme kawal selia tak linear bagi sejumlah besar data dalam keadaan sel yang berbeza, membawa peluang yang belum pernah berlaku sebelum ini kepada penyelidikan sains hayat.
Model besar asas kehidupan merentas spesies, termasuk 120 juta nombor sel dan 130 juta parameter
Pada masa ini, di seluruh dunia skala data transkriptom sel tunggal yang diperoleh pada satu spesies hanya berpuluh juta, yang sukar untuk menyokong sepenuhnya latihan model besar asas kehidupan untuk menganalisis proses kehidupan yang kompleks.Pasukan mengumpul data transkriptom sel tunggal sumber terbuka bagi spesies yang berbeza, dan selepas proses pra-pemprosesan seperti penapisan, pembersihan dan normalisasi, mewujudkan data latihan berkualiti tinggi terbesar yang diketahui, termasuk lebih daripada 126 juta sel pada tikus dan manusia . Koleksi scCompass-126M menggunakan seni bina pembelajaran mendalam berdasarkan mekanisme perhatian kendiri Transformer, yang boleh menangkap korelasi dinamik jangka panjang antara gen yang berbeza dalam latar belakang sel yang berbeza, dan saiz parameter model mencapai 130 juta. Untuk mencapai pencirian proses hayat beresolusi tinggi, GeneCompass mengekod nombor gen dan tahap ekspresi buat kali pertama, membolehkan pengekstrakan korelasi yang berkesan dan sensitif antara gen. Ini membolehkan GeneCompass menyediakan analisis yang lebih tepat bagi interaksi gen-gen di bawah pelbagai keadaan tertentu, seperti jenis sel dan keadaan gangguan.
Membenamkan pengetahuan sedia ada semasa pra-latihan boleh meningkatkan prestasi model dengan berkesan
Model ini menambah manusia dengan menyepadukan empat pengetahuan sedia ada biologi secara berkesan: urutan promoter, rangkaian pengawalseliaan gen yang diketahui, maklumat keluarga gen dan hubungan ekspresi bersama gen Maklumat anotasi pengekodan meningkatkan pemahaman tentang korelasi ciri kompleks antara data biologi. Melalui latihan dan penyepaduan maklumat data dan pengetahuan terdahulu tentang spesies yang berbeza, GeneCompass dijangka meningkatkan kecekapan dan ketepatan penyelidikan biologi tradisional dan membawa pintu masuk baharu kepada masalah sains hayat yang kompleks yang belum dapat dipecahkan.
Kesan skala mendorong latihan model untuk menangkap undang-undang konservatif evolusi biologi
Pasukan mendapati model yang telah dilatih pada data silang spesies berskala besar mematuhi undang-undang penskalaan pada sub-tugas satu spesies : iaitu, lebih besar data pra-latihan Pelbagai spesies pada skala boleh menghasilkan perwakilan pra-latihan yang lebih baik dan meningkatkan lagi prestasi pada tugas hiliran. Dapatan ini menunjukkan bahawa terdapat corak peraturan gen yang dipelihara antara spesies, dan corak ini boleh dipelajari dan difahami oleh model yang telah dilatih. Pada masa yang sama, ini juga bermakna bahawa dengan pengembangan spesies dan data, prestasi model dijangka terus bertambah baik
Kelebihan prestasi pelbagai tugas menunjukkan keupayaan generalisasi berkuasa model besar asas
Sebagai model hayat asas pra-terlatih silang terbesar dengan pembenaman pengetahuan setakat ini, GeneCompass boleh melaksanakan pembelajaran pemindahan untuk pelbagai tugas hiliran silang spesies, dan boleh digunakan dalam jenis sel anotasi, ramalan gangguan gen kuantitatif, analisis sensitiviti dadah, dll. Dari segi prestasi, ia mencapai prestasi yang lebih baik daripada kaedah sedia ada. Ini menunjukkan sepenuhnya kelebihan strategik pra-latihan berdasarkan data besar berbilang spesies tanpa label dan kemudian menggunakan data sub-tugas yang berbeza untuk penalaan halus model Ia dijangka menjadi penyelesaian universal untuk menganalisis dan meramalkan pelbagai masalah biologi yang berkaitan dengan gen -ciri sel.
Polarisasi sel: Pembelajaran pemindahan menyahkod rangkaian pengawalseliaan gen dan meramalkan perubahan nasib sel
Menggunakan pembelajaran pemindahan untuk menjana rangkaian pengawalseliaan gen khusus sel
Set pembelajaran berpasukan yang dibangunkan juga berasaskan pemindahan Rangkaian pengawalseliaan gen membina model AI yang dipanggil CellPolaris. Model ini mula-mula menyusun ratusan set data kebolehcapaian transkriptom dan kromatin dalam memadankan senario sel untuk membina rangkaian kawal selia gen berkualiti tinggi, dan kemudian menggunakan model pembelajaran pemindahan umum untuk menjana lebih banyak gen dalam senario sel menggunakan hanya rangkaian kawal selia transkrip . Kemudian, menggunakan rangkaian pengawalseliaan gen berkeyakinan tinggi yang dihasilkan, kami membangunkan alat untuk mengenal pasti faktor transkripsi teras untuk peralihan nasib sel dan alat simulasi gangguan faktor transkripsi berdasarkan model grafik kebarangkalian. Model ini secara berkesan boleh mengenal pasti faktor teras penukaran nasib sel dan merealisasikan simulasi gangguan faktor transkripsi Ia mempunyai nilai aplikasi penting dalam analisis mekanisme pengawalseliaan gen dan penemuan gen penyebab penyakit.
. Maklumat interaksi boleh digunakan sebagai pengetahuan sedia ada untuk model pembelajaran mendalam yang besar. Vektor benam berdimensi rendah yang dihasilkan oleh model besar pembelajaran mendalam akan memberikan maklumat penting untuk analisis mekanisme pengawalseliaan gen dan penemuan gen penyebab penyakit.[Biologi Materials Neurosciences
Atas ialah kandungan terperinci Pasukan penyelidik Akademi Sains China mengeluarkan dua kertas penting: pelepasan model berskala besar pertama asas kehidupan merentas spesies, dan pengeluaran model AI baharu untuk ramalan nasib sel. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Laravel入门教程:从零开始学习最流行的PHP框架引言:Laravel是当前最流行的PHP框架之一,它易于上手、功能强大且拥有活跃的开发社区。本文将带您从零开始学习Laravel框架,并提供一些实例代码,帮助您更好地理解和掌握这个强大的工具。第一步:安装Laravel在开始之前,您需要在计算机上安装Laravel框架。最简单的方法是通过Composer进

Vue.js是一款流行的JavaScript前端框架,目前已经推出了最新的版本——Vue3,新版Vue在性能、体积以及开发体验上均有所提升,受到越来越多的开发者欢迎。本文将介绍如何使用Vue3制作一个简单的图片裁剪器。首先,我们需要创建一个Vue项目并安装所需的插件。可以使用VueCLI来创建项目,也可以手动搭建。这里我们以使用VueCLI的方式为例:#

Go-zero是一款优秀的Go语言框架,它提供了一整套解决方案,包括RPC、缓存、定时任务等功能。事实上,使用go-zero建立一个高性能的服务非常简单,甚至可以在数小时内从入门到精通。本文旨在介绍使用go-zero框架构建高性能服务的过程,并帮助读者快速掌握该框架的核心概念。一、安装和配置在开始使用go-zero之前,我们需要安装它并配置一些必要的环境。1

快速入门:使用Go语言函数实现简单的数据可视化功能随着数据的快速增长和复杂性的提高,数据可视化成为了数据分析和数据表达的重要手段。在数据可视化中,我们需要使用合适的工具和技术来将数据转化为易读且易理解的图表或图形。Go语言作为一种高效且易于使用的编程语言,在数据科学领域也有着广泛的应用。本文将介绍如何使用Go语言函数来实现简单的数据可视化功能。我们将使用Go

Beego是一个基于Go语言的开发框架,它提供了一套完整的Web开发工具链,包括路由、模板引擎、ORM等。如果你想快速入门Beego开发框架,以下是一些简单易懂的步骤和建议。第一步:安装Beego和Bee工具安装Beego和Bee工具是开始学习Beego的第一步。你可以在Beego官网上找到详细的安装步骤,也可以使用以下命令来安装:gogetgithub

随着科技的不断发展,人脸识别技术也越来越得到了广泛的应用。而在Web开发领域中,PHP是一种被广泛采用的技术,因此PHP中的人脸识别技术也备受关注。本文将介绍PHP中的人脸识别入门指南,帮助初学者快速掌握这一领域。一、什么是人脸识别技术人脸识别技术是一种基于计算机视觉技术的生物特征识别技术,其主要应用领域包括安防、金融、电商等。人脸识别技术的核心就是对人脸进

PHP摄像头调用教程:快速入门指南引言:在当今的数字时代,摄像头成为了人们生活中不可或缺的设备之一。在Web开发中,如何通过PHP调用摄像头,实现视频流的显示和处理,成为了很多开发者关注的问题。本文将为大家介绍如何快速入门使用PHP来调用摄像头。一、环境准备要使用PHP调用摄像头,我们需要准备以下环境:PHP:确保已经安装了PHP,并且安装了相应的扩展库,如

Laravel是一个流行的PHP框架,它提供了许多工具和功能,以使开发Web应用程序变得更加轻松和快速。Laravel8已经发布,它带来了许多新的功能和改进。在本文中,我们将学习如何快速入门Laravel8。安装Laravel8要安装Laravel8,您需要满足以下要求:PHP>=7.3MySQL>=5.6或MariaDB>=10.


Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Versi Mac WebStorm
Alat pembangunan JavaScript yang berguna

Penyesuai Pelayan SAP NetWeaver untuk Eclipse
Integrasikan Eclipse dengan pelayan aplikasi SAP NetWeaver.

MantisBT
Mantis ialah alat pengesan kecacatan berasaskan web yang mudah digunakan yang direka untuk membantu dalam pengesanan kecacatan produk. Ia memerlukan PHP, MySQL dan pelayan web. Lihat perkhidmatan demo dan pengehosan kami.

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Dreamweaver Mac版
Alat pembangunan web visual