編輯 | 白菜葉
對於結構生物學家 Lucas Farnung 來說,沒有比單一受精卵如何發育成一個功能齊全的人類更令人著迷的問題了。他正努力在最小尺度上研究這個過程:數萬億個原子必須同步工作才能實現這一過程。
「我看不出解決5,000 塊拼圖和我們在實驗室進行的研究有什麼大區別。」哈佛醫學院布拉瓦尼克研究所(Blavatnik Institute at Harvard Medical School)細胞生物學助理教授Farnung 說,「我們試著從視覺上弄清楚這個過程是什麼樣子,然後我們就可以形成關於它如何運作的想法。什麼組織類型(例如,變成肝臟或皮膚)很大程度上是由基因表現決定的,基因表現決定了哪些基因被開啟和關閉。
基因表現受轉錄過程調控,而轉錄正是 Farnung 研究的重點。在轉錄過程中,分子機器讀取 DNA 內儲存的遺傳藍圖中所包含的指令,並產生執行指令的分子 RNA。其他分子機器讀取 RNA 並利用這些資訊製造為身體幾乎所有活動提供能量的蛋白質。
Farnung 研究負責轉錄的分子機器的結構和功能。
在接受媒體採訪時,Farnung 討論了他的工作以及機器學習如何加速該領域的研究。
Q:你的研究試圖回答的核心問題是什麼?
Farnung:我總是說,我們感興趣的是最小的邏輯問題。人類基因組幾乎存在於每個細胞中,如果你把組成基因組的 DNA 拉長,它的長度大約是兩米,也就是六英尺半。但這種兩公尺長的分子必須塞進細胞核裡,而細胞核只有幾微米大小。
這就相當於把一條從波士頓延伸到康乃狄克州紐黑文(約 150 英里)的魚線塞進一個足球裡。
為了實現這一點,我們的細胞將 DNA 壓縮成一種稱為染色質的結構,但分子機器無法再存取 DNA 上的基因組資訊。
這產生了衝突,因為 DNA 需要足夠緊湊才能容納在細胞核內,但分子機器必須能夠存取 DNA 上的基因組資訊。
我們特別感興趣的是觀察 RNA 聚合酶 II 這種分子機器如何獲取基因組資訊並將 DNA 轉錄為 RNA 的過程。
Q:你們團隊使用什麼技術來視覺化分子機器?
Farnung:我們的一般方法是從細胞中分離出分子機器,然後使用特定類型的顯微鏡或 X 射線束對其進行觀察。
為此,我們將編碼感興趣的人類分子機器的遺傳物質引入昆蟲或細菌細胞中,這樣細胞就會大量製造這種機器。
然後,我們使用純化技術將機器從細胞中分離出來,以便我們能夠單獨研究它。
然而,這很複雜,因為我們通常不只是對單一分子機器感興趣,我們也稱之為蛋白質。
有數千種蛋白質相互作用來調節轉錄,因此我們必須重複這個過程數千次才能了解這些蛋白質-蛋白質相互作用。
Q:人工智慧開始滲透到基礎生物學的各個層面。它是否改變了你進行結構生物學研究的方式?
Farnung:在過去的三、四十年裡,我所在領域的研究一直是個繁瑣的過程。一個博士生的科學研究生涯可能只專注於研究一兩種蛋白質,而要了解蛋白質在細胞中的相互作用,則所需的工作量是數千名學生都未必能完成的。
然而,在過去的兩三年裡,我們越來越多地尋求透過計算方法來預測蛋白質交互作用。 Google DeepMind 發布了可以預測蛋白質折疊的機器學習模型 AlphaFold,這是一個重大突破。重要的是,蛋白質的折疊方式決定了它們的功能和相互作用。
我們現在正在使用人工智慧來預測數以萬計的蛋白質-蛋白質相互作用,其中許多相互作用以前從未被實驗描述過。實際上,並非所有這些相互作用都發生在細胞內部,但我們可以透過實驗室實驗來驗證它們。
這非常令人興奮,因為它確實加速了我們的科學研究。當我回顧我的博士學位時,前三年基本上是失敗的——我沒能發現任何蛋白質之間的相互作用。
現在,有了這些計算預測,我實驗室的博士生或博士後可以非常有信心,實驗室驗證蛋白質-蛋白質相互作用的實驗將會成功。我稱之為分子生物學的強化版——但合法——因為我們現在可以更快地找到我們想要回答的實際問題。
Q:除了效率和速度之外,人工智慧還在哪些方面重塑你的領域?
Farnung:一個令人興奮的變化是,我們現在可以以無偏見的方式測試人體中的任何蛋白質與任何其他蛋白質,看看它們是否有可能相互作用。我們領域的機器學習工具正在造成類似個人電腦對社會造成的破壞。
當我剛成為研究員時,人們正在使用 X 射線晶體學來揭示單個蛋白質的結構——這是一項美妙的高分辨率技術,但可能需要很多年的時間。後來,在我攻讀博士和博士後期間,低溫電子顯微鏡(簡稱低溫電子顯微鏡)應運而生。這項技術讓我們能夠以高解析度觀察更大、更動態的蛋白質複合物。
過去 10 年,低溫電子顯微鏡讓我們對生物學的理解取得了巨大進展,並加速了藥物開發。
我以為自己很幸運能參與低溫電子顯微鏡所帶來的所謂解析度革命。但現在,感覺蛋白質預測的機器學習正在帶來第二次革命,這對我來說真是太神奇了,讓我想知道我們還會看到多少加速。
據我估計,我們現在的研究速度可能比 10 年前快 5 到 10 倍。看看機器學習如何改變我們在未來 10 年進行生物研究的方式將會很有趣。
當然,我們必須小心謹慎地管理這些工具,但我很高興能夠以 10 倍的速度找到我思考已久的問題的答案。
Q:除了實驗室之外,你的工作還有哪些下游應用?
Farnung:我們正在從基礎層面了解人體內的生物學工作原理,但我們始終堅信,了解基本的生物學機制可以幫助我們開發出針對各種疾病的有效治療方法。例如,事實證明分子機器對 DNA 染色質結構的破壞是許多癌症的主要驅動因素之一。一旦我們弄清楚了這些分子機器的結構,我們就能了解改變幾個原子來複製導致癌症的突變的效果,此時我們就可以開始設計針對蛋白質的藥物。
我們剛剛與 HMS 治療計劃合作啟動了一個項目,該項目正在研究染色質重塑劑,這是一種在前列腺癌中發生嚴重突變的蛋白質。我們最近獲得了這種蛋白質的結構,並正在進行虛擬篩選,以查看哪些化合物可以與其結合。
我們希望能夠設計出一種抑制這種蛋白質的化合物,並有可能開發成一種可以減緩前列腺癌進展的成熟藥物。我們也在研究與自閉症等神經發育障礙有關的蛋白質。機器學習可以在這方面為我們提供幫助,因為我們用來預測蛋白質結構和蛋白質間相互作用的工具也可以預測小分子化合物如何與蛋白質結合。
Q:說到合作,跨研究領域和學科的工作對您的研究有何重要性?
Farnung:合作對我的研究來說非常重要。生物學領域已經變得非常複雜,有這麼多不同的研究領域,以至於不可能了解一切。透過合作,我們可以讓具有不同專業知識的人聚在一起研究重要的生物學問題,例如分子機器如何存取人類基因組。
我們與哈佛醫學院的其他研究人員在多個不同層面展開合作。有時,我們會利用結構專業知識來支援其他實驗室的工作。有時,我們已經解決了某種蛋白質的結構,但我們需要合作來了解該蛋白質在更廣泛的細胞環境中的作用。我們也與使用其他分子生物學方法的實驗室合作。合作對於推動進步和更好地理解生物學至關重要。
相關內容:https://hms.harvard.edu/news/how-machine-learning-propelling-structural-biology
The above is the detailed content of How does ML advance structural biology? Harvard scientists use AI to study human development at the smallest scale. For more information, please follow other related articles on the PHP Chinese website!