AI又立功了。
這次一項新的AI機器學習演算法“Ikarus”,可破解癌細胞和正常細胞的基因特徵差異。
這項研究由MDC生物資訊學家Altuna Akalin團隊完成,並發表在Nature子刊「Genome Biology」。
#論文網址:https://genomebiology.biomedcentral.com/ articles/10.1186/s13059-022-02683-1#Sec8
此外,負責本研究的機構MDC(Max Delbrück center)或德國四大研究機構之一的亥姆霍茲聯合會的16個研究中心之一。
既然這麼大來頭,那這份研究為啥重磅?
從浩如煙海的資料集裡篩選出一種「共通的特徵」,人類肯定比不上AI。
而要將癌細胞和正常細胞區分開來,就需要篩選出它們之間的共通特徵。
這次MDC的研究團隊開發的Ikarus發現了腫瘤細胞中的共通模式(Pattern),它由一系列基因組特徵組成,並且常見於各種類型的癌症。
此外,演算法還檢測到了從未和癌症掛鉤的基因種類。
於是研究團隊提出了一個簡單的問題:
是否有可能製作一個分類器,將腫瘤細胞與多種癌症類型的正常細胞正確區分開來?
於是就有了Ikarus的誕生。它包括兩個步驟:
1、透過整合多個經過專業註釋的單細胞資料集,以基因集的形式發現全面的腫瘤細胞特徵;
2、訓練穩健的邏輯回歸分類器以嚴格區分腫瘤和正常細胞,然後使用定制的細胞-細胞網絡進行細胞標籤的基於網絡的傳播。
團隊負責人Altuna Akalin說:
#為開發一種強大、靈敏且可重複的電腦腫瘤細胞分選儀,我們已經在使用不同定序技術獲得的各種癌症類型的多個單細胞數據集上測試了Ikarus,以確定它適用於不同實驗環境。
論文的第一作者Jan Dohmen表示,在專家已經清楚地區分健康細胞和在癌細胞的情況下,獲得合適的訓練資料是一項重大挑戰。
單細胞定序資料集通常很冗餘。
這意味著它們包含的關於單一細胞分子特徵的資訊不是很精確,因為在每個細胞中檢測到不同數量的基因,或者因為樣本的處理方式並不總是相同。
Dohmen和該研究的共同負責人Vedran Franke博士說,
我們篩選了無數出版物並聯繫了相當多的研究小組,以獲得足夠的資料集。團隊最終選擇來自肺癌和結直腸癌細胞的數據來訓練演算法,然後再將其應用於其他類型腫瘤的數據集。
在訓練階段,Ikarus必須找到一個「特徵基因清單」,然後用於對細胞進行分類。
我們嘗試並改進了各種方法,Ikarus最終使用兩個清單:一個用於癌症基因,另一個用於來自其他細胞的基因,弗蘭克解釋。
經過訓練後,演算法就能夠區分其他類型癌症中的健康細胞和腫瘤細胞,例如肝癌或神經母細胞瘤患者的組織樣本。
而在其他樣本中的結果令人雀躍,成功率出奇地高,最高可達99%。
「我們沒想到會有一個共同的特徵可以如此精確地定義不同類型癌症的腫瘤細胞」,Akalin說。
「但我們仍然不能說這種方法是否適用於所有類型的癌症」,Dohmen補充道。
為了將Ikarus變成可靠的癌症診斷工具,研究人員現在希望在其他類型的腫瘤上進行測試。
在最初的測試中,Ikarus已證明該方法還可以將其他類型(和某些亞型)的細胞與腫瘤細胞區分開來,不僅限於腫瘤細胞檢測。
它可用來偵測任何細胞狀態,例如細胞類型,唯一的要求是細胞狀態至少存在於兩個獨立的實驗中。
Akalin說:
我們希望使這種方法更加全面,進一步發展它,以便它可以區分活檢中所有可能的細胞類型。
在空間定序資料集上應用自動腫瘤分類可以直接註釋組織學樣本,從而促進自動化數位病理學。
在醫院,病理學家往往只在顯微鏡下檢查腫瘤的組織樣本,以識別各種細胞類型。這是一項費時費力的工作。
有了Ikarus,這一步驟有一天可能會成為一個完全自動化的過程。
此外,Akalin指出,這些數據可用於得出有關腫瘤直接環境的結論。這可以幫助醫生選擇最好的療法。對於癌組織和微環境的組成,通常顯示某種治療或藥物是否有效。
此外,人工智慧也可能有助於開發新的藥物。
「Ikarus讓我們能夠識別出可能導致癌症的基因,然後可以使用新的治療劑來靶向這些分子結構」Akalin說。
以上是Nature子刊:AI演算法破解癌細胞基因特徵,準確率可達99%!的詳細內容。更多資訊請關注PHP中文網其他相關文章!