首頁  >  文章  >  科技週邊  >  中國科學院團隊利用AI大模型訓練技術解決同步輻射海量資料處理

中國科學院團隊利用AI大模型訓練技術解決同步輻射海量資料處理

WBOY
WBOY轉載
2023-11-20 15:43:001285瀏覽

中國科學院團隊利用AI大模型訓練技術解決同步輻射海量資料處理

沒有改變原始意思的情況下,需要重新寫成中文的句子是:編輯| X

X 射線疊層相干衍射成像(X-ray ptychography)是一種理論上能夠實現衍射極限解析度的相干衍射成像技術,已廣泛應用於材料、生命、半導體、能源等多種科學領域研究。

新一代同步輻射光源可提供高相干度和高亮度的X射線,推動相干成像技術向高通量多維度方向發展,使得ptychography 在大體積樣本的精細結構研究和功能表徵方面具有極佳的應用前景。然而,新的實驗模式與應用場景帶來了海量數據在線解析的技術挑戰,單次實驗的原始衍射圖譜數據量可達PB 量級,成為第四代同步輻射光源上科學實驗的最大數據源之一。此外,其相位恢復問題也是同步輻射資料處理領域最為困難的問題之一。

人工智慧方法作為大數據分析和處理的利器,保持了傳統演算法的優勢,並且突出體現了在海量實驗數據線上分析方面的能力。

作為一種相對耗時的掃描成像技術,ptychography 的主要目標之一是實現即時分析。但是目前傳統的 ptychography 重建演算法很難實現線上重建的需求。研究團隊基於卷積神經網絡,提出了分組卷積的神經網路解碼器結構,使得網路的訓練以及重建速度更快,重建效果更好。神經網路可以學習從衍射圖到真實物體的映射過程。由於未來光源資料量體與品質的進一步提升,網路規模、參數量、訓練資料量將進一步增加,為網路的效能以及泛化能力帶來提升。

中國科學院高能量同步輻射光源(HEPS)光束線軟體團隊開發了一個名為PtyNet的捲積神經網路框架,用於從X射線Ptychography實驗數據中恢復出物體的精確投影。在強大的運算群集的支援下,PtyNet可以快速地從同步輻射光源取得資料進行訓練,並迅速地對使用者的實驗資料進行影像重建

中國科學院團隊利用AI大模型訓練技術解決同步輻射海量資料處理

圖1

該研究題為「透過對大型預訓練深度學習模型進行精調的高效ptychography重建策略」,於2023年11月9日在iScience雜誌上發表

中國科學院團隊利用AI大模型訓練技術解決同步輻射海量資料處理

#論文連結:
https://doi.org/10.1016/j.isci.2023.108420

由於不同實驗數據所恢復的目標物不同,團隊也引入了微調策略對網路參數進行進一步優化。無監督的微調策略使網路擁有更強大的泛化能力和更高的重建解析度。同步輻射光源可以為網路提供足夠的資料量以獲得一個更強大的預訓練模型。即使對於一個未出現在網路內的新樣品,網路也可以成功地進行重建(圖2)。

中國科學院團隊利用AI大模型訓練技術解決同步輻射海量資料處理

需要重寫的內容是:第二張圖片

未來,該團隊將繼續進行將卷積神經網路應用於X 光相干成像領域的研究。利用微調以及大模型的策略,發展出一個相干成像的大模型。模型本身可以識別出不同的成像任務並且給出恢復結果。使用者只需輸入少量線站參數即可進行即時重建。

面對未來EB 量級數據的挑戰,HEPS 正在積極推動「大型科學軟體框架AI for Science」的創新科學研究範式,並建立了一支專業的科學軟體團隊,開展實驗控制、大資料擷取與處理、人工智慧、前沿學科演算法、多尺度影像處理與資料探勘等跨領域研究,為建構「智慧光源」奠定了基礎。

以上是中國科學院團隊利用AI大模型訓練技術解決同步輻射海量資料處理的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:jiqizhixin.com。如有侵權,請聯絡admin@php.cn刪除