2018年8月10日,北京大學組織了一場院內討論,首次提出AI for Science(科學智能)的概念。北京科學智能研究院成立於去年,是全球第一個以「AI for Science」為主題的研究機構。其實,學術界進行相關科研的時間更早,已有一定成果累積。 5月30日,在2023中關村論壇「人工智慧驅動的科學研究論壇」上,多家國內外專家就AI for Science重要性、研究成果及人才培育等議題展開深入研討與交流,並圍繞著人工智慧在生命科學、材料科學等領域的研究進展與突破進行分享,以期進一步挖掘人工智慧在科學研究方面的潛力。
為什麼重要
讓科學研究體系從工坊模式過渡到「安卓」模式
近年來,AI forScience已在國際領先的研究機構中形成共識,各國日趨重視AI for Science的巨大潛力。這種概念在科研機構中流行的原因,要從科研瓶頸說起。
“做科研有兩種方式,數據驅動和基本原理驅動”,中國科學院院士、北京科學智能研究院院長鄂維南詳細介紹這兩種模式下的困難,“數據驅動的瓶頸在於數據收集效率低下、缺乏有效的數據分析方法。至於基本原理驅動,量子力學奠基人之一的保羅·狄拉克一百年前就說過,尋求基本原理這個任務已基本完成,但用基本原理解決實際問題的效率比較低下,因為表達基本原理的數學問題太難了」。
這就造成了結構力學、機械工程、航空航太、電子工程等這些簡單問題可以解決,材料性質和材料設計、藥物、催化劑等複雜問題,只能透過經驗和試誤的辦法解決理論和應用的脫離。
到底簡單又複雜問題的邊界是什麼?鄂維南認為,「是自由度(維數)的個數,也就是說隨著維度增加,問題的複雜度指數跟著增加,這正是AI可以幫助我們解決的。AI為數據驅動模式提供新工具,提高基本原理驅動模型的可靠性和效率,還可以把數據驅動和基本原理驅動結合起來」。
科研的四個基本工具分別是基本原理和資料分析方法、實驗、文獻、算力。
從新型科研基礎建設角度看,「我們做科研的具體操作方式還是小農作坊的方式,比如做實驗,把所有設備買過來,自己從頭到尾做一遍,這個週期非常長而且效率低下”,鄂維南說,有了AI會推動下一代工具建設,從過去的作坊模式過渡到安卓模式,建造一個科研大平台,針對基本原理的一個開源平台,針對文獻的一個知識庫,針對實驗的幾個實驗中心和一個實驗雲平台,針對算力的幾個算力中心和一個算力雲平台。
有什麼成果
#基於大語言模型 向量資料庫的文獻知識庫
#共識有了,工具備受期待。根據美國國家科學基金會統計數據,科學研究人員花費在尋找和消化科技資料的時間佔全部科學研究時間的51%、計畫思考佔8%、實驗研究佔32%、書面總結佔9%。科學研究檢索方式將從查閱式的眼查手翻和基於互聯網的搜尋式檢索階段進入對話式檢索階段。
“但透過對話式大語言模型檢索是有限制的,例如幻覺與偏見、資料滯後、快取限制”,墨奇科技副總裁孟卓飛總結。
基於這些痛點,北京科學智能研究院、中國科學院電腦網路資訊中心、墨奇科技聯合發布了一款基於大模型+向量檢索引擎的文獻知識庫Science Navigator V1.0,該知識庫包括以科學研究人員為代表的使用者層、以GPT4等為代表的模型層、由向量資料庫搜尋引擎所組成的中間層、由文獻和教材等支撐的資料層。模型層由北京科學智能研究院負責,中間層由墨奇科技負責,資料層則由中國科學院電腦網路資訊中心負責。
孟卓飛介紹,ScienceNavigator V1.0支援文字、圖片、表格、公式跨模態辨識處理,科研人員可選用文心一言、LLM等各種大小模型,實現問題解析的最佳效果,第一批已收錄化學、材料、AI等領域近百萬篇論文,未來將擴展至自然、人文學科億級文獻。
怎麼垂直整合:
#建立合作體系+推動AIfor Science進教室
#AI for Science意味著跨學科、大融合,其快速發展將引發科研模式重構,人才、機制、生態、學科交叉等方面還存在許多挑戰和問題,新時代下如何構建垂直整合的科研體系需要群策群力。
黃鐵軍博士是北京智源人工智慧研究院院長,擁有30多年的科學研究經驗,其最深刻的領悟是協同合作。 「無論應用、研發或基礎理論,怎樣形成一個協作體系特別重要。關於AI在科學領域的應用,我們需要思考如何更好地合作,以更高的效率取得成果。例如,基本粒子60多種、原子100多種,常用的數量也是比較明確的,如果組織的好,可以把元素週期表全部刷一遍,逐漸把整個物理、化學、生命的基本模型體系全建起來,大家在上面做研發做應用的效率就會高很多。」
負責本科生、研究生教學工作的北京大學材料科學與工程學院院長助理雷霆強調人才培養,「今年我們學院推出AI for material science(材料科學)系列課程,邀請本學院和北大其他學院及相關專家來上課,我們希望盡快推動AI for Science概念進入課堂,讓學生們跳脫原有的思維方式和工具,盡快使用上新工具。新工具確實幫助加速實驗科學的進步,而且同學和老師的評價都非常好。一些同學和老師提出了新的建議,例如相關內容仍不夠豐富,還需要更多的技術參考資料等。
▲微課堂
#AI for Science之材料科學
#"Materials are the driving force behind almost all technologies," said David Srolovitz, a member of the National Academy of Engineering in the U.S. and the Dean of the Faculty of Engineering at the University of Hong Kong.。基於人工智慧的原子間勢能以接近QM的精度實現大規模原子模擬。 DP (資料處理) 的專業化應用展現了結構金屬和合金的完美晶體和缺陷特性,因此DP是理解許多缺陷特性的唯一途徑。 ”
AI for Science之生命科學
#清華大學卓越訪問教授、美國芝加哥豐田計算技術研究所教授許錦波:「蛋白質是生命的物質基礎,是生命活動的主要承擔者。AI技術適用於各應用場景的蛋白質從頭設計,例如設計減毒的新型蛋白質藥物,用於治療胃癌、大腸癌、肝癌、黑色素瘤等多種類型腫瘤,可設計綠色農藥,保障糧食安全和食品安全。」
AI for Science之原子動力學
#美國科學院院士、普林斯頓大學化學系教授羅伯特·卡爾:「在沒有經驗輸入的情況下,從基礎量子理論對複雜分子過程進行AI建模,可以具有良好/優秀的預測能力,在存在難以用經驗模型描述的化學反應時,這種方法在化學、材料科學和生物學中很重要。有了更精確的參考量子力學模型,系統地提高精度應該是可能的。」
北京商報記者 魏蔚
以上是2023中關村論壇|當AI遇上科學研究,科學家有話可說的詳細內容。更多資訊請關注PHP中文網其他相關文章!

AI增強食物準備 在新生的使用中,AI系統越來越多地用於食品製備中。 AI驅動的機器人在廚房中用於自動化食物準備任務,例如翻轉漢堡,製作披薩或組裝SA

介紹 了解Python函數中變量的名稱空間,範圍和行為對於有效編寫和避免運行時錯誤或異常至關重要。在本文中,我們將研究各種ASP

介紹 想像一下,穿過美術館,周圍是生動的繪畫和雕塑。現在,如果您可以向每一部分提出一個問題並獲得有意義的答案,該怎麼辦?您可能會問:“您在講什麼故事?

繼續使用產品節奏,本月,Mediatek發表了一系列公告,包括新的Kompanio Ultra和Dimenty 9400。這些產品填補了Mediatek業務中更傳統的部分,其中包括智能手機的芯片

#1 Google推出了Agent2Agent 故事:現在是星期一早上。作為AI驅動的招聘人員,您更聰明,而不是更努力。您在手機上登錄公司的儀表板。它告訴您三個關鍵角色已被採購,審查和計劃的FO

我猜你一定是。 我們似乎都知道,心理障礙由各種chat不休,這些chat不休,這些chat不休,混合了各種心理術語,並且常常是難以理解的或完全荒謬的。您需要做的一切才能噴出fo

根據本週發表的一項新研究,只有在2022年製造的塑料中,只有9.5%的塑料是由回收材料製成的。同時,塑料在垃圾填埋場和生態系統中繼續堆積。 但是有幫助。一支恩金團隊

我最近與領先的企業分析平台Alteryx首席執行官安迪·麥克米倫(Andy Macmillan)的對話強調了這一在AI革命中的關鍵但不足的作用。正如Macmillan所解釋的那樣,原始業務數據與AI-Ready Informat之間的差距


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

MinGW - Minimalist GNU for Windows
這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

WebStorm Mac版
好用的JavaScript開發工具

SecLists
SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

Dreamweaver Mac版
視覺化網頁開發工具

Safe Exam Browser
Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。