隨著機器學習和量子運算的巨大進步,我們現在有了更強大的新工具,能夠以新的方式與各行業研究者合作,並從根本上加速突破性科學發現的進展。
本期Google年終總結的主題是「自然科學」,文章作者為Google研究院的傑出科學家John Platt,1989年博士畢業於加州理工大學。
自從八年前加入Google Research 以來,我有幸成為天才研究人員的社群的一員,致力於應用前沿計算技術來推動應用科學的可能性,目前團隊正在探索物理和自然科學的課題,從幫助組織全世界的蛋白質和基因組信息以造福人們的生活,到利用量子電腦提高我們對宇宙本質的理解。
利用機器學習解開生物學之謎
生物學的非凡複雜性讓無數研究人員感到著迷,從探究大腦的奧秘、探究蛋白質的構造,再到編碼生命語言的基因組,Google一直與來自世界各地其他領先組織的科學家合作,應對連接組學(connectomics)、蛋白質功能預測和基因組學領域的重大挑戰,並使創新成果能夠為更廣泛的科學界所利用。
神經生物學
#2018年,Google開發的一個應用是探索訊息是如何透過斑馬魚大腦中的神經元路徑傳播的,提供了對斑馬魚如何參與像群集這樣的社會行為的深入觀察。
論文連結:https://www.nature.com/articles/s41592-018-0049-4
透過與馬克斯·普朗克生物智能研究所(Max Planck Institute for Biology Intelligence)的研究人員合作,研究人員們用電腦重建了一部分斑馬魚類大腦的3D 電子顯微鏡影像。
這也是在利用成像和計算管道繪製小腦中的神經元迴路方面取得的里程碑式的進展,也是連結組學領域的另一個進步。
這項工作涉及到的技術甚至可以應用到神經科學以外的領域,例如,為了解決處理大型的連接組學資料集的難題,Google的研究人員開發並發布了TensorStore,一個開源的C 和Python 軟體庫,專門用於儲存和操作n 維數據,在其他領域也適用於儲存大型數據集。
程式碼連結:https://github.com/google/tensorstore
透過比較人類語言處理和自回歸深層語言模型(DLM) ,研究人員利用機器學習闡明了人類大腦是如何執行像語言這樣與眾不同的功能。
論文連結:https://www.nature.com/articles/s41593-022-01026 -4
在這項研究中,Google與普林斯頓大學和紐約大學格羅斯曼醫學院的研究者合作,讓實驗參與者聽30分鐘的播客,同時使用皮質腦電圖記錄他們的大腦活動。
記錄結果表明,人類大腦和DLM 共享處理語言的計算原理,包括連續的下一個單字預測,依賴上下文嵌入,以及基於單字匹配的post-onset suprise計算,即可以測量人類大腦對單字的驚訝(surprise)程度,並將驚訝訊號與DLM 對單字的預測程度相關聯。
這些結果為人類大腦中的語言處理提供了新的結論,並且表明 DLM 可以用來揭示語言的神經基礎的有價值的見解。
生物化學
#機器學習也使得在理解生物序列方面取得了重大進展,研究人員利用深度學習的最新進展,從原始胺基酸序列中準確預測蛋白質功能。
論文連結:https://www.nature.com/articles/s41587-021-01179-w
#Google也與歐洲分子生物學實驗室的歐洲生物資訊研究所(EMBL-EBI)進行緊密合作,仔細評估模型的性能,並向公共蛋白質資料庫UniProt、 Pfam/interPro 和MGnify 添加了數以億計的功能標註。
論文連結:https://www.nature.com/articles/s41587-021-01179 -w.epdf
人類對蛋白質資料庫的標註可能是一個艱苦而緩慢的過程,而Google提出的機器學習方法使得標註速度實現了一個巨大的飛躍。
例如,Pfam標註增加的數量比過去十年所有其他努力的總和還要多,全世界每年訪問這些資料庫的數百萬科學家現在可以利用該標註進行研究。
雖然人類基因組的第一稿於2003年公佈,但由於定序技術的技術局限性,它並不完整。
2022年,Telomere-2-Telomere (T2T) 聯盟在解決這些先前無法獲得的區域(包括5個完整的染色體臂和近2億個新DNA 序列鹼基對)方面取得的顯著成就,這些區域對於人類生物學、進化和疾病的問題既有趣又重要。
Google的開源基因組變體caller,即DeepVariant是 T2T 聯盟使用的工具之一,以用於準備發布一個完整的30.55億鹼基對的人類基因組序列。
論文連結:https://www.nature.com/articles/nbt.4235
T2T 聯盟也正在使用Google開源的方法DeepConsensus,為Pacific Biosciences 長期閱讀定序儀器提供裝置上的錯誤修正,在T2T對全面的泛基因組資源的最新研究中,可以代表人類遺傳多樣性的廣度。
論文連結:https://www.nature.com/articles/s41587-022-01435 -7.epdf
量子計算在新物理發現中的應用
在促進科學發現上,量子計算仍處於初級階段,但其具有很大的潛力,所以穀歌正在探索提高量子計算能力的方法,以使量子在計算成為科學發現和突破的工具。
透過與來自世界各地的物理學家合作,研究人員開始使用現有的量子電腦來創建全新的物理實驗,其中一個量子實驗問題是:當感測器測量一個物體時,需要用電腦處理來自感測器的資料。
在傳統的處理過程中,需要將感測器的資料轉換為經典資訊(classical information)後再處理。
對於量子運算來說,可以直接處理來自感測器的量子數據,將量子感測器的數據直接提供給量子演算法,而無需經過測量,相比傳統電腦會有更大的優勢。
論文連結:https://www.science.org/doi/10.1126/science.abn7293
在Google最近與多所大學的研究人員合作撰寫發表的一篇Science論文中,實驗結果表明,只要量子電腦與量子感測器直接耦合並運行一個學習演算法,量子計算可以從比經典計算少得多的實驗中提取資訊。
即使在目前還不成熟的中型量子電腦上,「量子機器學習」也可以在資料集上產生指數級的優勢。
論文連結:https://arxiv.org/abs/2112.00778
#由於實驗數據往往是科學發現的限制因素,量子機器學習演算法有可能完全釋放出量子電腦的巨大威力,更強的是,這項工作的研究結果也適用於學習量子計算的輸出,如很難抽取的量子模擬輸出。
即使沒有量子機器學習,量子電腦的一個很有前景的應用是實驗性地探索那些無法觀察或模擬的量子系統。
2022年,Quantum AI 團隊利用這種方法觀察到了第一個使用超導量子位元處於束縛態的多個微波光子的實驗證據。
論文連結:https://www.nature.com/articles/s41586-022-05348 -y
光子通常需要額外的非線性元素才能相互作用,而Google的量子電腦對這些相互作用的模擬結果出乎研究人員的意料:本來以為這些束縛態的存在依賴於脆弱的條件,但實際上卻發現它們甚至對相對強烈的擾動都是穩健的。
鑑於Google在應用量子運算取得物理學突破方面取得的初步成功,研究人員對這項技術的可能性也抱持著很大的希望,將使未來的突破性發現能夠產生與電晶體或全球定位系統的創造一樣重大的社會影響。
把量子運算當作科學工具是非常有前景的!
以上是探索自然本源!谷歌2022年終總結第七彈:「生化環材」如何吃機器學習紅利?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

在約翰·羅爾斯1971年具有開創性的著作《正義論》中,他提出了一種思想實驗,我們應該將其作為當今人工智能設計和使用決策的核心:無知的面紗。這一理念為理解公平提供了一個簡單的工具,也為領導者如何利用這種理解來公平地設計和實施人工智能提供了一個藍圖。 設想一下,您正在為一個新的社會制定規則。但有一個前提:您事先不知道自己在這個社會中將扮演什麼角色。您最終可能富有或貧窮,健康或殘疾,屬於多數派或邊緣少數群體。在這種“無知的面紗”下運作,可以防止規則制定者做出有利於自身的決策。相反,人們會更有動力製定公

許多公司專門從事機器人流程自動化(RPA),提供機器人以使重複的任務自動化 - UIPATH,在任何地方自動化,藍色棱鏡等。 同時,過程採礦,編排和智能文檔處理專業

AI的未來超越了簡單的單詞預測和對話模擬。 AI代理人正在出現,能夠獨立行動和任務完成。 這種轉變已經在諸如Anthropic的Claude之類的工具中很明顯。 AI代理:研究

快速的技術進步需要對工作未來的前瞻性觀點。 當AI超越生產力並開始塑造我們的社會結構時,會發生什麼? Topher McDougal即將出版的書Gaia Wakes:

產品分類通常涉及復雜的代碼,例如諸如統一系統(HS)等系統的“ HS 8471.30”,對於國際貿易和國內銷售至關重要。 這些代碼確保正確的稅收申請,影響每個INV

數據中心能源消耗與氣候科技投資的未來 本文探討了人工智能驅動的數據中心能源消耗激增及其對氣候變化的影響,並分析了應對這一挑戰的創新解決方案和政策建議。 能源需求的挑戰: 大型超大規模數據中心耗電量巨大,堪比數十萬個普通北美家庭的總和,而新興的AI超大規模中心耗電量更是數十倍於此。 2024年前八個月,微軟、Meta、谷歌和亞馬遜在AI數據中心建設和運營方面的投資已達約1250億美元(摩根大通,2024)(表1)。 不斷增長的能源需求既是挑戰也是機遇。據Canary Media報導,迫在眉睫的電

生成式AI正在徹底改變影視製作。 Luma的Ray 2模型,以及Runway的Gen-4、OpenAI的Sora、Google的Veo等眾多新模型,正在以前所未有的速度提升生成視頻的質量。這些模型能夠輕鬆製作出複雜的特效和逼真的場景,甚至連短視頻剪輯和具有攝像機感知的運動效果也已實現。雖然這些工具的操控性和一致性仍有待提高,但其進步速度令人驚嘆。 生成式視頻正在成為一種獨立的媒介形式。一些模型擅長動畫製作,另一些則擅長真人影像。值得注意的是,Adobe的Firefly和Moonvalley的Ma

ChatGPT用户体验下降:是模型退化还是用户期望? 近期,大量ChatGPT付费用户抱怨其性能下降,引发广泛关注。 用户报告称模型响应速度变慢,答案更简短、缺乏帮助,甚至出现更多幻觉。一些用户在社交媒体上表达了不满,指出ChatGPT变得“过于讨好”,倾向于验证用户观点而非提供批判性反馈。 这不仅影响用户体验,也给企业客户带来实际损失,例如生产力下降和计算资源浪费。 性能下降的证据 许多用户报告了ChatGPT性能的显著退化,尤其是在GPT-4(即将于本月底停止服务)等旧版模型中。 这


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

DVWA
Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中

VSCode Windows 64位元 下載
微軟推出的免費、功能強大的一款IDE編輯器

SublimeText3漢化版
中文版,非常好用

SecLists
SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

mPDF
mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),