搜尋
首頁科技週邊人工智慧跟男友約會也要問語言模型? Nature:提idea,總結筆記,GPT-3竟成當代「科學研究民工」

讓一隻猴子在打字機上隨機地按鍵,只要給足夠長的時間,莎士比亞全集也能敲出來。

那要是一隻懂文法和語意的猴子呢?答案是連科研都能幫你做!

語言模型的發展勢頭十分迅猛,幾年前還只能在輸入法上對下一個要輸入的字進行自動補全,今天就已經可以幫助研究人員分析和撰寫科學論文、生成程式碼了。

跟男友約會也要問語言模型? Nature:提idea,總結筆記,GPT-3竟成當代「科學研究民工」

大型語言模型(LLM)的訓練一般需要大量的文字資料作為支撐。

2020年,OpenAI發布了擁有1750億參數的GPT-3模型,寫詩、做數學題,幾乎生成模型能做的,GPT-3已然做到極致,即便到了今天,GPT-3仍然是許多語言模型要拿來比較和超越的基線。

GPT-3發布後,很快在Twitter和其他社群媒體上引發熱議,大量研究人員對這種詭異的「類人寫作」方式感到驚訝。

GPT-3發佈線上服務後,使用者可以隨意輸入文本,並讓模型返回下文,每處理750個單字的收費最低僅為0.0004美元,堪稱物美價廉。

最近Nature專欄科技專題上發布了一篇文章,沒想到除了幫忙寫小作文,這些語言模型還能幫你「做科研」!

讓機器幫你思考

冰島大學雷克雅維克分校的電腦科學家Hafsteinn Einarsson表示:我幾乎每天都會用到GPT-3,例如給論文摘要進行修改。

Einarsson在6月份的一次會議上準備文案時,雖然GPT-3提了很多無用的修改建議,但也有一些有幫助的,比如“使研究問題在摘要的開頭更明確」,而這類問題你自己看手稿時根本不會意識到,除非你讓別人幫你看,而這個別人為什麼不能是「GPT-3」呢?

語言模型甚至可以幫助你改進實驗設計!

在另一個專案中,Einarsson想使用Pictionary遊戲在參與者中收集語言資料。

在給了遊戲的描述後,GPT-3給了一些遊戲的修改建議。理論上講,研究人員也可以要求對實驗方案進行新的嘗試。

跟男友約會也要問語言模型? Nature:提idea,總結筆記,GPT-3竟成當代「科學研究民工」

有些研究人員也會使用語言模型來產生論文標題或使文字更易讀。

史丹佛大學電腦科學教授的博士生Mina Lee的使用方法是,給GPT-3輸入「使用這些關鍵字,產生一篇論文標題」等作為提示,模型就會幫你擬定幾個標題。

有部分章節如果需要重寫的話,她還會用到以色列特拉維夫AI21實驗室發布的人工智慧寫作助手Wordtune,只需要點擊「Rewrite」,就能轉換出多個版本的重寫段落,然後仔細挑選即可。

Lee也會要求GPT-3為生活中的一些事提供建議,例如詢問「如何把男友介紹給她的父母」時,GPT-3建議去海邊的一家餐館。

位於紐約布魯克林的科技新創公司Scite的電腦科學家Domenic Rosati使用Generate語言模式對自己的思路進行重新組織。

跟男友約會也要問語言模型? Nature:提idea,總結筆記,GPT-3竟成當代「科學研究民工」

連結:https://cohere.ai/generate

Generate由加拿大的一家NLP公司Cohere開發,模型的工作流程與GPT-3非常相似。

只需要輸入筆記,或只是隨便說點idea,最後加上「總結一下」或是「把它變成一個抽象概念」,模型就會自動幫你整理思路。

何必親自寫程式?

OpenAI 的研究人員對 GPT-3進行了大量的文字訓練,包括書籍、新聞故事、維基百科條目和軟體程式碼。

後來,團隊注意到GPT-3可以像補全普通文字一樣對程式碼進行補全。

研究人員創建了一個名為Codex 的演算法的微調版本,使用來自程式碼共享平台GitHub上超過150G 的文本上進行訓練;目前GitHub 現在已經將Codex 整合到Copilot的服務中,可以輔助使用者編寫程式碼。

位於華盛頓州西雅圖的艾倫人工智慧研究所AI2的電腦科學家Luca Soldaini說,他們辦公室裡至少有一半的人都在用Copilot

Soldaini表示,Copilot最適合重複性程式設計的場景。例如他有一個專案涉及到編寫處理PDF的模板程式碼,Copilot直接就給補全了。

不過Copilot補全的內容也會常常出錯,最好在一些自己熟悉的語言上使用。

文獻檢索

語言模型最成熟的應用場景可能就是搜尋和總結文獻了。

AI2開發的Semantic Sc​​holar搜尋引擎使用了TLDR的語言模型對每篇論文給出了一個類似Twitter長度的描述。

跟男友約會也要問語言模型? Nature:提idea,總結筆記,GPT-3竟成當代「科學研究民工」

該搜尋引擎涵蓋了大約2億篇論文,其中大部分來自生物醫學和電腦科學。

TLDR的開發是基於Meta更早發布的BART模型,然後AI2的研究人員在人寫摘要的基礎上對模型進行了微調。

以今天的標準,TLDR並不是大型語言模型,因為它只包含大約4億個參數,而GPT-3的最大版本包含1750億。

TLDR在AI2開發的擴充科學論文應用程式Semantic Reader中也有應用。

當使用者使用Semantic Reader中的文內引用時,會彈出一個包含TLDR摘要的資訊框。

Semantic Sc​​holar的科學家Dan Weld表示,我們的想法是利用語言模型來提升閱讀體驗。

當語言模型產生文字摘要時,模型有可能會產生一些文章中不存在的事實,研究人員將這種問題稱之為「幻覺」,但實際上語言模型純粹是在編造或說謊。

TLDR 在真實性檢定中表現較好,論文作者對TLDR的準確度評分為2.5分(滿分3分)。

Weld表示,TLDR更真實是因為摘要只有大約20個字的長度,也可能是因為演算法不會將沒有出現在正文中的單字放入摘要中。

在搜尋工具方面,2021年在加州舊金山的機器學習非營利組織Ought推出了Elicit ,如果用戶問它「mindfulness對決策的影響是什麼?」它會輸出一個包含十篇論文的表格。

跟男友約會也要問語言模型? Nature:提idea,總結筆記,GPT-3竟成當代「科學研究民工」

使用者可以要求軟體在列中填寫摘要和元資料等內容,以及關於研究參與者、方法和結果的信息,然後使用包括GPT-3在內的工具從論文中提取或產生這些信息。

馬裡蘭大學帕克分校的Joel Chan的研究方向為人機交互,每當他開始一個新計畫的時候都會使用Elicit搜尋相關論文。

斯德哥爾摩卡羅琳學院的神經系統科學家Gustav Nilsonne也利用Elicit找到了一些可以添加到總結分析中的數據的論文,用這個工具可以找到在其他搜尋中沒有發現的文件。

不斷進化的模型

AI2的原型為LLM提供了一種未來的感覺。

有時研究人員在閱讀科學論文的摘要後會有疑問,但還沒有時間閱讀全文。

AI2的一個團隊也開發了一個工具,可以在NLP領域回答這些問題。

模型先要求研究者閱讀NLP論文的摘要,然後詢問相關問題(例如「分析了哪五個對話屬性?」)

#研究小組隨後要求其他研究人員在閱讀完整部論文後回答這些問題。

跟男友約會也要問語言模型? Nature:提idea,總結筆記,GPT-3竟成當代「科學研究民工」

AI2訓練了另一個版本的Longformer語言模型,輸入為完整的論文,然後利用收集的資料集產生關於其他論文不同問題的答案。

ACCoRD模型可以為150個與NLP相關的科學概念產生定義和類比。

MS2是一個包含470,000個醫學文檔和20,000個多文檔摘要的資料集,用MS2微調BART後,研究人員就能夠提出一個問題和一組文檔,並生成一個簡短的元分析摘要。

2019年,AI2對Google2018年創建的語言模型BERT 進行了微調,在Semantic Sc​​holar的論文上創建了擁有1.1億個參數的SciBERT

#Scite使用人工智慧創建了一個科學搜尋引擎,進一步對SciBERT進行了微調,以便當其搜尋引擎列出引用目標論文的論文時,將這些論文歸類為支援、對比或以其他方式提到該論文。

Rosati表示這種細微差別有助於人們識別科技文獻中的限製或差距。

AI2的SPECTER模型也是基於SciBERT,它將論文簡化為緊湊的數學表示。

Weld 說,會議組織者使用 SPECTER 將提交的論文與同行評審者匹配,Semantic Sc​​holar使用它根據用戶的庫推薦論文。

#

在希伯來大學和AI2的電腦科學家Tom Hope說他們有研究計畫透過微調語言模型來確定有效的藥物組合、基因和疾病之間的聯繫,以及在COVID-19研究中的科學挑戰和方向。

但是,語言模型能否提供更深入的洞察力,甚至是發現能力呢?

今年5月,Hope 和Weld 與微軟首席科學官Eric Horvitz共同撰寫了一篇評論,列出了實現這一目標的挑戰,包括教授模型以「(推斷)重組兩個概念的結果」。

Hope表示,這基本和 OpenAI 的DALL · E 2圖像生成模型「產生一張貓飛入太空的圖片是一回事」,但是我們怎麼能走向結合抽象的、高度複雜的科學概念呢?

這是個開放性問題。

時至今日,大型語言模型已經對研究產生了實實在在的影響,如果人們還沒有開始使用這些大型語言模型輔助工作,他們就會錯過這些機會。

參考資料:

https://www.nature.com/articles/d41586-022-03479-w

以上是跟男友約會也要問語言模型? Nature:提idea,總結筆記,GPT-3竟成當代「科學研究民工」的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
烹飪創新:人工智能如何改變食品服務烹飪創新:人工智能如何改變食品服務Apr 12, 2025 pm 12:09 PM

AI增強食物準備 在新生的使用中,AI系統越來越多地用於食品製備中。 AI驅動的機器人在廚房中用於自動化食物準備任務,例如翻轉漢堡,製作披薩或組裝SA

Python名稱空間和可變範圍的綜合指南Python名稱空間和可變範圍的綜合指南Apr 12, 2025 pm 12:00 PM

介紹 了解Python函數中變量的名稱空間,範圍和行為對於有效編寫和避免運行時錯誤或異常至關重要。在本文中,我們將研究各種ASP

視覺語言模型(VLMS)的綜合指南視覺語言模型(VLMS)的綜合指南Apr 12, 2025 am 11:58 AM

介紹 想像一下,穿過​​美術館,周圍是生動的繪畫和雕塑。現在,如果您可以向每一部分提出一個問題並獲得有意義的答案,該怎麼辦?您可能會問:“您在講什麼故事?

聯發科技與kompanio Ultra和Dimenty 9400增強優質陣容聯發科技與kompanio Ultra和Dimenty 9400增強優質陣容Apr 12, 2025 am 11:52 AM

繼續使用產品節奏,本月,Mediatek發表了一系列公告,包括新的Kompanio Ultra和Dimenty 9400。這些產品填補了Mediatek業務中更傳統的部分,其中包括智能手機的芯片

本週在AI:沃爾瑪在時尚趨勢之前設定了時尚趨勢本週在AI:沃爾瑪在時尚趨勢之前設定了時尚趨勢Apr 12, 2025 am 11:51 AM

#1 Google推出了Agent2Agent 故事:現在是星期一早上。作為AI驅動的招聘人員,您更聰明,而不是更努力。您在手機上登錄公司的儀表板。它告訴您三個關鍵角色已被採購,審查和計劃的FO

生成的AI遇到心理摩托車生成的AI遇到心理摩托車Apr 12, 2025 am 11:50 AM

我猜你一定是。 我們似乎都知道,心理障礙由各種chat不休,這些chat不休,這些chat不休,混合了各種心理術語,並且常常是難以理解的或完全荒謬的。您需要做的一切才能噴出fo

原型:科學家將紙變成塑料原型:科學家將紙變成塑料Apr 12, 2025 am 11:49 AM

根據本週發表的一項新研究,只有在2022年製造的塑料中,只有9.5%的塑料是由回收材料製成的。同時,塑料在垃圾填埋場和生態系統中繼續堆積。 但是有幫助。一支恩金團隊

AI分析師的崛起:為什麼這可能是AI革命中最重要的工作AI分析師的崛起:為什麼這可能是AI革命中最重要的工作Apr 12, 2025 am 11:41 AM

我最近與領先的企業分析平台Alteryx首席執行官安迪·麥克米倫(Andy Macmillan)的對話強調了這一在AI革命中的關鍵但不足的作用。正如Macmillan所解釋的那樣,原始業務數據與AI-Ready Informat之間的差距

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
4 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

mPDF

mPDF

mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

Atom編輯器mac版下載

Atom編輯器mac版下載

最受歡迎的的開源編輯器

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中

VSCode Windows 64位元 下載

VSCode Windows 64位元 下載

微軟推出的免費、功能強大的一款IDE編輯器