什麼是PaperQA？如何幫助科學研究？-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

什麼是PaperQA？如何幫助科學研究？

尊渡假赌尊渡假赌尊渡假赌

Apr 12, 2025 am 09:51 AM

介紹

隨著人工智能的發展，科學研究已經發生了巨大的轉變。每年在不同的技術和部門上發表數百萬篇論文。但是，瀏覽這一信息以檢索準確且相關的內容是一項艱鉅的任務。輸入PaperQA，這是一種旨在解決此確切問題的檢索生成（RAG）代理。它由Jakub Lala´，Odhran O'Donoghue，Aleksandar Shtedritski，Sam Cox，Samuel G Rodriques和Andrew D White進行了研究和開發。

該創新工具是專門設計的，可以通過從全文科學論文中檢索信息，綜合數據並以可靠的引用生成準確的答案來幫助研究人員。本文探討了PaperQA的好處，工作，實施和局限性。

什麼是PaperQA？如何幫助科學研究？

概述

PaperQA是一種檢索型生成（RAG）工具，旨在幫助研究人員從全文科學論文中導航和提取信息。
通過利用大型語言模型（LLM）和抹布技術，PaperQA提供了可靠的引用的準確，上下文豐富的響應。
PaperQA中的代理RAG模型自動檢索，過程和合成信息，並根據複雜的科學查詢優化答案。
PaperQA與人類專家的表現相當，在更快，更有效的同時達到了相似的精度率。
儘管具有優勢，但PaperQA仍取決於檢索到的論文的準確性，並且可能與模棱兩可的查詢或最新的數值數據鬥爭。
PaperQA代表了自動化科學研究的重要一步，從而改變了研究人員如何檢索和合成複雜信息。

PaperQA：檢索效果的科學研究劑

什麼是PaperQA？如何幫助科學研究？

隨著科學論文繼續成倍增加，研究人員篩選不斷擴展的文學機構變得越來越困難。僅在2022年，就發表了超過500萬個學術論文，增加了當前可用的超過2億篇文章。這項大量研究通常會導致重大發現未被注意到或花費數年的認可。傳統方法，包括關鍵字搜索和矢量相似性嵌入，僅刮擦檢索相關信息可能的表面。這些方法通常是高度手動，緩慢的，並且留出了監督的空間。

PaperQA通過利用大型語言模型（LLM）的潛力（結合檢索增強的生成（RAG）技術）來為該問題提供強大的解決方案。與典型的LLM不同，它可以幻覺或依靠過時的信息，PaperQA使用動態方法來檢索信息，結合了搜索引擎的優勢，收集證據和智能答案，同時最大程度地降低了錯誤和提高效率。通過將標準抹布分解為模塊化組件，PaperQA適應了特定的研究問題，並確保所提供的答案植根於事實，最新的來源。

另請閱讀：構建多模式抹布系統的綜合指南

什麼是特工抹布？

代理RAG模型是指旨在集成代理方法的一種檢索增強生成（RAG）模型。在這種情況下，“代理”意味著模型自主行動並決定如何檢索，處理和生成信息的能力。它是指模型不僅檢索和增強信息的系統，而且還積極管理各種任務或子任務以優化特定目標。

分佈破布

檢索增強生成（RAG） ：抹布模型旨在將大型語言模型（LLMS）與檢索機制相結合。這些模型通過使用內部知識（預訓練數據）並動態檢索相關的外部文檔或信息來產生響應。這提高了模型響應需要最新信息或特定域信息的查詢的能力。
- 檢索：該模型從大型數據集（例如科學論文的語料庫）中檢索最相關的文檔。
- 增強：通過檢索步驟“增強”一代過程。檢索系統找到相關數據，然後將其用於提高生成文本的質量，相關性和事實準確性。本質上，外部信息增強了模型，使其更有能力回答超出其預訓練知識的查詢。
- 一代：它通過利用檢索的文檔及其預培訓的知識庫來生成連貫且具有上下文相關的答案或文本。
代理：當某物被描述為“代理”時，它意味著它可以自主做出決定並執行行動。在抹布模型的背景下，代理抹布系統將具有以下功能：
- 自主確定要查詢的文檔或來源。
- 根據上下文或用戶查詢將某些文檔優先於其他文檔。
- 將復雜的查詢分解為子查詢，並獨立處理。
- 使用戰略方法選擇最能滿足手頭任務目標的信息。

另請閱讀：揭露檢索增強發電（RAG）| AI符合人類知識的地方

PaperQA作為代理抹布模型

PaperQA專門設計為專為使用科學論文而設計的代理抹布模型。這意味著它對以下任務特別優化：

檢索特定的，高度相關的學術論文或論文部分。
通過解析和綜合多個文檔的信息來回答詳細的科學查詢。
將復雜的科學問題分解為可管理的部分，並自主決定最佳的檢索和發電策略。

為什麼PaperQA非常適合使用科學論文？

複雜的信息檢索：科學論文通常包含密集的技術信息。 PaperQA2可以通過自主找到紙張或一組紙的最相關部分來瀏覽這種複雜性。
多文章的綜合：它可以吸引多個論文，結合見解並綜合一個更全面的答案，而不是依靠單個來源。
專業：PaperQA2可能是針對科學語言和環境的訓練或優化的，使其在該特定領域中表現出色。

總而言之，代理抹布模型是一個複雜的系統，可檢索相關信息並生成響應，並自主管理任務以確保效率和相關性。 PaperQA2將該模型應用於科學論文的領域，使其在學術和研究目的方面非常有效。

另請閱讀：通過檢索增強的微調增強抹布

PaperQA：工作和工具

什麼是PaperQA？如何幫助科學研究？

PaperQA系統由：

什麼是PaperQA？如何幫助科學研究？

輸入查詢

該過程始於用戶輸入的輸入查詢。這可能是一個問題或搜索主題，需要基於科學論文的答案。

搜索階段

關鍵字和年：處理輸入查詢，並提取關鍵字或相關年份。
查詢可用的API ：系統查詢各種可用的API，以了解科學論文，可能來自Arxiv，PubMed或其他存儲庫等數據庫。
頂部K結果：基於論文的相關性和狀態（無論是可訪問，經過同行評審等）取回了頂部K結果。

收集證據階段

嵌入式塊：系統將相關論文分解成嵌入式的塊，較小，易於管理的文本段。
MMR矢量檢索：最大邊緣相關性（MMR）技術用於從論文中檢索最相關的證據。
摘要LLM ：語言模型（LLM）總結了從塊中提取的證據。
LLM相關性分數：LLM分數匯總信息的相關性，以評估其與輸入查詢的一致性。
頂級M塊：選擇最相關的最相關的塊以進行進一步處理。

什麼是PaperQA？如何幫助科學研究？

回答問題階段

問題和上下文庫：分析輸入查詢，系統檢查其內部上下文庫，以查看其是否具有與問題相關的知識或答案。
詢問LLM（您對這個問題有什麼了解嗎？） ：系統詢問LLM是否有任何先前的理解或上下文直接回答查詢。
答案LLM提出答案：LLM根據收集的證據和問題的背景提出答案。
向代理展示：擬議的答案顯示給代理（可能是人類審閱者或更高級別的LLM進行最終驗證）。

什麼是PaperQA？如何幫助科學研究？

完成答案

如果答案有足夠的答案和最終查詢答案，則該過程將完成。
如果答案不足，則過程循環循環，LLM繼續收集證據或重新分析輸入查詢以獲取更好的結果。

這種整體結構可確保PaperQA可以有效地搜索，檢索，總結和合成大量科學論文的信息，從而為用戶查詢提供詳盡而相關的答案。關鍵優勢是它可以分解複雜的科學內容，應用智能檢索方法並提供基於證據的答案的能力。

這些工具和諧起作用，允許PaperQA從各種來源收集多個證據，從而確保產生徹底的基於證據的答案。整個過程由中央LLM代理管理，該過程基於查詢的複雜性動態調整其策略。

LITQA數據集

什麼是PaperQA？如何幫助科學研究？

開發了LITQA數據集來衡量PaperQA的性能。該數據集由50個從最近的科學文獻中得出的50個多項選擇問題組成（2021年9月後）。這些問題跨越了生物醫學研究中的各個領域，要求PaperQA檢索信息並在多個文檔中合成。 LITQA提供了一種嚴格的基準測試，該基準超出了典型的多項選擇科學質量檢查數據集，要求PaperQA進行全文檢索和合成，任務更接近人類研究人員執行的任務。

PaperQA與專家人類相比如何？

在評估PaperQA在LITQA上的性能時，該系統與專家人類研究人員具有很高的競爭力。當研究人員和PaperQA得到相同的問題時，PaperQA與人類相當，顯示出相似的精度率（人類為69.5％，為66.8％）。此外，PaperQA更快，更具成本效益，在2.4小時內回答了所有問題，而人類專家為2.5小時。 PaperQA的一個值得注意的優勢是其錯誤地回答的速度較低，因為它經過校準，以確認缺乏證據時的不確定性，從而進一步降低了結論不正確的風險。

PaperQA實施

PaperQA系統建立在Langchain代理框架上，並使用多個LLM，包括GPT-3.5和GPT-4，每個LLM都分配給了不同的任務（例如，匯總和答案）。該系統從各種數據庫中提取論文，使用地圖還原方法來收集和總結證據，並以完全引用的學術基調產生最終答案。重要的是，PaperQA的模塊化設計使其可以重新提出問題，調整搜索術語和重試步驟，從而確保准確性和相關性。

如何通過命令行使用PaperQA？

步驟1：安裝所需的庫
運行以下命令安裝Paper-QA：

 PIP安裝Paper-QA

步驟2：設置您的研究文件夾
創建一個文件夾，然後將研究論文放入其中。例如，我已經添加了標題為“注意的全部需要”的論文。

步驟3：導航到您的文件夾
使用以下命令導航到文件夾：

 CD文件夾名稱

步驟4：問你的問題
運行以下命令詢問一個主題：

 PQA問“什麼是變形金剛？”

結果：

什麼是PaperQA？如何幫助科學研究？

輸出的來源和引用

CrossRef ：CrossRef是一個官方數據庫，為學術論文提供數字對象標識符（DOIS）。但是，看來搜索無法成功連接到CrossRef，這可能是因為未設置必要的環境變量（CrossRef_API_KEY缺失）。這意味著CrossRef不能用作此搜索的數據源。
語義學者：同樣，它試圖查詢流行的學術搜索引擎的語義學者，但是由於缺少API鍵而導致的連接失敗了（Smantic_scholar_api_key未設置）。這導致了超時，並且沒有檢索元數據。
該系統指向論文的特定頁面（例如，Vaswani2023第2-3頁），以確保讀者可以驗證或進一步探索源材料。這在學術或研究環境中可能特別有用。

使用Python訪問

導入庫

導入操作系統
來自dotenv import load_dotenv
從PaperQA導入設置，Agent_Query，QueryRequest

OS：提供與操作系統交互的功能的模塊，例如使用文件路徑和環境變量。
Dotenv：用於將.ENV文件加載到環境的模塊。
PaperQa：PaperQA庫中的模塊，允許查詢科學論文。它提供了類和功能，例如設置，Agent_Query和QueryRequest，用於配置和運行查詢。

加載API鍵

load_dotenv（）

此功能從.env文件加載環境變量，通常用於存儲敏感信息，例如API鍵，文件路徑或其他配置。
調用load_dotenv（）確保環境變量可用於腳本訪問。

查詢PaperQA系統

答案=等待agent_query（  
    queryrequest（    
            查詢=“什麼是變形金剛？”，    
            設置=設置（溫度= 0.5，paper_directory =“/home/badrinarayan/paper-qa”），  
    ）
）

這是對代碼的解釋，分解為結構化和清晰的格式：

代碼分解和解釋

1。導入庫

PIP安裝Paper-QA<br>導入操作系統<br>來自dotenv import load_dotenv<br>從PaperQA導入設置，Agent_Query，QueryRequest<br>

OS ：提供與操作系統交互的功能的模塊，例如使用文件路徑和環境變量。
Dotenv ：用於將.ENV文件加載到環境的模塊。
PaperQa ：PaperQA庫中的模塊，允許查詢科學論文。它提供了類和功能，例如設置，Agent_Query和QueryRequest，用於配置和運行查詢。

2。加載環境變量

load_dotenv（）

此功能從.env文件加載環境變量，通常用於存儲敏感信息，例如API鍵，文件路徑或其他配置。
通過調用load_dotenv（），它可以確保可以在腳本中訪問環境變量。

3。查詢PaperQA系統

答案=等待agent_query（
    queryrequest（
        查詢=“什麼是變形金剛？”，
        設置=設置（溫度= 0.5，paper_directory =“/home/badrinarayan/paper-qa”），
    ）
）

代碼的這一部分使用代理和結構化請求查詢PaperQA系統。它執行以下步驟：

Agent_query（） ：這是用於向PaperQA系統發送查詢的異步功能。
- 預計將使用等待關鍵字來調用它，因為它是一個異步函數，這意味著它在等待結果的同時與其他代碼同時運行。
查詢：這定義了查詢請求的結構。它將查詢和設置作為參數。在這種情況下：
- 查詢：“什麼是變形金剛？”是該系統的研究問題嗎？它期望從指定目錄中的論文中得出答案。
- 設置：這將通過設置的實例來配置查詢，其中包括：
  - 溫度：控制生成的答案的“創造力”。較低的值等0.5使響應更加確定性（事實），而較高的值會產生更多多樣化的答案。
  - Paper_Directory ：指定PaperQA應在此查找研究論文的目錄，在這種情況下為“/home/badrinarayan/Paper-qa”。

輸出

問題：什麼是變形金剛？<br><br>變壓器是設計用於序列的神經網絡體系結構<br> 轉導任務，例如機器翻譯，完全依賴於<br> 注意機制，消除了對複發和卷積的需求。<br> 它具有編碼器結構，其中編碼器和解碼器都<br> 由六個相同層組成。每個編碼器層都包含一個<br> 多頭自我注意機制和姿勢完全連接的位置<br> 饋送網絡，採用剩餘連接和層<br> 正常化。解碼器包含一個額外的子層<br>在編碼器的輸出上註意注意並使用掩碼來確保自動<br>回歸產生（Vaswani2023第2-3頁）。<br><br>變壓器改善並行化並減少訓練時間<br> 重複模型，實現最先進的模型會導致翻譯<br> 任務。它在WMT 2014年英語對 - 最新任務上的BLEU得分為28.4<br> 在訓練3.5天后，八個<br> GPU（Vaswani2023頁1-2）。該模型的效率進一步提高了<br> 減少關聯來自不同的信號所需的操作數量<br> 位置到恆定的，利用多頭關注以維持<br> 有效分辨率（Vaswani2023第2-2頁）。<br><br>除了翻譯外，變壓器還表現出很強的<br> 在英語選區解析等任務中的表現，達到高F1<br> 監督和半監督的設置的分數（Vaswani2023頁9--<br> 10）。<br><br>參考<br><br>1。 （Vaswani2023第2-3頁）：Vaswani，Ashish等。 “關注你全部<br> 需要。<br><br> 2。 （Vaswani2023第1-2頁）：Vaswani，Ashish等。 “關注你全部<br> 需要。<br><br> 3。 （Vaswani2023第9-10頁）：Vaswani，Ashish等。 “關注你全部<br> 需要。<br><br> 4。 （Vaswani2023第2-2頁）：Vaswani，Ashish等。 “關注你全部<br> 需要。

輸出的來源和引用

該系統似乎依靠外部數據庫，例如學術數據庫或存儲庫來回答問題。根據參考文獻，該特定係統很有可能正在查詢諸如：

Arxiv.org ：著名的研究論文開放式存儲庫，特別是專注於計算機科學，人工智能和機器學習領域。對“ Arxiv，2023年8月2日，Arxiv.org/abs/1706.03762v7”的引用直接引入了Ashish Vaswani等人的開創性紙“您需要的全部您需要” 。（2017），引入了變壓器模型。
可以查詢的其他潛在來源包括語義學者， Google Scholar或PubMed等學術存儲庫，具體取決於該主題。但是，對於這項特定任務，由於引用了論文的性質，系統似乎主要依賴於Arxiv 。
該系統指向論文的特定頁面（例如，Vaswani2023第2-3頁），以確保讀者可以驗證或進一步探索源材料。這在學術或研究環境中可能特別有用。

PaperQA的局限性

儘管具有優勢，但PaperQA並非沒有局限性。首先，其對現有研究論文的依賴意味著它假設來源中的信息是準確的。如果檢索出錯誤的論文，PaperQA的答案可能會存在缺陷。此外，該系統可能會與與可用文獻不符的模棱兩可或模糊的查詢鬥爭。最後，儘管系統有效地從全文論文中綜合了信息，但它仍無法處理需要最新數值數據的實時計算或任務。

結論

總之，PaperQA代表了科學研究自動化的飛躍。通過將檢索功能的生成與智能代理集成，PaperQA改變了研究過程，減少了從復雜文獻中找到和合成信息所需的時間。它的動態調整，檢索全文論文和迭代答案的能力使科學提問的世界越來越接近人類水平的專業知識，但成本和時間的一小部分。隨著科學在Breakneck速度的進步，PaperQA之類的工具將在確保研究人員可以保持並突破創新的界限方面發揮關鍵作用。

另外，請查看有關AI代理的新課程：AI代理簡介