首頁 >科技週邊 >人工智慧 >基於抹布的研究助理使用O3-Mini和Crewai

基於抹布的研究助理使用O3-Mini和Crewai

Joseph Gordon-Levitt
Joseph Gordon-Levitt原創
2025-03-05 10:12:15450瀏覽

OpenAI的最新型號O3-Mini正在使用其先進的推理,解決問題和代碼生成功能來徹底改變編碼任務。它有效地處理複雜的查詢並集成了結構化數據,並在AI應用程序中設置了新標準。本文使用O3-Mini和Crewai探討了建立檢索功能的生成(RAG)研究助理代理,該代理從多個PDF中檢索信息,並處理用戶智能查詢。我們將使用Crewai的Crewdoclingsource,Serperdevtool和Openai的O3-Mini來增強研究工作流程的自動化。

> >內容表

>用O3-Mini和Crewai
  • >先前構建RAG代理
    • 步驟1:安裝所需的庫
    • 文檔
    • >
    • 步驟5:定義AI模型
    • >步驟6:配置Web搜索工具
    • 步驟7:為文檔搜索定義嵌入模型搜索
    • 11:運行研究助手
  • >
  • 結論
  • >常見問題
>用O3-Mini和Crewai

構建破布代理

>發表了大量的研究,基於抹布的助手可以幫助研究人員快速找到相關的見解,而無需手動瀏覽數百篇論文。我們將要構建的代理將處理PDF,以根據文檔的內容提取關鍵信息並回答查詢。如果在PDF中找不到所需的信息,它將自動執行網絡搜索以提供相關的見解。可以擴展此設置以用於更高級的任務,例如匯總多個論文,檢測矛盾的發現或生成結構化報告。

>在本動手指南中,我們將建立一個研究代理,該研究代理將介紹有關DeepSeek-R1和O3-Mini的文章,以回答我們詢問這些模型的查詢。為了建立這位研究助理代理商,我們將首先經過先決條件並建立環境。然後,我們將導入必要的模塊,設置API鍵並加載研究文檔。然後,我們將繼續定義AI模型並將Web搜索工具集成到其中。最後,我們將創建AI代理,定義他們的任務並組裝船員。準備好後,我們將經營研究助理代理商,以了解O3-Mini是否比DeepSeek-R1更好,更安全。

>先決條件

>在進行實施之前,讓我們簡要介紹我們需要開始的內容。擁有正確的設置可確保平穩的開發過程並避免不必要的中斷。

因此,請確保您有:

  • 工作的Python環境(3.8或更高)
  • > OpenAi和Serper(Google Scholar API)
  • API鍵
  • >

將它們安裝到位,我們準備開始建造!

>

步驟1:安裝所需庫

>

首先,我們需要安裝必要的庫。這些庫為文檔處理,AI代理編排和Web搜索功能提供了基礎。

!pip install crewai
!pip install 'crewai[tools]'
!pip install docling

這些圖書館在建立有效的AI驅動研究助理方面起著至關重要的作用。

    > Crewai為設計和管理AI代理提供了一個強大的框架,允許定義專業角色並實現有效的研究自動化。它還促進了任務委託,以確保AI代理之間的平穩協作。 此外,Crewai [工具]安裝了增強AI代理功能的基本工具,使其能夠與API進行交互,執行Web搜索並無縫處理數據。
  • 文檔專門從研究文檔中提取結構化知識,使其非常適合處理PDF,學術論文和基於文本的文件。在該項目中,它用於從Arxiv研究論文中提取關鍵發現。
  • 步驟2:導入必要的模塊
  • 在此,
  • >

> OS模塊可以安全地管理環境變量,例如API鍵,以進行平滑集成。

LLM為AI推理和響應產生提供動力。
import os
from crewai import LLM, Agent, Crew, Task
from crewai_tools import SerperDevTool
from crewai.knowledge.source.crew_docling_source import CrewDoclingSource
代理定義了專門的角色以有效地處理任務。

機組人員管理多個代理商,確保了無縫協作。 >

任務分配和跟踪特定的職責。
    Serperdevtool
  • 啟用Google Scholar搜索,改善外部參考檢索。
  • > CREWDOCLINGSOURCE整合了研究文檔,實現結構化知識提取和分析。
  • 步驟3:設置API鍵
  • 如何獲取API鍵?
  • >
  • OpenAI API鍵:在OpenAI上註冊並獲取API密鑰。 >
  • Serper API密鑰:在Serper.dev上註冊以獲取API密鑰。
這些API鍵允許訪問AI模型和Web搜索功能。 >

步驟4:加載研究文件

在此步驟中,我們將加載來自Arxiv的研究論文,使我們的AI模型從中提取見解。選定的論文涵蓋了關鍵主題:
os.environ['OPENAI_API_KEY'] = 'your_openai_api_key'
os.environ['SERPER_API_KEY'] = 'your_serper_api_key'

> https://arxiv.org/pdf/2501.12948:通過增強學習(DeepSeek-r1)探索LLMS中的推理能力。
  1. https://arxiv.org/pdf/2501.18438:比較O3-Mini和DeepSeek-r1的安全性
  2. https://arxiv.org/pdf/2401.02954:討論具有長期視角的擴展開源語言模型。
  3. >

步驟5:定義AI模型

現在我們將定義AI模型。
!pip install crewai
!pip install 'crewai[tools]'
!pip install docling
  • o3 mini:一種強大的推理的AI模型。
  • >
  • 溫度= 0:確保確定性輸出(相同查詢的相同答案)。
  • >

>步驟6:配置Web搜索工具

為了增強研究能力,我們整合了一個網絡搜索工具,該工具在提供的文檔中未找到所需的信息時檢索相關的學術論文。

import os
from crewai import LLM, Agent, Crew, Task
from crewai_tools import SerperDevTool
from crewai.knowledge.source.crew_docling_source import CrewDoclingSource
search_url =“ https://google.serper.dev/scholar”
  1. >這指定了Google Scholar Search API端點。它確保在學術文章,研究論文和學術來源而不是一般網頁中專門進行搜索。

n_results = 2

  1. 此參數限制了工具返回的搜索結果的數量,以確保僅檢索最相關的信息。在這種情況下,它將從Google Scholar中獲取前兩篇研究論文,優先考慮高質量的學術來源。通過減少結果的數量,助手保持響應簡潔有效,避免了不必要的信息過載,同時保持準確性。
  2. >
步驟7:定義文檔搜索的嵌入模型

>為了有效地從文檔中檢索相關信息,我們使用嵌入模型,將文本轉換為基於相似性搜索的數值表示。

crewai中的嵌入器用於將文本轉換為數值表示(嵌入),從而實現有效的文檔檢索和語義搜索。在這種情況下,嵌入模型由OpenAI提供,特別是使用“ Text-Embedding-ADA-002”,這是一種用於生成高質量嵌入的模型。從環境變量中檢索API鍵以對請求進行身份驗證。

>
os.environ['OPENAI_API_KEY'] = 'your_openai_api_key'
os.environ['SERPER_API_KEY'] = 'your_serper_api_key'
> Crewai支持包括OpenAI和Gemini(Google的AI模型)在內的多個嵌入式提供商,從而可以靈活地根據準確性,性能和成本考慮選擇最佳模型。

步驟8:創建AI代理

>現在,我們將創建研究任務所需的兩個AI代理:文檔搜索代理和Web搜索代理。

文檔搜索代理負責從提供的研究論文和文檔中檢索答案。它是分析技術內容和提取相關見解的專家。如果找不到所需的信息,它可以將查詢委託給Web搜索代理以進行進一步探索。 allow_delegation = true設置啟用此委託過程。

>
!pip install crewai
!pip install 'crewai[tools]'
!pip install docling
另一方面,Web搜索代理人旨在使用Google Scholar在線搜索缺失的信息。僅當文檔搜索代理未能在可用文檔中找到答案時,它才會介入。與文檔搜索代理不同,它無法進一步委派任務(lashe_delegation = false)。它使用Serper(Google Scholar API)作為獲取相關學術論文並確保准確響應的工具。

>步驟9:定義代理的任務
import os
from crewai import LLM, Agent, Crew, Task
from crewai_tools import SerperDevTool
from crewai.knowledge.source.crew_docling_source import CrewDoclingSource

>現在我們將為代理創建兩個任務。

>

第一個任務涉及使用可用的研究論文和文檔回答給定的問題。

>

>任務1:從文檔中提取信息

當基於文檔的搜索未產生答案時,下一個任務就會發揮作用。
os.environ['OPENAI_API_KEY'] = 'your_openai_api_key'
os.environ['SERPER_API_KEY'] = 'your_serper_api_key'
任務2:執行Web搜索,如果需要的話

>

步驟10:組裝船員

>
content_source = CrewDoclingSource(
    file_paths=[
        "https://arxiv.org/pdf/2501.12948",
        "https://arxiv.org/pdf/2501.18438",
        "https://arxiv.org/pdf/2401.02954"
    ],
)
crewai的工作人員通過協調文檔搜索代理和Web搜索代理來管理代理有效地完成任務。它首先在上傳的文檔中搜索並在Web搜索中搜索。

>

>知識_sources = [content_source]提供相關文檔,

>
    >嵌入式=嵌入器啟用語義搜索,
  • > >
  • 步驟11:運行研究助理
>初始查詢針對文檔,以檢查研究人員是否可以提供響應。提出的問題是“ O3-Mini vs DeepSeek-R1:哪一個更安全?”
llm = LLM(model="o3-mini", temperature=0)
>

>示例查詢1:

響應

serper_tool = SerperDevTool(
    search_url="https://google.serper.dev/scholar",
    n_results=2  # Fetch top 2 results
)

>在這裡,我們可以看到最終答案是由文檔搜索者生成的,因為它在提供的文檔中成功找到了所需的信息。

基於抹布的研究助理使用O3-Mini和Crewai>示例查詢2:

在這裡,問題“哪個更好,O3 mini還是DeepSeek R1?”文檔中不可用。系統將檢查文檔搜索代理是否可以找到答案;如果沒有,它將將任務委派給Web搜索代理

響應

embedder = {
    "provider": "openai",
    "config": {
        "model": "text-embedding-ada-002",
        "api_key": os.environ['OPENAI_API_KEY']
    }
}

從輸出中,我們觀察到響應是使用Web Searcher代理生成的,因為文檔研究人員代理找不到所需的信息。此外,它包括最終取回答案的來源。

>

結論

在這個項目中,我們成功地建立了一個由AI驅動的研究助理,該研究助理有效地從研究論文和網絡中分析了信息。通過使用Crewai進行代理協調,用於文檔處理的文檔以及用於學術搜索的Serper,我們創建了一個能夠回答具有結構性見解的複雜查詢的系統。

助手在文檔中首次搜索,並在需要時無縫將其委派給Web搜索,以確保准確的響應。這種方法通過自動化信息檢索和分析來提高研究效率。此外,通過將O3-Mini研究助理與Crewai的Crewdoclingsource和Serperdevtool集成,我們進一步增強了該系統的文檔分析功能。通過進一步的自定義,可以擴展此框架以支持更多的數據源,高級推理和改進的研究工作流程。

>

您可以在我們的免費課程中探索以Openai O3-Mini為特色的令人驚嘆的項目 - 從O3-Mini開始

常見問題

> Q1。什麼是crewai?

a。 Crewai是一個框架,可讓您創建和管理具有特定角色和任務的AI代理。它使多個AI代理之間的協作能夠自動化複雜的工作流程。 Crewai如何管理多個代理? Crewai使用一種結構化方法,每個代理具有定義的角色,並且可以在需要時委派任務。機組人員對這些代理進行協調以有效地完成任務。什麼是crewdoclingsource? CrewDoclingSource是Crewai中的文檔處理工具,它從研究論文,PDF和基於文本的文檔中提取結構化知識。

Q4。什麼是Serper API? Serper API是一種允許AI應用程序執行Google搜索查詢的工具,包括在Google Scholar上搜索學術論文。 Serper API可以免費使用嗎? Serper API提供免費的和付費計劃,對免費層中的搜索請求數量的限制。 Q6。 Serper API和傳統的Google搜索有什麼區別?與標準的Google搜索不同,Serper API提供了對搜索結果的結構化訪問,使AI代理可以有效提取相關的研究論文。 CREWDOCLINGSOURCE可以處理多個文件格式嗎?是的,它支持常見的研究文檔格式,包括PDF和基於文本的文件。 >

以上是基於抹布的研究助理使用O3-Mini和Crewai的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn