Rumah >Peranti teknologi >AI >Aliran Kerja Multi-Agen dengan Llamaindex untuk Penyelidikan & Penulisan

Aliran Kerja Multi-Agen dengan Llamaindex untuk Penyelidikan & Penulisan

尊渡假赌尊渡假赌尊渡假赌asal: 2025-03-05 11:16:11462semak imbas

Ejen model bahasa yang besar adalah alat yang berkuasa untuk mengautomasikan tugas seperti carian, penjanaan kandungan, dan semakan kualiti. Walau bagaimanapun, ejen tunggal sering tidak dapat melakukan segala -galanya dengan cekap, terutamanya apabila anda perlu mengintegrasikan sumber luaran (seperti carian web) dan beberapa langkah khusus (mis., Penggubalan vs kajian semula). Aliran kerja multi-agen membolehkan anda memecah tugas-tugas ini di kalangan agen yang berbeza, masing-masing dengan alat, kekangan, dan tanggungjawabnya sendiri. Dalam artikel ini, kita akan melihat bagaimana untuk membina sistem tiga-ejen-Penyelarasan, Writeagent, dan Reviewent-di mana setiap ejen mengendalikan bahagian tertentu dalam mewujudkan laporan sejarah ringkas di Internet. Kami juga akan memastikan sistem tidak akan terjebak dalam gelung carian, yang boleh membuang masa dan kredit.

Objektif Pembelajaran

fahami bagaimana aliran kerja multi-agen meningkatkan automasi tugas dengan LLMS.
belajar membina sistem tiga agen untuk penyelidikan, menulis, dan mengkaji semula tugas.
Melaksanakan perlindungan untuk mengelakkan gelung carian tak terhingga dalam aliran kerja automatik.
meneroka integrasi alat luaran seperti DuckDuckGo untuk pengambilan data yang cekap.
Membangunkan aliran kerja berkuasa LLM yang memastikan penjanaan kandungan berstruktur dan berkualiti tinggi.

Artikel ini diterbitkan sebagai sebahagian daripada Blogathon Sains Data

Jadual Kandungan ~~Model Bahasa (LLM)-OpenAI GPT-4~~ Alat penting untuk aliran kerja

Mengharapkan?

Kesimpulan

Soalan -soalan yang sering ditanya

Model Bahasa (LLM)-OpenAI GPT-4

Kami akan menggunakan OpenAI (Model = "GPT-4O") dari Llama-Index. Anda boleh menukar ini dengan LLM yang lain jika anda lebih suka, tetapi GPT-4 biasanya merupakan pilihan yang kuat untuk tugas penalaran pelbagai langkah.

alat penting untuk aliran kerja

alat adalah fungsi yang boleh dipanggil ejen untuk melakukan tindakan di luar pemodelan bahasa mereka sendiri. Alat tipikal termasuk:

carian web

Membaca/menulis fail

###############################################################################
# 1. INSTALLATION
###############################################################################
# Make sure you have the following installed:
#   pip install llama-index langchain duckduckgo-search

###############################################################################
# 2. IMPORTS
###############################################################################
%pip install llama-index langchain duckduckgo-search

from llama_index.llms.openai import OpenAI

# For DuckDuckGo search via LangChain
from langchain.utilities import DuckDuckGoSearchAPIWrapper

# llama-index workflow classes
from llama_index.core.workflow import Context
from llama_index.core.agent.workflow import (
    FunctionAgent,
    AgentWorkflow,
    AgentInput,
    AgentOutput,
    ToolCall,
    ToolCallResult,
    AgentStream
)

import asyncio

###############################################################################
# 3. CREATE LLM
###############################################################################
# Replace "sk-..." with your actual OpenAI API key
llm = OpenAI(model="gpt-4", api_key="OPENAI_API_KEY")

Kalkulator matematik

API untuk perkhidmatan luaran

Dalam contoh kami, alat utama ialah DuckDuckGoSearch, yang menggunakan DuckDuckGoSearchapiWrapper Langchain di bawah tudung. Kami juga mempunyai alat penolong untuk merakam nota, menulis laporan, dan menyemaknya.
Menentukan ejen AI untuk pelaksanaan tugas Setiap ejen adalah contoh

. Medan utama termasuk:
name dan keterangan

System_Prompt : Mengarahkan ejen mengenai peranan dan kekangannya

llm : Model bahasa yang digunakan

alat : fungsi yang boleh dipanggil ejen

can_handoff_to : ejen mana yang boleh dikendalikan oleh ejen ini ke

ResearchAgent

mencari web (sehingga had pertanyaan yang ditentukan)

menjimatkan penemuan yang relevan sebagai "nota"

tangan ke ejen seterusnya sekali maklumat yang cukup dikumpulkan

WriteAgent

menyusun laporan di Markdown, menggunakan apa sahaja nota yang dikumpulkan oleh penyelidikan

tangan ke kajian semula untuk maklum balas

ReviewAgent

mengkaji semula kandungan draf untuk ketepatan dan kesempurnaan

Jika perubahan diperlukan, tangan mengawal kembali ke WriteAgent

sebaliknya, memberikan kelulusan akhir

############################################################################### # 1. INSTALLATION ############################################################################### # Make sure you have the following installed: # pip install llama-index langchain duckduckgo-search ############################################################################### # 2. IMPORTS ############################################################################### %pip install llama-index langchain duckduckgo-search from llama_index.llms.openai import OpenAI # For DuckDuckGo search via LangChain from langchain.utilities import DuckDuckGoSearchAPIWrapper # llama-index workflow classes from llama_index.core.workflow import Context from llama_index.core.agent.workflow import ( FunctionAgent, AgentWorkflow, AgentInput, AgentOutput, ToolCall, ToolCallResult, AgentStream ) import asyncio ############################################################################### # 3. CREATE LLM ############################################################################### # Replace "sk-..." with your actual OpenAI API key llm = OpenAI(model="gpt-4", api_key="OPENAI_API_KEY")
alur kerja ejen - Penyelarasan Pelaksanaan Tugas

Agenworkflow menyelaraskan bagaimana mesej dan keadaan bergerak antara ejen. Apabila pengguna memulakan permintaan (mis., "Tuliskan saya laporan ringkas mengenai sejarah Internet ..."), aliran kerja:

Penyelidikan menerima prompt pengguna dan memutuskan sama ada untuk melakukan carian web atau merekodkan beberapa nota.
WriteAgent menggunakan nota untuk membuat output berstruktur atau gaya (seperti dokumen markdown).
ReviewAgent memeriksa output akhir dan sama ada menghantarnya kembali untuk semakan atau meluluskannya.

Bina aliran kerja

Dalam langkah ini, kami mentakrifkan aliran kerja ejen, yang merangkumi penyelidikan, menulis, dan mengkaji semula ejen. Root_agent ditetapkan kepada penyelidikan_agent, yang bermaksud proses bermula dengan pengumpulan penyelidikan. Keadaan awal mengandungi ruang letak untuk nota penyelidikan, laporan kandungan, dan status semakan.

Jalankan aliran kerja

###############################################################################
# 4. DEFINE DUCKDUCKGO SEARCH TOOL WITH SAFEGUARDS
###############################################################################
# We wrap LangChain's DuckDuckGoSearchAPIWrapper with our own logic
# to prevent repeated or excessive searches.

duckduckgo = DuckDuckGoSearchAPIWrapper()

MAX_SEARCH_CALLS = 2
search_call_count = 0
past_queries = set()

async def safe_duckduckgo_search(query: str) -> str:
    """
    A DuckDuckGo-based search function that:
      1) Prevents more than MAX_SEARCH_CALLS total searches.
      2) Skips duplicate queries.
    """
    global search_call_count, past_queries

    # Check for duplicate queries
    if query in past_queries:
        return f"Already searched for '{query}'. Avoiding duplicate search."

    # Check if we've reached the max search calls
    if search_call_count >= MAX_SEARCH_CALLS:
        return "Search limit reached, no more searches allowed."

    # Otherwise, perform the search
    search_call_count += 1
    past_queries.add(query)

    # DuckDuckGoSearchAPIWrapper.run(...) is synchronous, but we have an async signature
    result = duckduckgo.run(query)
    return str(result)
    
###############################################################################
# 5. OTHER TOOL FUNCTIONS: record_notes, write_report, review_report
###############################################################################
async def record_notes(ctx: Context, notes: str, notes_title: str) -> str:
    """Store research notes under a given title in the shared context."""
    current_state = await ctx.get("state")
    if "research_notes" not in current_state:
        current_state["research_notes"] = {}
    current_state["research_notes"][notes_title] = notes
    await ctx.set("state", current_state)
    return "Notes recorded."

async def write_report(ctx: Context, report_content: str) -> str:
    """Write a report in markdown, storing it in the shared context."""
    current_state = await ctx.get("state")
    current_state["report_content"] = report_content
    await ctx.set("state", current_state)
    return "Report written."

async def review_report(ctx: Context, review: str) -> str:
    """Review the report and store feedback in the shared context."""
    current_state = await ctx.get("state")
    current_state["review"] = review
    await ctx.set("state", current_state)
    return "Report reviewed."

alur kerja dilaksanakan menggunakan permintaan pengguna, yang menentukan topik dan titik penting untuk diliputi dalam laporan. Permintaan dalam contoh ini meminta laporan ringkas mengenai sejarah Internet, termasuk asal -usulnya, pembangunan World Wide Web, dan evolusi modennya. Aliran kerja memproses permintaan ini dengan menyelaraskan ejen.

acara aliran untuk debug atau pemerhatian

###############################################################################
# 6. DEFINE AGENTS
###############################################################################
# We have three agents with distinct responsibilities:
# 1. ResearchAgent  - uses DuckDuckGo to gather info (max 2 searches).
# 2. WriteAgent     - composes the final report.
# 3. ReviewAgent    - reviews the final report.

research_agent = FunctionAgent(
    name="ResearchAgent",
    description=(
        "A research agent that searches the web using DuckDuckGo. "
        "It must not exceed 2 searches total, and must avoid repeating the same query. "
        "Once sufficient information is collected, it should hand off to the WriteAgent."
    ),
    system_prompt=(
        "You are the ResearchAgent. Your goal is to gather sufficient information on the topic. "
        "Only perform at most 2 distinct searches. If you have enough info or have reached 2 searches, "
        "handoff to the next agent. Avoid infinite loops!"
    ),
    llm=llm,
    tools=[
        safe_duckduckgo_search,  # Our DuckDuckGo-based search function
        record_notes
    ],
    can_handoff_to=["WriteAgent"]
)

write_agent = FunctionAgent(
    name="WriteAgent",
    description=(
        "Writes a markdown report based on the research notes. "
        "Then hands off to the ReviewAgent for feedback."
    ),
    system_prompt=(
        "You are the WriteAgent. Draft a structured markdown report based on the notes. "
        "After writing, hand off to the ReviewAgent."
    ),
    llm=llm,
    tools=[write_report],
    can_handoff_to=["ReviewAgent", "ResearchAgent"]
)

review_agent = FunctionAgent(
    name="ReviewAgent",
    description=(
        "Reviews the final report for correctness. Approves or requests changes."
    ),
    system_prompt=(
        "You are the ReviewAgent. Read the report, provide feedback, and either approve "
        "or request revisions. If revisions are needed, handoff to WriteAgent."
    ),
    llm=llm,
    tools=[review_report],
    can_handoff_to=["WriteAgent"]
)

Untuk memantau pelaksanaan aliran kerja, kami mengalirkan acara dan mencetak butiran mengenai aktiviti ejen. Ini membolehkan kami mengesan ejen yang sedang bekerja, melihat output pertengahan, dan memeriksa panggilan alat yang dibuat oleh ejen. Maklumat debug seperti penggunaan alat dan respons dipaparkan untuk penglihatan yang lebih baik.

###############################################################################
# 1. INSTALLATION
###############################################################################
# Make sure you have the following installed:
#   pip install llama-index langchain duckduckgo-search

###############################################################################
# 2. IMPORTS
###############################################################################
%pip install llama-index langchain duckduckgo-search

from llama_index.llms.openai import OpenAI

# For DuckDuckGo search via LangChain
from langchain.utilities import DuckDuckGoSearchAPIWrapper

# llama-index workflow classes
from llama_index.core.workflow import Context
from llama_index.core.agent.workflow import (
    FunctionAgent,
    AgentWorkflow,
    AgentInput,
    AgentOutput,
    ToolCall,
    ToolCallResult,
    AgentStream
)

import asyncio

###############################################################################
# 3. CREATE LLM
###############################################################################
# Replace "sk-..." with your actual OpenAI API key
llm = OpenAI(model="gpt-4", api_key="OPENAI_API_KEY")

Ambil dan cetak laporan akhir

Setelah aliran kerja selesai, kami mengekstrak keadaan akhir, yang mengandungi laporan yang dihasilkan. Kandungan Laporan dicetak, diikuti dengan sebarang maklum balas ulasan dari ejen semakan. Ini memastikan output selesai dan boleh ditapis lebih lanjut jika perlu.

###############################################################################
# 4. DEFINE DUCKDUCKGO SEARCH TOOL WITH SAFEGUARDS
###############################################################################
# We wrap LangChain's DuckDuckGoSearchAPIWrapper with our own logic
# to prevent repeated or excessive searches.

duckduckgo = DuckDuckGoSearchAPIWrapper()

MAX_SEARCH_CALLS = 2
search_call_count = 0
past_queries = set()

async def safe_duckduckgo_search(query: str) -> str:
    """
    A DuckDuckGo-based search function that:
      1) Prevents more than MAX_SEARCH_CALLS total searches.
      2) Skips duplicate queries.
    """
    global search_call_count, past_queries

    # Check for duplicate queries
    if query in past_queries:
        return f"Already searched for '{query}'. Avoiding duplicate search."

    # Check if we've reached the max search calls
    if search_call_count >= MAX_SEARCH_CALLS:
        return "Search limit reached, no more searches allowed."

    # Otherwise, perform the search
    search_call_count += 1
    past_queries.add(query)

    # DuckDuckGoSearchAPIWrapper.run(...) is synchronous, but we have an async signature
    result = duckduckgo.run(query)
    return str(result)
    
###############################################################################
# 5. OTHER TOOL FUNCTIONS: record_notes, write_report, review_report
###############################################################################
async def record_notes(ctx: Context, notes: str, notes_title: str) -> str:
    """Store research notes under a given title in the shared context."""
    current_state = await ctx.get("state")
    if "research_notes" not in current_state:
        current_state["research_notes"] = {}
    current_state["research_notes"][notes_title] = notes
    await ctx.set("state", current_state)
    return "Notes recorded."

async def write_report(ctx: Context, report_content: str) -> str:
    """Write a report in markdown, storing it in the shared context."""
    current_state = await ctx.get("state")
    current_state["report_content"] = report_content
    await ctx.set("state", current_state)
    return "Report written."

async def review_report(ctx: Context, review: str) -> str:
    """Review the report and store feedback in the shared context."""
    current_state = await ctx.get("state")
    current_state["review"] = review
    await ctx.set("state", current_state)
    return "Report reviewed."

Aliran Kerja Multi-Agen dengan Llamaindex untuk Penyelidikan & Penulisan

Mengelakkan gelung carian tak terhingga Aliran Kerja Multi-Agen dengan Llamaindex untuk Penyelidikan & Penulisan

Apabila menggunakan alat carian web, mungkin LLM mendapatkan "keliru" dan berulang kali memanggil fungsi carian. Ini boleh membawa kepada kos yang tidak perlu atau penggunaan masa. Untuk mengelakkannya, kami menggunakan dua mekanisme:

Hard Limitwe Set

max_search_calls = 2

Duplicate DetectionWe menyimpan pertanyaan masa lalu dalam set ( past_queries
Jika salah satu keadaan dipenuhi (carian maksimum atau pertanyaan pendua), fungsi kami_duckduckgo_search

apa yang diharapkan?

Penyelidikan

menerima permintaan pengguna untuk menulis laporan ringkas mengenai sejarah Internet. mungkin melakukan sehingga dua carian duckduckgo yang berbeza (mis., "Sejarah Internet" dan "World Wide Web Tim Berners-Lee," dan lain-lain), kemudian memanggil Record_notes untuk menyimpan ringkasan.

membaca "penyelidikan_notes" dari konteks yang dikongsi. draf laporan markdown pendek.

Menilai kandungan. Jika perubahan diperlukan, ia boleh lulus kawalan kembali ke Writeagent. Jika tidak, ia meluluskan laporan.

output akhir disimpan dalam

final_state ["Report_Content"].

Kesimpulan

dengan memisahkan aliran kerja anda ke dalam agen yang berbeza untuk carian

menulis

, dan

kajian , anda boleh membuat sistem yang kuat, modular yang: mengumpulkan maklumat yang relevan (dengan cara yang terkawal, menghalang carian yang berlebihan) menghasilkan output berstruktur, berkualiti tinggi

Integrasi DuckDuckGO menggunakan Langchain menawarkan penyelesaian carian web plug-and-play untuk aliran kerja multi-agen tanpa memerlukan kunci API atau kelayakan khusus. Digabungkan dengan perlindungan terbina dalam (had panggilan carian, pengesanan pendua), sistem ini teguh, cekap, dan sesuai untuk pelbagai tugas penyelidikan dan generasi kandungan.

Takeaways Key

aliran kerja multi-agen meningkatkan kecekapan dengan memberikan peranan khusus kepada ejen LLM.
menggunakan alat luaran seperti DuckDuckGo meningkatkan keupayaan penyelidikan ejen LLM.
Melaksanakan kekangan, seperti had carian, menghalang penggunaan sumber yang tidak perlu.
aliran kerja ejen yang diselaraskan memastikan penjanaan kandungan berstruktur, berkualiti tinggi.
Mekanisme handoff yang direka dengan baik membantu mengelakkan tugas berlebihan dan gelung tak terhingga.

Soalan Lazim

Q1. Kenapa menggunakan pelbagai ejen dan bukannya satu ejen, semua tujuan?

a. Memisahkan tanggungjawab merentasi ejen (penyelidikan, menulis, mengkaji semula) memastikan setiap langkah jelas dan mudah dikendalikan. Ia juga mengurangkan kekeliruan dalam membuat keputusan model dan memupuk output berstruktur yang lebih tepat. Bagaimana saya mengehadkan bilangan carian web?

~~Q3. Bagaimana jika ejen mengulangi pertanyaan yang sama berbilang kali?~~

a. Kami mengekalkan set python yang dipanggil Past_queries untuk mengesan pertanyaan berulang. Sekiranya pertanyaan sudah ada dalam set itu, alat itu akan melangkaui carian sebenar dan mengembalikan mesej ringkas, menghalang pertanyaan pendua daripada berjalan.

Q4. Bolehkah saya menukar arahan untuk menyesuaikan alur kerja ini untuk topik atau gaya yang berbeza? a. Sudah tentu. Anda boleh mengedit setiap sistem_prompt ejen untuk menyesuaikan arahan ke domain atau gaya penulisan yang anda inginkan. Sebagai contoh, anda boleh mengarahkan WriteAgent untuk menghasilkan senarai peluru, esei naratif, atau ringkasan teknikal.

a. Anda boleh menukar OpenAI (Model = "GPT-4") untuk model lain yang disokong oleh Llama-Index (mis., GPT-3.5, atau model tempatan). Seni bina tetap sama, walaupun beberapa model boleh menghasilkan output berkualiti yang berbeza.

Atas ialah kandungan terperinci Aliran Kerja Multi-Agen dengan Llamaindex untuk Penyelidikan & Penulisan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Python print Resource define if for include math using number function this history table everything gpt llama langchain prompt Research Tool Prompt

Kenyataan：

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Artikel sebelumnya：Tutorial PGVector: Mengintegrasikan Vektor Carian ke PostgreSQLArtikel seterusnya：Tutorial PGVector: Mengintegrasikan Vektor Carian ke PostgreSQL

Artikel berkaitan

Lihat lagi