Panduan Lengkap untuk Langchain di Python-Tutorial Python-php.cn

Rumah

pembangunan bahagian belakang

Tutorial Python

Panduan Lengkap untuk Langchain di Python

尊渡假赌尊渡假赌尊渡假赌

Feb 10, 2025 am 08:29 AM

Langchain: Perpustakaan Python yang kuat untuk membina, bereksperimen dan menganalisis model bahasa dan ejen

A Complete Guide to LangChain in Python

mata teras:

Langchain adalah perpustakaan Python yang kuat yang membolehkan pemaju dan penyelidik membuat, mencuba, dan menganalisis model dan ejen bahasa. Ia menyediakan peminat pemprosesan bahasa semulajadi (NLP) dengan set ciri yang kaya, dari membina model tersuai untuk memanipulasi data teks yang cekap. Dalam panduan komprehensif ini, kami akan menggali komponen asas Langchain dan menunjukkan bagaimana untuk memanfaatkan kekuasaannya di Python.

Tetapan Alam Sekitar:

untuk mempelajari artikel ini, buat folder baru dan pasang Langchain dan Openai menggunakan PIP:

pip3 install langchain openai

ejen:

Di Langchain, ejen adalah entiti yang dapat memahami dan menghasilkan teks. Ejen-ejen ini boleh mengkonfigurasi tingkah laku dan sumber data tertentu dan dilatih untuk melaksanakan pelbagai tugas yang berkaitan dengan bahasa, menjadikannya alat pelbagai fungsi untuk pelbagai aplikasi.

Buat ejen Langchain: Agensi -agensi boleh dikonfigurasikan untuk menggunakan "alat" untuk mengumpul data yang diperlukan dan membangunkan respons yang baik. Sila lihat contoh di bawah. Ia menggunakan API SERP (API Carian Internet) untuk mencari maklumat yang berkaitan dengan soalan atau input dan untuk bertindak balas. Ia juga menggunakan alat LLM-Math untuk melaksanakan operasi matematik-contohnya, menukar unit atau mencari perubahan peratusan antara dua nilai:

seperti yang anda dapat lihat, setelah menyelesaikan semua import asas dan permulaan LLM (llm = openai (model = "gpt-3.5-turbo", suhu = 0)), kod menggunakan alat = load_tools (["Serpapi" , "llm-math"], llm = llm) Muatkan alat yang diperlukan untuk ejen berfungsi. Ia kemudian menggunakan fungsi initialize_agent untuk membuat ejen, menyediakannya dengan alat yang ditentukan, dan menyediakannya dengan penerangan sifar_shot_react_description, yang bermaksud ia tidak akan mengingati masalah sebelumnya.

from langchain.agents import load_tools
from langchain.agents import initialize_agent
from langchain.agents import AgentType
from langchain.llms import OpenAI
import os

os.environ["OPENAI_API_KEY"] = "YOUR_OPENAI_API_KEY"
os.environ["SERPAPI_API_KEY"] = "YOUR_SERP_API_KEY" # 获取你的Serp API密钥：https://serpapi.com/

OpenAI.api_key = "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"
llm = OpenAI(model="gpt-3.5-turbo", temperature=0)
tools = load_tools(["serpapi", "llm-math"], llm=llm)
agent = initialize_agent(tools, llm, agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION, verbose=True)
agent.run("How much energy did wind turbines produce worldwide in 2022?")

Contoh ujian agensi 1:

Mari uji ejen ini dengan input berikut:

<code>"How much energy did wind turbines produce worldwide in 2022?"</code>

seperti yang anda lihat, ia menggunakan logik berikut: A Complete Guide to LangChain in Python

Cari "Pengeluaran Tenaga Turbin Angin Di Seluruh Dunia 2022" Menggunakan API Carian Internet SERP
hasil terbaik untuk analisis
Dapatkan nombor yang relevan
Gunakan alat LLM-Math untuk menukar 906 GW ke Joule kerana kami meminta tenaga, bukan kuasa

Contoh ujian agensi 2:

Ejen Langchain tidak terhad untuk mencari Internet. Kami boleh menyambungkan hampir semua sumber data (termasuk kami sendiri) kepada ejen Langchain dan bertanya soalan mengenai data. Mari cuba buat ejen yang terlatih dalam dataset CSV.

Muat turun dataset filem dan tv Netflix ini dari Shivam Bansal di Kaggle dan gerakkannya ke direktori anda. Sekarang tambahkan kod ini ke fail python baru:

pip3 install langchain openai

Kod ini memanggil fungsi create_csv_agent dan menggunakan dataset netflix_titles.csv. Angka berikut menunjukkan ujian kami.

A Complete Guide to LangChain in Python

Seperti yang ditunjukkan di atas, logiknya adalah untuk mencari semua kejadian "Christian Bale" dalam lajur pelakon.

kita juga boleh membuat ejen dataframe Pandas seperti ini:

from langchain.agents import load_tools
from langchain.agents import initialize_agent
from langchain.agents import AgentType
from langchain.llms import OpenAI
import os

os.environ["OPENAI_API_KEY"] = "YOUR_OPENAI_API_KEY"
os.environ["SERPAPI_API_KEY"] = "YOUR_SERP_API_KEY" # 获取你的Serp API密钥：https://serpapi.com/

OpenAI.api_key = "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"
llm = OpenAI(model="gpt-3.5-turbo", temperature=0)
tools = load_tools(["serpapi", "llm-math"], llm=llm)
agent = initialize_agent(tools, llm, agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION, verbose=True)
agent.run("How much energy did wind turbines produce worldwide in 2022?")

Jika kita menjalankannya, kita akan melihat hasilnya seperti yang ditunjukkan di bawah.

A Complete Guide to LangChain in Python

Ini hanya beberapa contoh. Kita boleh menggunakan hampir mana -mana API atau dataset dengan Langkhain.

Model:

Terdapat tiga jenis model dalam Langchain: Model Bahasa Besar (LLM), model sembang dan model penyembuhan teks. Mari kita meneroka setiap jenis model dengan beberapa contoh.

model bahasa yang besar:

Langchain menyediakan cara untuk menggunakan model bahasa yang besar dalam Python untuk menghasilkan output teks berdasarkan input teks. Ia tidak begitu rumit seperti model sembang dan paling sesuai untuk tugas bahasa input-output mudah. Berikut adalah contoh menggunakan OpenAI:

<code>"How much energy did wind turbines produce worldwide in 2022?"</code>

Seperti yang ditunjukkan di atas, ia menggunakan model GPT-3.5-Turbo untuk menghasilkan output untuk input yang disediakan ("Datang dengan nama rap untuk Matt Nikonorov"). Dalam contoh ini, saya menetapkan suhu kepada 0.9 untuk menjadikan LLM lebih kreatif. Ia datang dengan "MC Megamatt." Saya memberikannya tanda 9/10.

Model sembang:

Sangat menyenangkan untuk mendapatkan model LLM untuk menghasilkan nama rap, tetapi jika kita mahu jawapan dan perbualan yang lebih kompleks, kita perlu menggunakan model sembang untuk meningkatkan kemahiran kita. Secara teknikal, bagaimana model sembang berbeza dari model bahasa yang besar? Dalam kata -kata dokumen Langchain:

Model sembang adalah varian model bahasa yang besar. Walaupun model sembang menggunakan model bahasa yang besar di latar belakang, mereka menggunakan antara muka yang sedikit berbeza. Mereka tidak menggunakan "input teks, output teks" API, tetapi gunakan "mesej sembang" sebagai antara muka untuk input dan output.

ini adalah skrip model sembang python yang mudah:

pip3 install langchain openai

Seperti yang ditunjukkan di atas, kod pertama menghantar sistemmessage dan memberitahu chatbot untuk bersahabat dan tidak formal, dan kemudian ia menghantar manusia dan memberitahu chatbot untuk meyakinkan kami bahawa Djokovich lebih baik daripada Federer.

Jika anda menjalankan model chatbot ini, anda akan melihat hasil yang ditunjukkan di bawah.

A Complete Guide to LangChain in Python

Embeddings:

Embing menyediakan cara untuk menukar perkataan dan nombor dalam blok teks ke dalam vektor yang kemudiannya boleh dikaitkan dengan perkataan atau nombor lain. Ini mungkin terdengar abstrak, jadi mari kita lihat contoh:

Ini ini akan mengembalikan senarai nombor titik terapung: [[0.00227628853168, Inilah yang kelihatan seperti penyembuhan.

from langchain.agents import load_tools
from langchain.agents import initialize_agent
from langchain.agents import AgentType
from langchain.llms import OpenAI
import os

os.environ["OPENAI_API_KEY"] = "YOUR_OPENAI_API_KEY"
os.environ["SERPAPI_API_KEY"] = "YOUR_SERP_API_KEY" # 获取你的Serp API密钥：https://serpapi.com/

OpenAI.api_key = "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"
llm = OpenAI(model="gpt-3.5-turbo", temperature=0)
tools = load_tools(["serpapi", "llm-math"], llm=llm)
agent = initialize_agent(tools, llm, agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION, verbose=True)
agent.run("How much energy did wind turbines produce worldwide in 2022?")

Kes penggunaan model tertanam:

Jika kita mahu melatih chatbot atau LLM untuk menjawab soalan yang berkaitan dengan data atau sampel teks tertentu, kita perlu menggunakan embedding. Mari buat fail CSV mudah (embs.csv) dengan lajur "teks" yang mengandungi tiga keping maklumat:

Sekarang, ini adalah skrip yang akan menggunakan embeds untuk mendapatkan soalan "Siapa yang paling tinggi manusia?"

<code>"How much energy did wind turbines produce worldwide in 2022?"</code>

Jika kita menjalankan kod ini, kita akan melihatnya output "Robert Wadlow adalah manusia tertinggi yang pernah". Kod ini mendapati jawapan yang betul dengan mendapatkan penyembuhan setiap maklumat dan mencari penyembuhan yang paling relevan dengan soalan "Siapa yang paling tinggi manusia?". Kuasa tertanam!

from langchain.llms import OpenAI
from langchain.chat_models import ChatOpenAI
from langchain.agents.agent_types import AgentType
from langchain.agents import create_csv_agent
import os

os.environ["OPENAI_API_KEY"] = "YOUR_OPENAI_API_KEY"

agent = create_csv_agent(
    OpenAI(temperature=0),
    "netflix_titles.csv",
    verbose=True,
    agent_type=AgentType.ZERO_SHOT_REACT_DESCRIPTION,
)

agent.run("In how many movies was Christian Bale casted")

ketulan:

Model Langchain tidak dapat memproses teks besar pada masa yang sama dan menggunakannya untuk menghasilkan respons. Di sinilah blok dan segmentasi teks masuk. Mari kita lihat dua cara mudah untuk memecah data teks ke dalam blok sebelum memberi makan kepada Langchain.

blok segmen dengan watak:

Blok segmentasi rekursif:

Jika kita mahu secara tegas memisahkan teks oleh watak -watak panjang tertentu, kita boleh menggunakan RecursiveCharactertextSplitter:

from langchain.agents import create_pandas_dataframe_agent
from langchain.chat_models import ChatOpenAI
from langchain.agents.agent_types import AgentType
from langchain.llms import OpenAI
import pandas as pd
import os

os.environ["OPENAI_API_KEY"] = "YOUR_OPENAI_KEY"
df = pd.read_csv("netflix_titles.csv")

agent = create_pandas_dataframe_agent(OpenAI(temperature=0), df, verbose=True)

agent.run("In what year were the most comedy movies released?")

saiz blok dan tumpang tindih:

Apabila melihat contoh di atas, anda mungkin ingin mengetahui dengan tepat apa saiz blok dan parameter bertindih, dan bagaimana ia mempengaruhi prestasi. Ini dapat dijelaskan dalam dua cara:

from langchain.llms import OpenAI
import os
os.environ["OPENAI_API_KEY"] = "YOUR_OPENAI_API_KEY"

llm = OpenAI(model="gpt-3.5-turbo", temperature=0.9)
print(llm("Come up with a rap name for Matt Nikonorov"))

Saiz blok menentukan bilangan aksara dalam setiap blok. Semakin besar saiz blok, semakin banyak data ada di blok, semakin lama ia mengambil langchain untuk memprosesnya dan menghasilkan output, dan sebaliknya.
Blok bertindih adalah kandungan yang berkongsi maklumat antara blok supaya mereka berkongsi beberapa konteks. Semakin tinggi blok bertindih, semakin berlebihan blok kita, semakin rendah blok bertindih, konteks yang kurang dikongsi antara blok. Biasanya, tumpang tindih blok yang baik adalah 10% hingga 20% daripada saiz blok, walaupun tumpang tindih blok yang dikehendaki berbeza -beza mengikut jenis teks dan kes penggunaan yang berbeza.

rantai:

Bab pada dasarnya adalah pelbagai fungsi LLM yang dikaitkan bersama untuk melaksanakan tugas yang lebih kompleks yang tidak dapat dicapai melalui input LLM yang mudah; Mari kita lihat contoh yang sejuk:

pip3 install langchain openai

Kod ini memasuki dua pembolehubah ke dalam arahannya dan mengembangkan jawapan kreatif (suhu = 0.9). Dalam contoh ini, kami memintanya untuk menghasilkan tajuk yang baik untuk filem seram mengenai matematik. Output selepas menjalankan kod ini adalah "kutukan mengira", tetapi ini tidak menunjukkan fungsi penuh rantai.

mari kita lihat contoh yang lebih praktikal:

from langchain.agents import load_tools
from langchain.agents import initialize_agent
from langchain.agents import AgentType
from langchain.llms import OpenAI
import os

os.environ["OPENAI_API_KEY"] = "YOUR_OPENAI_API_KEY"
os.environ["SERPAPI_API_KEY"] = "YOUR_SERP_API_KEY" # 获取你的Serp API密钥：https://serpapi.com/

OpenAI.api_key = "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"
llm = OpenAI(model="gpt-3.5-turbo", temperature=0)
tools = load_tools(["serpapi", "llm-math"], llm=llm)
agent = initialize_agent(tools, llm, agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION, verbose=True)
agent.run("How much energy did wind turbines produce worldwide in 2022?")

Kod ini mungkin kelihatan mengelirukan, jadi mari kita jelaskan langkah demi langkah.

Kod ini membaca biografi pendek NAS (Artis Hip Hop) dan mengekstrak nilai -nilai berikut dari teks dan formatnya sebagai objek JSON:

Nama Artis
genre muzik artis
album pertama artis
tahun pelepasan album pertama artis

dengan segera, kami juga menyatakan "pastikan untuk menjawab dalam format yang betul" supaya kami sentiasa mendapat output dalam format JSON. Berikut adalah output kod ini:

<code>"How much energy did wind turbines produce worldwide in 2022?"</code>

Dengan menyediakan corak JSON ke fungsi create_structed_output_chain, kami membuat rantai meletakkan outputnya ke dalam format JSON.

Beyond Openai:

Walaupun saya telah menggunakan model OpenAI sebagai contoh fungsi Langchain yang berlainan, ia tidak terhad kepada model OpenAI. Kita boleh menggunakan Langchain dengan banyak perkhidmatan LLM dan AI yang lain. (Ini adalah senarai lengkap llms bersepadu Langchain.)

Sebagai contoh, kita boleh menggunakan kohere dengan Langchain. Ini adalah dokumentasi untuk Integrasi Langchain Cohere, tetapi untuk memberikan contoh praktikal, setelah memasang Cohere menggunakan PIP3 Install Cohere, kita boleh menulis kod Q & A yang mudah menggunakan Langchain dan Cohere seperti berikut:

from langchain.llms import OpenAI
from langchain.chat_models import ChatOpenAI
from langchain.agents.agent_types import AgentType
from langchain.agents import create_csv_agent
import os

os.environ["OPENAI_API_KEY"] = "YOUR_OPENAI_API_KEY"

agent = create_csv_agent(
    OpenAI(temperature=0),
    "netflix_titles.csv",
    verbose=True,
    agent_type=AgentType.ZERO_SHOT_REACT_DESCRIPTION,
)

agent.run("In how many movies was Christian Bale casted")

Kod di atas menghasilkan output berikut:

from langchain.agents import create_pandas_dataframe_agent
from langchain.chat_models import ChatOpenAI
from langchain.agents.agent_types import AgentType
from langchain.llms import OpenAI
import pandas as pd
import os

os.environ["OPENAI_API_KEY"] = "YOUR_OPENAI_KEY"
df = pd.read_csv("netflix_titles.csv")

agent = create_pandas_dataframe_agent(OpenAI(temperature=0), df, verbose=True)

agent.run("In what year were the most comedy movies released?")

Kesimpulan:

Dalam panduan ini, anda telah melihat pelbagai aspek dan fungsi Langchain. Sebaik sahaja anda menguasai pengetahuan ini, anda boleh menggunakan keupayaan Langchain untuk melakukan kerja NLP, sama ada anda seorang penyelidik, pemaju atau peminat.

Anda boleh mencari repositori pada github yang mengandungi semua imej dan fail nas.txt dalam artikel ini.

Saya doakan pengekodan gembira dan bereksperimen dengan Langchain di Python!

Atas ialah kandungan terperinci Panduan Lengkap untuk Langchain di Python. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Artikel Berkaitan

Python vs C: Memahami perbezaan utamaApr 21, 2025 am 12:18 AM

Python dan C masing -masing mempunyai kelebihan sendiri, dan pilihannya harus berdasarkan keperluan projek. 1) Python sesuai untuk pembangunan pesat dan pemprosesan data kerana sintaks ringkas dan menaip dinamik. 2) C sesuai untuk prestasi tinggi dan pengaturcaraan sistem kerana menaip statik dan pengurusan memori manual.

Python vs C: Bahasa mana yang harus dipilih untuk projek anda?Apr 21, 2025 am 12:17 AM

Memilih Python atau C bergantung kepada keperluan projek: 1) Jika anda memerlukan pembangunan pesat, pemprosesan data dan reka bentuk prototaip, pilih Python; 2) Jika anda memerlukan prestasi tinggi, latensi rendah dan kawalan perkakasan yang rapat, pilih C.

Mencapai matlamat python anda: kekuatan 2 jam sehariApr 20, 2025 am 12:21 AM

Dengan melabur 2 jam pembelajaran python setiap hari, anda dapat meningkatkan kemahiran pengaturcaraan anda dengan berkesan. 1. Ketahui Pengetahuan Baru: Baca dokumen atau tutorial menonton. 2. Amalan: Tulis kod dan latihan lengkap. 3. Kajian: Menyatukan kandungan yang telah anda pelajari. 4. Amalan Projek: Sapukan apa yang telah anda pelajari dalam projek sebenar. Pelan pembelajaran berstruktur seperti ini dapat membantu anda menguasai Python secara sistematik dan mencapai matlamat kerjaya.

Memaksimumkan 2 Jam: Strategi Pembelajaran Python BerkesanApr 20, 2025 am 12:20 AM

Kaedah untuk belajar python dengan cekap dalam masa dua jam termasuk: 1. Semak pengetahuan asas dan pastikan anda sudah biasa dengan pemasangan Python dan sintaks asas; 2. Memahami konsep teras python, seperti pembolehubah, senarai, fungsi, dan lain -lain; 3. Menguasai penggunaan asas dan lanjutan dengan menggunakan contoh; 4. Belajar kesilapan biasa dan teknik debugging; 5. Memohon pengoptimuman prestasi dan amalan terbaik, seperti menggunakan komprehensif senarai dan mengikuti panduan gaya PEP8.

Memilih antara python dan c: bahasa yang sesuai untuk andaApr 20, 2025 am 12:20 AM

Python sesuai untuk pemula dan sains data, dan C sesuai untuk pengaturcaraan sistem dan pembangunan permainan. 1. Python adalah mudah dan mudah digunakan, sesuai untuk sains data dan pembangunan web. 2.C menyediakan prestasi dan kawalan yang tinggi, sesuai untuk pembangunan permainan dan pengaturcaraan sistem. Pilihan harus berdasarkan keperluan projek dan kepentingan peribadi.

Python vs C: Analisis perbandingan bahasa pengaturcaraanApr 20, 2025 am 12:14 AM

Python lebih sesuai untuk sains data dan perkembangan pesat, manakala C lebih sesuai untuk prestasi tinggi dan pengaturcaraan sistem. 1. Sintaks Python adalah ringkas dan mudah dipelajari, sesuai untuk pemprosesan data dan pengkomputeran saintifik. 2.C mempunyai sintaks kompleks tetapi prestasi yang sangat baik dan sering digunakan dalam pembangunan permainan dan pengaturcaraan sistem.

2 jam sehari: potensi pembelajaran pythonApr 20, 2025 am 12:14 AM

Adalah mungkin untuk melabur dua jam sehari untuk belajar Python. 1. Belajar Pengetahuan Baru: Ketahui konsep baru dalam satu jam, seperti senarai dan kamus. 2. Amalan dan Amalan: Gunakan satu jam untuk melakukan latihan pengaturcaraan, seperti menulis program kecil. Melalui perancangan dan ketekunan yang munasabah, anda boleh menguasai konsep teras Python dalam masa yang singkat.

Python vs C: Lengkung pembelajaran dan kemudahan penggunaanApr 19, 2025 am 12:20 AM

Python lebih mudah dipelajari dan digunakan, manakala C lebih kuat tetapi kompleks. 1. Sintaks Python adalah ringkas dan sesuai untuk pemula. Penaipan dinamik dan pengurusan memori automatik menjadikannya mudah digunakan, tetapi boleh menyebabkan kesilapan runtime. 2.C menyediakan kawalan peringkat rendah dan ciri-ciri canggih, sesuai untuk aplikasi berprestasi tinggi, tetapi mempunyai ambang pembelajaran yang tinggi dan memerlukan memori manual dan pengurusan keselamatan jenis.

See all articles

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Tunjukkan Lagi

Artikel Panas

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

3 minggu yang laluByDDD

Apa yang Baru di Windows 11 KB5054979 & Cara Memperbaiki Masalah Kemas Kini

2 minggu yang laluByDDD

Di mana untuk mencari kad kunci kawalan kren di atomfall

3 minggu yang laluByDDD

<🎜>: Rails Dead - Cara Melengkapkan Setiap Cabaran

4 minggu yang laluByDDD

Panduan Atomfall: Lokasi Item, Panduan Pencarian, dan Petua

4 minggu yang laluByDDD

Tunjukkan Lagi

Alat panas

mPDF

mPDF ialah perpustakaan PHP yang boleh menjana fail PDF daripada HTML yang dikodkan UTF-8. Pengarang asal, Ian Back, menulis mPDF untuk mengeluarkan fail PDF "dengan cepat" dari tapak webnya dan mengendalikan bahasa yang berbeza. Ia lebih perlahan dan menghasilkan fail yang lebih besar apabila menggunakan fon Unicode daripada skrip asal seperti HTML2FPDF, tetapi menyokong gaya CSS dsb. dan mempunyai banyak peningkatan. Menyokong hampir semua bahasa, termasuk RTL (Arab dan Ibrani) dan CJK (Cina, Jepun dan Korea). Menyokong elemen peringkat blok bersarang (seperti P, DIV),