Saya telah membaca banyak tentang ejen RAG dan AI, tetapi dengan pelepasan model baru seperti DeepSeek V3 dan Deepseek R1, nampaknya kemungkinan membina sistem RAG yang cekap telah bertambah baik, menawarkan ketepatan pengambilan yang lebih baik, keupayaan penalaran yang dipertingkatkan, dan arkitek yang lebih berskala untuk aplikasi dunia nyata. Penyepaduan mekanisme pengambilan yang lebih canggih, peningkatan pilihan penalaan halus, dan keupayaan multi-modal mengubah bagaimana agen AI berinteraksi dengan data. Ia menimbulkan persoalan sama ada pendekatan kain tradisional masih menjadi cara terbaik ke hadapan atau jika seni bina yang lebih baru dapat memberikan penyelesaian yang lebih efisien dan kontekstual. Sistem pengambilan semula (RAG)
sistem telah merevolusikan cara model AI berinteraksi dengan data dengan menggabungkan pendekatan berasaskan pengambilan semula dan generatif untuk menghasilkan tindak balas yang lebih tepat dan konteks. Dengan kedatangan
DeepSeek R1, model sumber terbuka yang dikenali untuk kecekapan dan keberkesanan kosnya, membina sistem RAG yang berkesan telah menjadi lebih mudah dan praktikal. Dalam artikel ini, kami sedang membina sistem RAG menggunakan DeepSeek R1. Jadual Kandungan Apakah DeepSeek R1?
Apakah DeepSeek R1?- DeepSeek R1
- adalah model AI sumber terbuka yang dibangunkan dengan matlamat menyediakan keupayaan penalaran dan pengambilan yang berkualiti tinggi di sebahagian kecil daripada kos model proprietari seperti tawaran OpenAI. Ia mempunyai lesen MIT, menjadikannya secara komersil dan sesuai untuk pelbagai aplikasi. Juga, model yang kuat ini, membolehkan anda melihat katil tetapi Openai O1 dan O1-Mini tidak menunjukkan sebarang token.
- Untuk mengetahui bagaimana DeepSeek R1 mencabar model Openai O1: DeepSeek R1 vs Openai O1: Mana yang lebih cepat, lebih murah dan lebih bijak?
-
- Membangun sistem Generasi Pengambilan Pengambilan (RAG) Menggunakan DeepSeek-R1 menawarkan beberapa kelebihan yang ketara:
1. Keupayaan Penalaran Lanjutan
: DeepSeek-R1 memancarkan penalaran seperti manusia dengan menganalisis dan memproses langkah-langkah langkah demi langkah sebelum mencapai kesimpulan. Pendekatan ini meningkatkan keupayaan sistem untuk mengendalikan pertanyaan yang kompleks, terutamanya di kawasan yang memerlukan kesimpulan logik, penalaran matematik, dan tugas pengekodan.
2. Kebolehcapaian sumber terbuka: Dikeluarkan di bawah lesen MIT, DeepSeek-R1 adalah sumber terbuka sepenuhnya, yang membolehkan pemaju akses tidak terhad kepada modelnya. Keterbukaan ini memudahkan penyesuaian, penalaan halus, dan integrasi ke dalam pelbagai aplikasi tanpa kekangan yang sering dikaitkan dengan model proprietari. 3. Prestasi yang kompetitif : Ujian penanda aras menunjukkan bahawa DeepSeek-R1 melakukan setanding dengan, atau bahkan melampaui, model terkemuka seperti Openai's O1 dalam tugas yang melibatkan penalaran, matematik, dan pengekodan. Tahap prestasi ini memastikan bahawa sistem RAG yang dibina dengan DeepSeek-R1 dapat memberikan respons yang berkualiti tinggi dan tepat merentasi pertanyaan yang pelbagai dan mencabar. 4. Ketelusan dalam Proses Pemikiran : DeepSeek-R1 menggunakan metodologi "rantai-of-shought", menjadikan langkah-langkah penalarannya dapat dilihat semasa kesimpulan. Ketelusan ini membantu menyahpepijat dan memperbaiki sistem semasa membina kepercayaan pengguna dengan memberikan pandangan yang jelas ke dalam proses membuat keputusan. 5. Keberkesanan Kos : Sifat sumber terbuka DeepSeek-R1 menghapuskan yuran pelesenan, dan seni bina yang cekap mengurangkan keperluan sumber pengiraan. Faktor-faktor ini menyumbang kepada penyelesaian yang lebih kos efektif untuk organisasi yang ingin melaksanakan sistem RAG yang canggih tanpa menanggung perbelanjaan yang ketara. Mengintegrasikan DeepSeek-R1 ke dalam sistem RAG memberikan gabungan kuat kebolehan penalaran, ketelusan, prestasi, dan kecekapan kos, menjadikannya pilihan yang menarik untuk pemaju dan organisasi yang bertujuan untuk meningkatkan keupayaan AI mereka.
Untuk mengakses model penyembuhan OpenAI, skrip menggesa pengguna untuk memasuki kunci API mereka menggunakan Getpass (). Ini menghalang mendedahkan kelayakan dalam teks biasa.
menyimpan kekunci API sebagai pemboleh ubah persekitaran. Ini membolehkan bahagian lain kod untuk mengakses Perkhidmatan Terbuka tanpa kelayakan Hardcoding , yang meningkatkan keselamatan.
menukarkan teks ke dalam embeddings vektor , yang merupakan perwakilan berangka dimensi tinggi dari makna teks. Lembutan ini kemudiannya digunakan untuk membandingkan dan mengambil kandungan serupa .
dimuatkan dan dibahagikan kepada halaman . Setiap teks halaman diekstrak, yang membolehkan lebih kecil dan lebih mudah diuruskan ketulan teks daripada memproses keseluruhan dokumen sebagai satu unit.
skrip adalah saluran paip generasi pengambilan semula (RAG) yang:
Pasang prasyarat
curl -fsSL https://ollama.com/install.sh | sh
selepas ini menarik DeepSeek R1: 1.5b menggunakan: ollama pull deepseek-r1:1.5b
ini akan mengambil sedikit masa untuk memuat turun: ollama pull deepseek-r1:1.5b
pulling manifest
pulling aabd4debf0c8... 100% ▕████████████████▏ 1.1 GB
pulling 369ca498f347... 100% ▕████████████████▏ 387 B
pulling 6e4c38e1172f... 100% ▕████████████████▏ 1.1 KB
pulling f4d24e9138dd... 100% ▕████████████████▏ 148 B
pulling a85fe2a2e58e... 100% ▕████████████████▏ 487 B
verifying sha256 digest
writing manifest
success
Setelah melakukan ini, buka buku nota Jupyter anda dan mulakan dengan bahagian pengekodan:
Sebelum berlari, skrip memasang perpustakaan Python yang diperlukan:
2. Masukkan Kunci API Terbuka
skrip
Skrip memulakan model embedding terbuka yang dipanggil "teks-embedding-3-kecil". Model ini
fail pdf (agenticai.pdf) adalah
teks yang diekstrak dari pdf adalah
7. Ambil teks yang sama menggunakan ambang persamaan
A
- Cari 3 Top 3 yang paling serupa
- dokumen berdasarkan pertanyaan yang diberikan. hasil penapis berdasarkan ambang persamaan 0.3, yang bermaksud dokumen mestilah mempunyai kesamaan sekurang -kurangnya 30% untuk memenuhi syarat sebagai relevan.
- 8. Pertanyaan untuk dokumen serupa
dua pertanyaan ujian digunakan:
"Apakah ibukota lama India?"
-
- Tiada hasil yang dijumpai
- , yang menunjukkan bahawa dokumen yang disimpan tidak mengandungi maklumat yang relevan.
-
- berjaya mendapatkan semula teks yang relevan
- , menunjukkan bahawa sistem boleh mengambil konteks yang bermakna.
9. Bina Rag (Retrieval-Augmented Generation) rantai
skrip menetapkan saluran paip
, yang memastikan bahawa:
10. Muatkan sambungan ke LLM (Model DeepSeek)
Daripada Openai's GPT, skrip
memuatkan DeepSeek-R1 (parameter 1.5B) , LLM yang kuat dioptimumkan untuk tugas-tugas berasaskan pengambilan semula.
11. Buat rantai berasaskan RAGmodul Langchain's
Retrieval digunakan untuk:
- mengambil kandungan yang relevan dari pangkalan data vektor.
- Format tindak balas berstruktur menggunakan template prompt.
- menghasilkan jawapan ringkas dengan model DeepSeek.
skrip menjalankan pertanyaan ujian:
"Beritahu perspektif pemimpin mengenai agentik ai"
llm menghasilkan tindak balas berasaskan fakta dengan ketat menggunakan konteks yang diambil.
Sistemmengambil maklumat yang relevan dari pangkalan data .
kod untuk membina sistem rag menggunakan deepseek r1inilah kod:
Pasang kebergantungan terbuka dan langchain
curl -fsSL https://ollama.com/install.sh | shmasukkan kunci AI API terbuka
ollama pull deepseek-r1:1.5bPembolehubah Persekitaran Persediaan
ollama pull deepseek-r1:1.5b pulling manifest pulling aabd4debf0c8... 100% ▕████████████████▏ 1.1 GB pulling 369ca498f347... 100% ▕████████████████▏ 387 B pulling 6e4c38e1172f... 100% ▕████████████████▏ 1.1 KB pulling f4d24e9138dd... 100% ▕████████████████▏ 148 B pulling a85fe2a2e58e... 100% ▕████████████████▏ 487 B verifying sha256 digest writing manifest successBuka model embedding AI
!pip install langchain==0.3.11 !pip install langchain-openai==0.2.12 !pip install langchain-community==0.3.11 !pip install langchain-chroma==0.1.4Buat vektor db dan berterusan pada cakera
from getpass import getpass OPENAI_KEY = getpass('Enter Open AI API Key: ')persamaan dengan pengambilan ambang
import os os.environ['OPENAI_API_KEY'] = OPENAI_KEY
from langchain_openai import OpenAIEmbeddings openai_embed_model = OpenAIEmbeddings(model='text-embedding-3-small')
from langchain_community.document_loaders import PyPDFLoader loader = PyPDFLoader('AgenticAI.pdf') pages = loader.load_and_split() texts = [doc.page_content for doc in pages] from langchain_chroma import Chroma chroma_db = Chroma.from_texts( texts=texts, collection_name='db_docs', collection_metadata={"hnsw:space": "cosine"}, # Set distance function to cosine embedding=openai_embed_model )
Bina rantai kain
Muatkan sambungan ke LLM
similarity_threshold_retriever = chroma_db.as_retriever(search_type="similarity_score_threshold",search_kwargs={"k": 3,"score_threshold": 0.3}) query = "what is the old capital of India?" top3_docs = similarity_threshold_retriever.invoke(query) top3_docs
sintaks langchain untuk rantai kain
[]
query = "What is Agentic AI?" top3_docs = similarity_threshold_retriever.invoke(query) top3_docs
checkout artikel terperinci kami mengenai kerja dan perbandingan DeepSeek dengan model yang serupa:
DeepSeek R1- Openai's O1 terbesar pesaing di sini!
- Membina aplikasi AI dengan DeepSeek-V3
- DeepSeek-V3 vs Gpt-4o vs Llama 3.3 70b
- DeepSeek V3 vs GPT-4O: Mana yang lebih baik?
- DeepSeek R1 vs Openai O1: Mana yang lebih baik?
- bagaimana untuk mengakses Deepseek Janus Pro 7b?
- Kesimpulan
DeepSeek R1
menyediakan cara yang kos efektif dan berkuasa untuk meningkatkan pengambilan dokumen dan penjanaan tindak balas. Dengan sifat sumber terbuka dan keupayaan penalaran yang kuat, ia adalah alternatif yang hebat untuk penyelesaian proprietari. Perniagaan dan pemaju boleh memanfaatkan fleksibiliti untuk membuat aplikasi yang didorong oleh AI yang disesuaikan dengan keperluan mereka. Ingin membina aplikasi menggunakan DeepSeek? Semak kursus DeepSeek percuma kami hari ini!
Atas ialah kandungan terperinci Bagaimana Membina Sistem Rag Menggunakan DeepSeek R1?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Revolusi teknologi undang -undang mendapat momentum, menolak profesional undang -undang untuk secara aktif merangkul penyelesaian AI. Rintangan pasif tidak lagi menjadi pilihan yang sesuai untuk mereka yang bertujuan untuk kekal berdaya saing. Mengapa penggunaan teknologi penting? Profesional undang -undang

Ramai yang menganggap interaksi dengan AI tidak dikenali, berbeza dengan komunikasi manusia. Walau bagaimanapun, AI secara aktif profil pengguna semasa setiap sembang. Setiap cepat, setiap perkataan, dianalisis dan dikategorikan. Mari kita meneroka aspek kritikal AI Revo ini

Strategi kecerdasan buatan yang berjaya tidak dapat dipisahkan dari sokongan budaya korporat yang kuat. Seperti yang dikatakan Peter Drucker, operasi perniagaan bergantung kepada orang, dan begitu juga kejayaan kecerdasan buatan. Bagi organisasi yang secara aktif merangkul kecerdasan buatan, membina budaya korporat yang menyesuaikan diri dengan AI adalah penting, dan ia juga menentukan kejayaan atau kegagalan strategi AI. West Monroe baru-baru ini mengeluarkan panduan praktikal untuk membina budaya korporat AI yang mesra AI, dan berikut adalah beberapa perkara utama: 1. Jelaskan model kejayaan AI: Pertama sekali, kita mesti mempunyai visi yang jelas tentang bagaimana AI dapat memberi kuasa kepada perniagaan. Budaya operasi AI yang ideal dapat mencapai integrasi semula jadi proses kerja antara manusia dan sistem AI. Ai baik pada tugas -tugas tertentu, sementara manusia pandai kreativiti dan penghakiman

Meta menaik taraf permohonan pembantu AI, dan era AI yang boleh dipakai akan datang! Aplikasi ini, yang direka untuk bersaing dengan CHATGPT, menawarkan ciri -ciri AI standard seperti teks, interaksi suara, penjanaan imej dan carian web, tetapi kini telah menambah keupayaan geolokasi untuk kali pertama. Ini bermakna Meta Ai tahu di mana anda berada dan apa yang anda lihat semasa menjawab soalan anda. Ia menggunakan minat, lokasi, profil dan maklumat aktiviti anda untuk memberikan maklumat situasional terkini yang tidak mungkin sebelum ini. Aplikasi ini juga menyokong terjemahan masa nyata, yang benar-benar mengubah pengalaman AI pada gelas Ray-Ban dan meningkatkan kegunaannya. Pengenaan tarif pada filem asing adalah latihan kuasa telanjang ke atas media dan budaya. Sekiranya dilaksanakan, ini akan mempercepatkan ke arah AI dan pengeluaran maya

Kecerdasan buatan merevolusi bidang jenayah siber, yang memaksa kita untuk mempelajari kemahiran pertahanan baru. Penjenayah siber semakin menggunakan teknologi kecerdasan buatan yang kuat seperti pemalsuan yang mendalam dan cyberattacks pintar untuk penipuan dan kemusnahan pada skala yang belum pernah terjadi sebelumnya. Dilaporkan bahawa 87% perniagaan global telah disasarkan untuk jenayah siber AI sepanjang tahun lalu. Jadi, bagaimana kita boleh mengelakkan menjadi mangsa gelombang jenayah pintar ini? Mari kita meneroka cara mengenal pasti risiko dan mengambil langkah -langkah perlindungan di peringkat individu dan organisasi. Bagaimana penjenayah siber menggunakan kecerdasan buatan Sebagai kemajuan teknologi, penjenayah sentiasa mencari cara baru untuk menyerang individu, perniagaan dan kerajaan. Penggunaan kecerdasan buatan yang meluas mungkin menjadi aspek terkini, tetapi bahaya potensinya tidak pernah berlaku sebelum ini. Khususnya, kecerdasan buatan

Hubungan rumit antara kecerdasan buatan (AI) dan kecerdasan manusia (NI) paling baik difahami sebagai gelung maklum balas. Manusia mencipta AI, melatihnya pada data yang dihasilkan oleh aktiviti manusia untuk meningkatkan atau meniru keupayaan manusia. AI ini

Kenyataan baru-baru ini Anthropic, yang menonjolkan kekurangan pemahaman yang mengelilingi model AI canggih, telah mencetuskan perdebatan yang hangat di kalangan pakar. Adakah kelegapan ini merupakan krisis teknologi yang tulen, atau hanya halangan sementara di jalan menuju lebih banyak Soph

India adalah negara yang pelbagai dengan permaidani bahasa yang kaya, menjadikan komunikasi lancar di seluruh wilayah menjadi cabaran yang berterusan. Walau bagaimanapun, Sarvam's Bulbul-V2 membantu merapatkan jurang ini dengan teks-ke-ucapannya yang maju (TTS) t


Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

SecLists
SecLists ialah rakan penguji keselamatan muktamad. Ia ialah koleksi pelbagai jenis senarai yang kerap digunakan semasa penilaian keselamatan, semuanya di satu tempat. SecLists membantu menjadikan ujian keselamatan lebih cekap dan produktif dengan menyediakan semua senarai yang mungkin diperlukan oleh penguji keselamatan dengan mudah. Jenis senarai termasuk nama pengguna, kata laluan, URL, muatan kabur, corak data sensitif, cangkerang web dan banyak lagi. Penguji hanya boleh menarik repositori ini ke mesin ujian baharu dan dia akan mempunyai akses kepada setiap jenis senarai yang dia perlukan.

mPDF
mPDF ialah perpustakaan PHP yang boleh menjana fail PDF daripada HTML yang dikodkan UTF-8. Pengarang asal, Ian Back, menulis mPDF untuk mengeluarkan fail PDF "dengan cepat" dari tapak webnya dan mengendalikan bahasa yang berbeza. Ia lebih perlahan dan menghasilkan fail yang lebih besar apabila menggunakan fon Unicode daripada skrip asal seperti HTML2FPDF, tetapi menyokong gaya CSS dsb. dan mempunyai banyak peningkatan. Menyokong hampir semua bahasa, termasuk RTL (Arab dan Ibrani) dan CJK (Cina, Jepun dan Korea). Menyokong elemen peringkat blok bersarang (seperti P, DIV),

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

MantisBT
Mantis ialah alat pengesan kecacatan berasaskan web yang mudah digunakan yang direka untuk membantu dalam pengesanan kecacatan produk. Ia memerlukan PHP, MySQL dan pelayan web. Lihat perkhidmatan demo dan pengehosan kami.

PhpStorm versi Mac
Alat pembangunan bersepadu PHP profesional terkini (2018.2.1).
