cari
Rumahpembangunan bahagian belakangTutorial PythonCara Membina Ejen AI yang boleh Menggunakan mana-mana Laman Web

Menghubungkan Ejen AI ke Web: Perjalanan Pembangun dan Peningkatan Penggunaan Komputer

Satu halangan utama dalam pembangunan ejen AI sejak dua tahun lalu ialah memberikan akses web dengan pasti. Pertimbangkan ejen AI yang direka untuk menghantar e-mel: bagaimana anda menyambungkannya ke Gmail atau Outlook? API, tapak web atau ejen web autonomi? Artikel ini meneroka pelbagai kaedah.

API dan SDK: Pendekatan Terhad

Ramai pembangun menggunakan API dan SDK. Ini menawarkan kependaman rendah dan pengesahan yang mantap, tetapi had wujud:

  • Ketidaktersediaan API: Tidak semua perkhidmatan web menyediakan API.
  • Cabaran Dokumentasi: Dokumentasi yang lapuk atau ditulis dengan buruk adalah perkara biasa.
  • Jurang Ciri: API selalunya tidak mempunyai kefungsian penuh tapak web yang sepadan, menghalang tugas tertentu.

Nasib baik, beberapa perkhidmatan menawarkan perpustakaan panggilan API:

  • Komposio: Menyediakan alatan untuk ejen AI dengan pengesahan yang kukuh.
  • Alat Langchain: Sumber untuk ejen Langchain/graf.
  • Apify: Pustaka API dipacu komuniti yang luas.

Walau bagaimanapun, untuk akses perkhidmatan web universal, kita mesti bergerak melangkaui API.

Interaksi Laman Web: Pendekatan Manusia

Interaksi tapak web ejen AI yang boleh dipercayai membolehkan automasi sebarang tugas manusia berasaskan web. Tetapi bagaimana?

Ramai pembangun pada mulanya menggunakan rangka kerja ujian penyemak imbas seperti Selenium atau Penulis Drama. Pendekatan ini, bagaimanapun, menghadapi cabaran:

  • Kerapuhan: Perubahan tapak web (mis., ujian A/B) dengan mudah memecahkan skrip.
  • Kebolehkesanan: Pelayar ujian dikenal pasti dan disekat dengan mudah.
  • Pengeluaran Pengeluaran: Mengehos penyemak imbas, mengurus pengesahan dan proksi berputar adalah rumit dalam pengeluaran.

Untuk menangani isu ini, kami bereksperimen dengan SDK Penyemak Imbas yang:

  1. Menggunakan pemilih bahasa semula jadi (cth., get_element("find the login button")) dan bukannya pemilih CSS rapuh.
  2. Mengintegrasikan pengesahan terbina dalam.
  3. Menawarkan pengehosan jauh prakonfigurasi dengan proksi berputar terbina dalam untuk mengelakkan penyekatan.

Karya ini, kini sumber terbuka (Dendrite SDK), tidak lagi dalam pembangunan aktif tetapi masih tersedia untuk kajian dan penyesuaian. Alternatif serupa termasuk:

  • AgentQL: Pustaka Python.
  • Stagehand: Pustaka JavaScript/TypeScript.

Penggunaan Komputer: Masa Depan Ejen AI Web?

"Pelajaran Pahit" Rich Sutton menyerlahkan penguasaan penyelesaian AI yang boleh digeneralisasikan yang boleh skala dengan pengiraan yang lebih tinggi. Penggunaan Komputer Anthropic merangkumi prinsip ini, membenarkan LLM mengawal komputer/pelayar secara langsung menggunakan input tetikus dan papan kekunci, menghapuskan keperluan untuk skrip dan panggilan API. Pendekatan mereka menekankan kemahiran komputer umum berbanding alat khusus tugas. Ini selaras dengan sempurna dengan Pelajaran Pahit, mencadangkan bahawa ejen AI yang paling serba boleh akan berinteraksi secara langsung dengan web seperti manusia. Keputusan awal menunjukkan kebolehpercayaan yang tinggi dalam tugasan yang kompleks menggunakan gesaan yang direka dengan baik, selalunya dipertingkatkan oleh penambahbaik segera Anthropic.

Kesimpulan: Merangkul Masa Depan

Walaupun API kekal berharga, masa depan mungkin lebih mengutamakan pendekatan seperti Penggunaan Komputer untuk kebanyakan ejen AI. Jika ejen boleh log masuk dan menggunakan fungsi carian tapak web, mengekstrak kesimpulan daripada hasil teratas, mengapa bergantung pada keseluruhan pangkalan data melalui API? Persoalan untuk pembangun AI ialah sama ada untuk menerima pendekatan yang boleh digeneralisasikan ini atau berisiko menghadapi batasan kaedah yang lebih khusus.

Nota: Ini adalah siaran dev. pertama saya. Maklum balas untuk menambah baik siaran akan datang adalah dialu-alukan. Soalan mengenai ejen AI atau automasi tugas dipacu AI juga digalakkan. How to Build AI Agents that can Use any Website How to Build AI Agents that can Use any Website How to Build AI Agents that can Use any Website How to Build AI Agents that can Use any Website

Atas ialah kandungan terperinci Cara Membina Ejen AI yang boleh Menggunakan mana-mana Laman Web. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Python: menyelam mendalam ke dalam kompilasi dan tafsiranPython: menyelam mendalam ke dalam kompilasi dan tafsiranMay 12, 2025 am 12:14 AM

Pythonusesahybridmodelofcompilationandinterpretation: 1) thepythoninterpretercompilessourcodcecodeintoplatform-independentbytecode.2) thepythonvirtualmachine (PVM) thenexecutesthisbytecode, BalantingeaseOfusoWithperformance.

Adakah Python diterjemahkan atau bahasa yang disusun, dan mengapa ia penting?Adakah Python diterjemahkan atau bahasa yang disusun, dan mengapa ia penting?May 12, 2025 am 12:09 AM

Pythonisbothinterpretedandandcompiled.1) it'scompiledtobytecodeforporabilityAcrossplatforms.2) theBytecodeistheninterpreted, membolehkanfordynamictypingandrapiddevelopment, walaupunItmayBeslowerLowerWanLelyCiledlanguages.

Untuk gelung vs semasa gelung di python: perbezaan utama dijelaskanUntuk gelung vs semasa gelung di python: perbezaan utama dijelaskanMay 12, 2025 am 12:08 AM

ForloopsareidealwhenyonesshenumberofiterationsationseSinadvance, whilewhileloopsarebetterforsituationshipheryouneedtoloopuntilaconditionismet.forloopsaremoreeficientablyandable, yang sesuai, manakala whileloopsoffermorecontrolandareusefereficeficeficeficeficient,

Untuk dan semasa gelung: panduan praktikalUntuk dan semasa gelung: panduan praktikalMay 12, 2025 am 12:07 AM

Forloopsareusedwhenthenumberofiterationsisknowninadvance, whilewhileloopsareusedwhenTheiterationsdependonacondition.1) forloopsareidealforiteratingoversequencesLikeListsorArrays.2)

Python: Adakah ia benar -benar ditafsirkan? Membebaskan mitosPython: Adakah ia benar -benar ditafsirkan? Membebaskan mitosMay 12, 2025 am 12:05 AM

Pythonisnotpurelyinterinterpreted; itusesahybridapproachofbytecodecompilationandruntimeinterpretation.1) pythoncompilessourcecodeintobytecode, whoomeSthenexecutedbythepythonvirtualmachine (pvm)

Senarai concatenate python dengan elemen yang samaSenarai concatenate python dengan elemen yang samaMay 11, 2025 am 12:08 AM

ToConcatenatelistsinpythonwiththesameelements, gunakan: 1) operatortokokduplicates, 2) asettoremoveduplicates, OR3) listomprehensionfensionfensionfensionfensiontroloverduplicates, setiapmethodhasdifferentperformanceAdordlications.

Ditafsirkan vs bahasa yang disusun: Tempat PythonDitafsirkan vs bahasa yang disusun: Tempat PythonMay 11, 2025 am 12:07 AM

Pythonisaninterpretedlanguage, menawarkanfuseofuseandflexibilitybutfacingperpormancelimitationsincriticalapplications.1) interpretlanguagesepythonexecuteline-by-line, membolehkanMmediateDebackandrapidprototyping.2)

Untuk dan semasa gelung: Bilakah anda menggunakan setiap python?Untuk dan semasa gelung: Bilakah anda menggunakan setiap python?May 11, 2025 am 12:05 AM

Useforloopswhenthenumberofiterationsisknowninadvance,andwhileloopswheniterationsdependonacondition.1)Forloopsareidealforsequenceslikelistsorranges.2)Whileloopssuitscenarioswheretheloopcontinuesuntilaspecificconditionismet,usefulforuserinputsoralgorit

See all articles

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Nordhold: Sistem Fusion, dijelaskan
3 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌
Mandragora: Whispers of the Witch Tree - Cara Membuka Kunci Cangkuk Bergelut
3 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌

Alat panas

Versi Mac WebStorm

Versi Mac WebStorm

Alat pembangunan JavaScript yang berguna

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

mPDF

mPDF

mPDF ialah perpustakaan PHP yang boleh menjana fail PDF daripada HTML yang dikodkan UTF-8. Pengarang asal, Ian Back, menulis mPDF untuk mengeluarkan fail PDF "dengan cepat" dari tapak webnya dan mengendalikan bahasa yang berbeza. Ia lebih perlahan dan menghasilkan fail yang lebih besar apabila menggunakan fon Unicode daripada skrip asal seperti HTML2FPDF, tetapi menyokong gaya CSS dsb. dan mempunyai banyak peningkatan. Menyokong hampir semua bahasa, termasuk RTL (Arab dan Ibrani) dan CJK (Cina, Jepun dan Korea). Menyokong elemen peringkat blok bersarang (seperti P, DIV),

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

PhpStorm versi Mac

PhpStorm versi Mac

Alat pembangunan bersepadu PHP profesional terkini (2018.2.1).