Rumah >pembangunan bahagian belakang >Tutorial Python >Cara Membina Ejen AI yang boleh Menggunakan mana-mana Laman Web

Cara Membina Ejen AI yang boleh Menggunakan mana-mana Laman Web

Susan Sarandon
Susan Sarandonasal
2025-01-08 00:02:40209semak imbas

Menghubungkan Ejen AI ke Web: Perjalanan Pembangun dan Peningkatan Penggunaan Komputer

Satu halangan utama dalam pembangunan ejen AI sejak dua tahun lalu ialah memberikan akses web dengan pasti. Pertimbangkan ejen AI yang direka untuk menghantar e-mel: bagaimana anda menyambungkannya ke Gmail atau Outlook? API, tapak web atau ejen web autonomi? Artikel ini meneroka pelbagai kaedah.

API dan SDK: Pendekatan Terhad

Ramai pembangun menggunakan API dan SDK. Ini menawarkan kependaman rendah dan pengesahan yang mantap, tetapi had wujud:

  • Ketidaktersediaan API: Tidak semua perkhidmatan web menyediakan API.
  • Cabaran Dokumentasi: Dokumentasi yang lapuk atau ditulis dengan buruk adalah perkara biasa.
  • Jurang Ciri: API selalunya tidak mempunyai kefungsian penuh tapak web yang sepadan, menghalang tugas tertentu.

Nasib baik, beberapa perkhidmatan menawarkan perpustakaan panggilan API:

  • Komposio: Menyediakan alatan untuk ejen AI dengan pengesahan yang kukuh.
  • Alat Langchain: Sumber untuk ejen Langchain/graf.
  • Apify: Pustaka API dipacu komuniti yang luas.

Walau bagaimanapun, untuk akses perkhidmatan web universal, kita mesti bergerak melangkaui API.

Interaksi Laman Web: Pendekatan Manusia

Interaksi tapak web ejen AI yang boleh dipercayai membolehkan automasi sebarang tugas manusia berasaskan web. Tetapi bagaimana?

Ramai pembangun pada mulanya menggunakan rangka kerja ujian penyemak imbas seperti Selenium atau Penulis Drama. Pendekatan ini, bagaimanapun, menghadapi cabaran:

  • Kerapuhan: Perubahan tapak web (mis., ujian A/B) dengan mudah memecahkan skrip.
  • Kebolehkesanan: Pelayar ujian dikenal pasti dan disekat dengan mudah.
  • Pengeluaran Pengeluaran: Mengehos penyemak imbas, mengurus pengesahan dan proksi berputar adalah rumit dalam pengeluaran.

Untuk menangani isu ini, kami bereksperimen dengan SDK Penyemak Imbas yang:

  1. Menggunakan pemilih bahasa semula jadi (cth., get_element("find the login button")) dan bukannya pemilih CSS rapuh.
  2. Mengintegrasikan pengesahan terbina dalam.
  3. Menawarkan pengehosan jauh prakonfigurasi dengan proksi berputar terbina dalam untuk mengelakkan penyekatan.

Karya ini, kini sumber terbuka (Dendrite SDK), tidak lagi dalam pembangunan aktif tetapi masih tersedia untuk kajian dan penyesuaian. Alternatif serupa termasuk:

  • AgentQL: Pustaka Python.
  • Stagehand: Pustaka JavaScript/TypeScript.

Penggunaan Komputer: Masa Depan Ejen AI Web?

"Pelajaran Pahit" Rich Sutton menyerlahkan penguasaan penyelesaian AI yang boleh digeneralisasikan yang boleh skala dengan pengiraan yang lebih tinggi. Penggunaan Komputer Anthropic merangkumi prinsip ini, membenarkan LLM mengawal komputer/pelayar secara langsung menggunakan input tetikus dan papan kekunci, menghapuskan keperluan untuk skrip dan panggilan API. Pendekatan mereka menekankan kemahiran komputer umum berbanding alat khusus tugas. Ini selaras dengan sempurna dengan Pelajaran Pahit, mencadangkan bahawa ejen AI yang paling serba boleh akan berinteraksi secara langsung dengan web seperti manusia. Keputusan awal menunjukkan kebolehpercayaan yang tinggi dalam tugasan yang kompleks menggunakan gesaan yang direka dengan baik, selalunya dipertingkatkan oleh penambahbaik segera Anthropic.

Kesimpulan: Merangkul Masa Depan

Walaupun API kekal berharga, masa depan mungkin lebih mengutamakan pendekatan seperti Penggunaan Komputer untuk kebanyakan ejen AI. Jika ejen boleh log masuk dan menggunakan fungsi carian tapak web, mengekstrak kesimpulan daripada hasil teratas, mengapa bergantung pada keseluruhan pangkalan data melalui API? Persoalan untuk pembangun AI ialah sama ada untuk menerima pendekatan yang boleh digeneralisasikan ini atau berisiko menghadapi batasan kaedah yang lebih khusus.

Nota: Ini adalah siaran dev. pertama saya. Maklum balas untuk menambah baik siaran akan datang adalah dialu-alukan. Soalan mengenai ejen AI atau automasi tugas dipacu AI juga digalakkan. How to Build AI Agents that can Use any Website How to Build AI Agents that can Use any Website How to Build AI Agents that can Use any Website How to Build AI Agents that can Use any Website

Atas ialah kandungan terperinci Cara Membina Ejen AI yang boleh Menggunakan mana-mana Laman Web. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn