Rumah >pembangunan bahagian belakang >Tutorial Python >Cara Membina Ejen AI yang boleh Menggunakan mana-mana Laman Web
Menghubungkan Ejen AI ke Web: Perjalanan Pembangun dan Peningkatan Penggunaan Komputer
Satu halangan utama dalam pembangunan ejen AI sejak dua tahun lalu ialah memberikan akses web dengan pasti. Pertimbangkan ejen AI yang direka untuk menghantar e-mel: bagaimana anda menyambungkannya ke Gmail atau Outlook? API, tapak web atau ejen web autonomi? Artikel ini meneroka pelbagai kaedah.
API dan SDK: Pendekatan Terhad
Ramai pembangun menggunakan API dan SDK. Ini menawarkan kependaman rendah dan pengesahan yang mantap, tetapi had wujud:
Nasib baik, beberapa perkhidmatan menawarkan perpustakaan panggilan API:
Walau bagaimanapun, untuk akses perkhidmatan web universal, kita mesti bergerak melangkaui API.
Interaksi Laman Web: Pendekatan Manusia
Interaksi tapak web ejen AI yang boleh dipercayai membolehkan automasi sebarang tugas manusia berasaskan web. Tetapi bagaimana?
Ramai pembangun pada mulanya menggunakan rangka kerja ujian penyemak imbas seperti Selenium atau Penulis Drama. Pendekatan ini, bagaimanapun, menghadapi cabaran:
Untuk menangani isu ini, kami bereksperimen dengan SDK Penyemak Imbas yang:
get_element("find the login button")
) dan bukannya pemilih CSS rapuh.Karya ini, kini sumber terbuka (Dendrite SDK), tidak lagi dalam pembangunan aktif tetapi masih tersedia untuk kajian dan penyesuaian. Alternatif serupa termasuk:
Penggunaan Komputer: Masa Depan Ejen AI Web?
"Pelajaran Pahit" Rich Sutton menyerlahkan penguasaan penyelesaian AI yang boleh digeneralisasikan yang boleh skala dengan pengiraan yang lebih tinggi. Penggunaan Komputer Anthropic merangkumi prinsip ini, membenarkan LLM mengawal komputer/pelayar secara langsung menggunakan input tetikus dan papan kekunci, menghapuskan keperluan untuk skrip dan panggilan API. Pendekatan mereka menekankan kemahiran komputer umum berbanding alat khusus tugas. Ini selaras dengan sempurna dengan Pelajaran Pahit, mencadangkan bahawa ejen AI yang paling serba boleh akan berinteraksi secara langsung dengan web seperti manusia. Keputusan awal menunjukkan kebolehpercayaan yang tinggi dalam tugasan yang kompleks menggunakan gesaan yang direka dengan baik, selalunya dipertingkatkan oleh penambahbaik segera Anthropic.
Kesimpulan: Merangkul Masa Depan
Walaupun API kekal berharga, masa depan mungkin lebih mengutamakan pendekatan seperti Penggunaan Komputer untuk kebanyakan ejen AI. Jika ejen boleh log masuk dan menggunakan fungsi carian tapak web, mengekstrak kesimpulan daripada hasil teratas, mengapa bergantung pada keseluruhan pangkalan data melalui API? Persoalan untuk pembangun AI ialah sama ada untuk menerima pendekatan yang boleh digeneralisasikan ini atau berisiko menghadapi batasan kaedah yang lebih khusus.
Nota: Ini adalah siaran dev. pertama saya. Maklum balas untuk menambah baik siaran akan datang adalah dialu-alukan. Soalan mengenai ejen AI atau automasi tugas dipacu AI juga digalakkan.
Atas ialah kandungan terperinci Cara Membina Ejen AI yang boleh Menggunakan mana-mana Laman Web. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!