Rumah  >  Artikel  >  Peranti teknologi  >  ProAgent: Ejen pintar yang diketuai oleh OpenAI membebaskan tenaga kerja, dikeluarkan oleh Universiti Tsinghua dan universiti lain

ProAgent: Ejen pintar yang diketuai oleh OpenAI membebaskan tenaga kerja, dikeluarkan oleh Universiti Tsinghua dan universiti lain

王林
王林ke hadapan
2023-11-14 21:37:171454semak imbas

ProAgent: Ejen pintar yang diketuai oleh OpenAI membebaskan tenaga kerja, dikeluarkan oleh Universiti Tsinghua dan universiti lain

  • Alamat projek: https://github.com/OpenBMB/ProAgent
  • Alamat kertas: https://github.com/OpenBMB/ProAgent/blobpa pdf

Dalam sejarah panjang pembangunan teknologi manusia, automasi sentiasa menjadi daya penggerak utama, membantu manusia membebaskan diri mereka daripada persekitaran buruh yang kompleks, berbahaya dan membosankan. Daripada pengairan kincir air pada era awal pertanian kepada enjin wap dalam era perindustrian, manusia sentiasa mengejar teknologi automasi yang lebih maju untuk membebaskan diri mereka daripada kerja yang sukar

Dengan kemunculan era maklumat, perisian digunakan sebagai pemprosesan maklumat , Asas penyimpanan dan komunikasi telah menjadi bahagian yang tidak dapat dipisahkan dalam pengeluaran dan kehidupan manusia, yang telah membawa kepada pembentukan teknologi Automasi Proses Robot (RPA). Ia menyelaraskan berbilang perisian ke dalam aliran kerja yang kukuh (Aliran Kerja) melalui peraturan yang disusun secara manual, dan berinteraksi dengan perisian untuk mencapai pelaksanaan yang cekap dengan mensimulasikan interaksi manusia.

ProAgent: Ejen pintar yang diketuai oleh OpenAI membebaskan tenaga kerja, dikeluarkan oleh Universiti Tsinghua dan universiti lain

Dalam grafik ini kita membandingkan Robotic Process Automation (RPA) dengan Agent Process Automation (APA)

RPA (Robotic Process Automation) menggunakan robot perisian simulasi atau "BOT Melaksanakan tugasan yang berulang" untuk membebaskan sumber manusia dan meningkatkan kecekapan kerja. Skop aplikasi RPA sangat luas. Banyak perusahaan (termasuk bank, syarikat insurans, pembuatan, peruncitan dan industri lain) biasanya menggunakan robot RPA untuk mengautomasikan tugas rutin dan membosankan, seperti kemasukan data, pengekstrakan data dan pemprosesan data. Dengan mengautomasikan tugasan, RPA boleh mengurangkan kadar ralat dengan ketara dan dapat melaksanakan tugas 24*7, sekali gus meningkatkan kebolehpercayaan dan responsif perniagaan

Menurut penyelidikan pasaran, pasaran RPA berkembang pesat dan mencapai kejayaan besar. Gartner meramalkan bahawa hasil pasaran RPA global akan mencecah AS$3.3 bilion menjelang 2023, dengan kadar pertumbuhan 17.5%. Ini menunjukkan bahawa perusahaan mempunyai permintaan dan pengiktirafan yang sangat tinggi untuk RPA

Walau bagaimanapun, RPA hanya boleh menggantikan kerja manusia yang mudah dan mekanikal, dan beberapa proses yang kompleks masih bergantung kepada buruh manual:

  1. Menulis aliran kerja RPA itu sendiri memerlukan berat. kerja Kos buruh manusia lebih.
  2. Tugas kompleks adalah sangat fleksibel dan biasanya melibatkan keputusan dinamik, yang sukar untuk diperkukuh menjadi peraturan untuk ekspresi. . AI boleh memberikan teknologi Automasi mencipta kemungkinan baharu.
  3. Adakah mungkin untuk memperkenalkan fleksibiliti teknologi Agen ke dalam bidang RPA untuk mengurangkan lagi penyertaan manusia?

ProAgent: Ejen pintar yang diketuai oleh OpenAI membebaskan tenaga kerja, dikeluarkan oleh Universiti Tsinghua dan universiti lain

Penyelidikan pasukan meneroka paradigma automasi baharu "Agentic Process Automation" (APA) dalam era ejen model besar. Berbanding dengan RPA tradisional, dalam paradigma APA, Ejen boleh melengkapkan pembinaan aliran kerja secara autonomi mengikut keperluan manusia Pada masa yang sama, ia boleh mengenal pasti bahagian keperluan manusia yang memerlukan pembuatan keputusan yang dinamik, menyusunnya secara automatik ke dalam aliran kerja. dan laksanakan aliran kerja apabila aliran kerja dilaksanakan Bahagian ini secara aktif mengambil alih pelaksanaan aliran kerja untuk menyelesaikan keputusan kompleks yang sepadan.

Untuk meneroka kemungkinan APA, kerja penyelidikan ini melaksanakan ejen automatik ProAgent, yang boleh menerima arahan manusia dan membina aliran kerja dengan menjana kod, dan memperkenalkan DataAgent dan ControlAgent ke dalam aliran kerja untuk Melaksanakan pemprosesan data yang kompleks dan kawalan logik . Penyelidikan ProAgent menunjukkan kebolehlaksanaan APA dalam era ejen model besar, dan juga mendedahkan kemungkinan baharu untuk teknologi automasi dalam era LLM. Pengenalan kaedah

Dalam RPA, aliran kerja ialah struktur graf yang terdiri daripada siri panggilan alat: nod mewakili panggilan alat atom (seperti Gmail, Twitter, Helaian Google), dan tepi mewakili Jujukan logik pelaksanaan ( bergabung, cawangan, gelung). Aliran kerja biasanya mengandungi semua pengetahuan terdahulu tentang tugas atau jenis tugas, termasuk laluan penyelesaian masalah dan logik pengendalian pengecualian. Oleh itu, menulis aliran kerja tetap selalunya sangat stabil, teliti dan cekap

ProAgent: Ejen pintar yang diketuai oleh OpenAI membebaskan tenaga kerja, dikeluarkan oleh Universiti Tsinghua dan universiti lain

Rajah 3 Contoh bahasa penerangan aliran kerja ejen

Dalam ProAgent, memandangkan LLM sendiri telah dilatih dalam data kod dan telah mempelajari keupayaan kod yang kukuh, kajian ini menggunakan aliran kerja ejen berasaskan kod Penerangan Aliran Kerja Agensi Bahasa Bahasa. Bahasa ini menggunakan JSON untuk mengatur dan mengurus data dalam aliran kerja, dan menggunakan sintaks Python untuk melaksanakan kawalan logik aliran kerja Lompat, gelung, dsb. dalam aliran kawalan diwakili secara langsung melalui sintaks Python aliran kerja adalah Panggilan dirangkumkan sebagai Fungsi Python. Jadi untuk ProAgent, tugas membina aliran kerja diubah menjadi tugas penjanaan kod. Apabila menerima arahan manusia, ProAgent menulis Bahasa Penerangan Aliran Kerja Agen yang sepadan, dengan itu merealisasikan pembinaan aliran kerja automatik. . bentuk tidak berkuasa apabila berhadapan dengan permintaan yang fleksibel, dan ejen perlu diperkenalkan pada masa ini. Oleh itu, kerja penyelidikan ini mentakrifkan lagi dua operasi Ejen:

ProAgent: Ejen pintar yang diketuai oleh OpenAI membebaskan tenaga kerja, dikeluarkan oleh Universiti Tsinghua dan universiti lain1: Untuk keperluan pemprosesan data yang kompleks, bahasa semula jadi akan digunakan untuk menerangkan tugas pemprosesan apabila aliran kerja dibina, dan kemudian dimulakan semasa pelaksanaan A DataAgent yang. akan memproses dan menyelesaikan tugas pemprosesan data secara autonomi berdasarkan huraian bahasa semula jadi.

2: Untuk peraturan kawalan logik yang sukar dinyatakan oleh peraturan, bahasa semula jadi digunakan untuk menerangkan logik kawalan apabila aliran kerja dibina, dan kemudian ControlAgent dimulakan pada masa jalan, yang diterangkan. berdasarkan bahasa semula jadi Anda boleh memilih cawangan yang perlu dilaksanakan kemudian dalam aliran kerja.

ProAgent menggunakan mod ReACT untuk membina aliran kerja langkah demi langkah, yang mengandungi sejumlah empat langkah pembinaan aliran kerja: ProAgent: Ejen pintar yang diketuai oleh OpenAI membebaskan tenaga kerja, dikeluarkan oleh Universiti Tsinghua dan universiti lain

Action_Define: Tentukan alat yang hendak ditambahkan pada aliran kerja.

ProAgent: Ejen pintar yang diketuai oleh OpenAI membebaskan tenaga kerja, dikeluarkan oleh Universiti Tsinghua dan universiti lain

Perlaksanaan Tindakan: Tukar parameter input/output alat kepada struktur JSON dan merangkum panggilan alat itu ke dalam fungsi Python.

Pelaksanaan Aliran Kerja: Tentukan fungsi Aliran Kerja utama untuk mengatur kawalan logik dan pemprosesan data keseluruhan aliran kerja.
  1. Serah Tugas: Apabila ProAgent selesai membina aliran kerja, operasi ini menandakan tamatnya proses binaan.
  2. Contoh menunjukkan Rajah 5 proses pembinaan aliran kerja ProAgent
  3. Selain itu, untuk mengoptimumkan kesan ProAgent, beberapa teknik pengoptimuman diperkenalkan:

on -Constructing: Semasa proses pembinaan, ProAgent akan menguji aliran kerja selepas mengubah suai sekali untuk memastikan ketepatan aliran kerja. ProAgent: Ejen pintar yang diketuai oleh OpenAI membebaskan tenaga kerja, dikeluarkan oleh Universiti Tsinghua dan universiti lain

Panggilan Fungsi: Semua operasi pembinaan aliran kerja dirangkumkan ke dalam Fungsi GPT-4, dengan itu meningkatkan kawalan ke atas proses pembinaan aliran kerja.

Chain-of-Thought: Apabila ProAgent menulis kod aliran kerja, adalah perlu untuk memberikan ulasan dan pelan penulisan untuk setiap fungsi untuk meningkatkan prestasi pembinaan aliran kerja ProAgent.

  1. Proses pelaksanaan aliran kerja adalah berdasarkan penterjemah Python. Apabila aliran kerja diberikan, fungsi mainWorkflow yang sepadan digunakan sebagai titik masuk untuk pelaksanaan, dengan itu memulakan keseluruhan proses pelaksanaan. Proses pelaksanaan mengikut peraturan pelaksanaan kod Python, iaitu, ia dilaksanakan baris demi baris mengikut urutan. Setelah fungsi mainWorkflow kembali, pelaksanaan aliran kerja berjaya diselesaikan
  2. Pengesahan kebolehlaksanaan

    Untuk mengesahkan kebolehlaksanaan Automasi Proses Agen, kajian ini menggunakan OpenAI GPT-4 sebagai model asas dan platform RPA sumber terbuka n8n sebagai pembawa untuk melaksanakan ProAgent yang disebutkan di atas. Pada masa yang sama, kami merangka tugasan yang memerlukan fleksibiliti dan kecekapan: ini adalah senario perniagaan biasa, yang memerlukan pengekstrakan data keuntungan pelbagai bidang perniagaan daripada Helaian Google dan menentukan tindakan seterusnya berdasarkan sama ada perniagaan itu 2B atau 2C. Setelah barisan perniagaan ditentukan sebagai 2C, mesej dihantar ke saluran Slack. Untuk barisan perniagaan dalam 2B, e-mel dihantar kepada pengurus masing-masing, yang merangkumi penilaian baris perniagaan dan gambaran keseluruhan keuntungan ringkas.

    ProAgent: Ejen pintar yang diketuai oleh OpenAI membebaskan tenaga kerja, dikeluarkan oleh Universiti Tsinghua dan universiti lain

    Figure 6 Paparan Arahan Tugas

    Kandungan yang perlu ditulis semula adalah: untuk tugas ini, pertama sekali, ia adalah tugas berulang. diterima pakai. Kedua, adalah sangat sukar untuk membezakan sama ada barisan perniagaan ialah 2C atau 2B, dan ia memerlukan pembuatan keputusan yang dinamik oleh Ejen untuk menentukan aliran kerja seterusnya. Akhir sekali, menulis e-mel penilaian barisan perniagaan memerlukan sejumlah kecerdasan, jadi campur tangan Ejen diperlukan

    Dalam generasi ProAgent, untuk tugas ini, aliran kerja yang mengandungi empat operasi atom, Agen Data dan Agen Kawalan telah ditulis. Proses keseluruhan secara kasar ditunjukkan dalam rajah di bawah:

    ProAgent: Ejen pintar yang diketuai oleh OpenAI membebaskan tenaga kerja, dikeluarkan oleh Universiti Tsinghua dan universiti lainRajah 7 Paparan proses pembinaan aliran kerja ProAgent

    Dapat dilihat bahawa ProAgent melengkapkan proses pembinaan aliran kerja secara automatik dengan menulis kodnya sendiri, tanpa melibatkan kerja manual. campur tangan. Apabila perlu untuk menentukan sama ada barisan perniagaan ialah 2B atau 2C, ProAgent memperkenalkan ControlAgent untuk membuat pertimbangan. Apabila barisan perniagaan adalah 2B, ProAgent juga memperkenalkan DataAgent, yang tugasnya ditetapkan kepada "Tulis e-mel barisan perniagaan keuntungan, bersama-sama dengan cadangan anda", dengan itu menggunakan kecerdasan ejen untuk menulis berdasarkan situasi sebenar mel perniagaan yang berbeza.

    Selepas aliran kerja ditulis dan diperkukuh, aliran kerja akan secara automatik bercabang kepada logik yang berbeza mengikut data berbeza untuk pemprosesan data yang cekap.

    ProAgent: Ejen pintar yang diketuai oleh OpenAI membebaskan tenaga kerja, dikeluarkan oleh Universiti Tsinghua dan universiti lain

    Rajah 8 Paparan proses pelaksanaan aliran kerja ProAgent

    Apabila memproses data baris perniagaan 2C, ControlAgent boleh menentukan jenis baris perniagaan semasa berdasarkan penerangan baris perniagaan dan memilih untuk menggunakan alat Slack komunikasi. Apabila memproses data barisan perniagaan 2B, DataAgent boleh mengarang e-mel dan menghantarnya ke peti mel pengurus yang sepadan

    Ringkasan

    Penyelidikan ini mencadangkan paradigma automasi baharu - Automasi Proses Agen, sesuai untuk Era Model berskala besar. Berbanding dengan teknologi Automasi Proses Robotik tradisional, Automasi Proses Agentik boleh mengautomasikan pembinaan aliran kerja dan merealisasikan automasi keputusan dinamik semasa pelaksanaan aliran kerja. Penyelidikan itu turut membangunkan lagi ProAgent dan secara eksperimen menunjukkan kebolehlaksanaan dan potensi ejen model besar dalam automasi. Saya percaya bahawa pada masa hadapan, teknologi agen model besar akan membantu manusia mencapai tahap automasi yang lebih tinggi dan membebaskan diri mereka daripada kerja berat

    Penyelidikan berkaitan oleh pasukan

    Pada masa ini, pasukan penyelidik telah menjalankan banyak kajian dalam arah ejen model besar. Termasuk:

  • XAgent: rangka kerja aplikasi ejen model yang sangat berkuasa yang boleh merungkai tugas kompleks dengan sendirinya dan melaksanakannya dengan cekap.
  • Alamat projek: https://github.com/OpenBMB/XAgent
  • ChatDev: rangka kerja pembangunan kolaboratif berbilang ejen yang membolehkan berbilang ejen dengan peranan berbeza bekerjasama dan membangunkan aplikasi perisian secara automatik.
  • Alamat projek: https://github.com/OpenBMB/ChatDev
  • AgentVerse: Platform umum yang dipacu model yang besar untuk ejen, merekrut pelbagai pakar ejen untuk bersama-sama membantu pengguna menyelesaikan tugas yang rumit.
  • Alamat projek: https://github.com/OpenBMB/AgentVerse

Atas ialah kandungan terperinci ProAgent: Ejen pintar yang diketuai oleh OpenAI membebaskan tenaga kerja, dikeluarkan oleh Universiti Tsinghua dan universiti lain. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:51cto.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam