Rumah >Peranti teknologi >AI >Urus permintaan dan gunakan model besar untuk menyelesaikan masalah: artifak pemprosesan carta SheetCopilot berada dalam talian

Urus permintaan dan gunakan model besar untuk menyelesaikan masalah: artifak pemprosesan carta SheetCopilot berada dalam talian

WBOY
WBOYke hadapan
2023-06-12 19:24:10934semak imbas

Proses operasi selembut sutera ini hanyalah berita baik untuk para profesional!

Urus permintaan dan gunakan model besar untuk menyelesaikan masalah: artifak pemprosesan carta SheetCopilot berada dalam talian

Baru-baru ini, penyelidik dari Institut Automasi, Akademi Sains China, Politeknik Hong Kong dan institusi lain telah mencipta "Table AI Assistant" "SheetCopilot, ejen pintar ini boleh menjana penyelesaian untuk memanipulasi jadual berdasarkan arahan pengguna dan melaksanakannya pada perisian tertentu (seperti Excel, GoogleSheets, dll.). SheetCopilot boleh menyambung dengan pantas kepada berbilang perisian pemprosesan jadual, dan menyokong operasi berbilang jadual, lukisan carta dan penjanaan jadual pangsi Ia dijangka memperkasakan pemprosesan dan visualisasi data jadual dalam pelbagai bidang dan mengambil langkah penting ke arah merealisasikan pembantu pintar generalis.

Urus permintaan dan gunakan model besar untuk menyelesaikan masalah: artifak pemprosesan carta SheetCopilot berada dalam talian

Tapak web: https://sheetcopilot-demo.github.io/

Kertas: https://arxiv.org/abs/2305.19308

Mari kita rasai dahulu cara SheetCopilot boleh meningkatkan kecekapan kerja dengan ketara melalui contoh berikut.

Andaikan anda seorang pemula dan suatu hari bos anda meminta anda membantunya menganalisis data jualan. Apabila anda mendapat borang dan melihatnya, anda akan terpesona dengan beribu-ribu baris data Anda tidak tahu di mana untuk bermula, jadi anda menyemaknya semasa anda pergi.

Mula-mula, anda cuba mengekstrak nama setiap Produk, dan kemudian menggunakan formula untuk menjumlahkan hasil setiap Produk.

Urus permintaan dan gunakan model besar untuk menyelesaikan masalah: artifak pemprosesan carta SheetCopilot berada dalam talian

Selepas mengerjakannya selama lebih daripada 20 minit, SUMIF terus melaporkan "#NAME?"

Saya terus mencari dalam talian dan mendapati terdapat alat yang begitu mudah seperti jadual Pangsi, jadi saya memulakan cabaran kedua.

Urus permintaan dan gunakan model besar untuk menyelesaikan masalah: artifak pemprosesan carta SheetCopilot berada dalam talian

Ia mengambil masa lebih daripada dua puluh minit dan akhirnya ia selesai. Keseluruhan proses mengambil masa hampir sejam, dan kecekapannya tidak memuaskan. Setiap kali bos anda memberi anda tugas pemprosesan borang baharu, pengalaman anda sebelum ini tidak banyak digunakan, jadi anda hanya boleh melihat tapak web dan memprosesnya dari awal.

Rakan sekerja anda menggunakan SheetCopilot dan boleh menyelesaikan semua jenis permintaan pelik dalam beberapa saat sahaja :).

Urus permintaan dan gunakan model besar untuk menyelesaikan masalah: artifak pemprosesan carta SheetCopilot berada dalam talian

Melihat SheetCopilot begitu lancar, anda mencubanya dan mudah untuk melukis gambar.

Urus permintaan dan gunakan model besar untuk menyelesaikan masalah: artifak pemprosesan carta SheetCopilot berada dalam talian

Dengan SheetCopilot, anda tidak perlu lagi meluncurkan tetikus merentasi separuh jadual untuk memilih data yang melebihi beribu-ribu baris dengan mudah dipilih Data bergerak antara berbilang jadual.

Urus permintaan dan gunakan model besar untuk menyelesaikan masalah: artifak pemprosesan carta SheetCopilot berada dalam talian

Mengapa SheetCopilot dicadangkan

Sejak sekian lama, orang ramai teringin untuk memiliki kemahiran untuk menjadi mahir walaupun tanpa pengalaman profesional Keupayaan untuk menguasai perisian yang kompleks. Ramai di antara kita pernah berada dalam situasi di mana kita tidak tahu cara menavigasi antara muka PhotoShop yang rumit, ingin menganalisis data tetapi tidak mengetahui ciri lanjutan PivotTable, mahu melukis gear tetapi tidak tahu apa-apa tentang Solidworks.

Dengan kemunculan model bahasa besar (LLM) dengan pemahaman bahasa yang berkuasa dan keupayaan penjanaan, visi ini lebih hampir kepada realiti berbanding sebelum ini. Jika LLM boleh dibimbing untuk menguasai pelbagai perisian, potensi LLM yang hampir tidak terhad boleh dikeluarkan, sekali gus membolehkan produktiviti manusia mencapai tahap yang tidak pernah berlaku sebelum ini.

Artikel ini menunjukkan bahawa hamparan adalah asas yang ideal untuk menjalankan penyelidikan ini kerana ia adalah alat pengeluaran yang biasa dan serba boleh. Walau bagaimanapun, manipulasi jadual menghadapi pelbagai cabaran, dan sukar bagi pengguna untuk menguasai kemahiran pemprosesan dan pengaturcaraan jadual yang mencukupi untuk menghadapi keperluan tugas yang sentiasa berubah.

Jika terdapat ejen AI generalis yang menguasai kemahiran kawalan perisian yang kaya, bukan sahaja kecekapan pejabat akan bertambah baik, malah output perusahaan juga akan dipercepatkan dengan sangat baik. Kemunculan SheetCopilot hanya sesuai dengan penglihatan orang ramai.

Apakah sorotan SheetCopilot

1. Meliputi keperluan biasa pemprosesan meja

SheetCopilot meliputi Ia mengendalikan hampir semua tugas biasa operasi jadual dan boleh menyelesaikan pelbagai tugas penjanaan carta dengan cemerlang.

Urus permintaan dan gunakan model besar untuk menyelesaikan masalah: artifak pemprosesan carta SheetCopilot berada dalam talian

Analisis data jualan

Urus permintaan dan gunakan model besar untuk menyelesaikan masalah: artifak pemprosesan carta SheetCopilot berada dalam talian

Lukisan carta eksperimen

Urus permintaan dan gunakan model besar untuk menyelesaikan masalah: artifak pemprosesan carta SheetCopilot berada dalam talian

Pengiraan formula kompleks

Urus permintaan dan gunakan model besar untuk menyelesaikan masalah: artifak pemprosesan carta SheetCopilot berada dalam talian

Gunakan pemformatan bersyarat

2. Melangkaui pendekatan berasaskan VBA

SheetCopilot adalah lebih baik daripada kaedah menggunakan GPT-3.5 untuk menjana kod VBA dan melaksanakannya. alat bantu untuk kakitangan pemprosesan data pada masa hadapan.

Urus permintaan dan gunakan model besar untuk menyelesaikan masalah: artifak pemprosesan carta SheetCopilot berada dalam talian

Bukan itu sahaja, berbanding kod VBA yang tidak jelas, penyelesaian yang dihasilkan oleh SheetCopilot mengandungi langkah-langkah yang mudah difahami. Ini menghilangkan kesakitan mempelajari bahasa pengaturcaraan baharu dan bergelut untuk menyahpepijatnya.

Urus permintaan dan gunakan model besar untuk menyelesaikan masalah: artifak pemprosesan carta SheetCopilot berada dalam talian

Gambar kiri: kod VBA yang panjang; gambar kanan: SheetCopilot penyelesaian yang ringkas dan mudah difahami rancangan.

3 Pengalaman penggunaan yang selesa

SheetCopilot in When. sambungan rangkaian adalah stabil, hanya memerlukan kira-kira 10 langkah operasi gabungan berbilang jadual untuk menyelesaikan tugas dalam jadual dengan cepat dengan beribu-ribu baris dan berpuluh-puluh lajur. Ini bukan sahaja membebaskan mata pengguna yang letih, tetapi juga menjimatkan masa yang terbuang dalam mencari laman web dan mencuba langkah satu demi satu, dan juga mengelakkan kos pembelajaran VBA.

Urus permintaan dan gunakan model besar untuk menyelesaikan masalah: artifak pemprosesan carta SheetCopilot berada dalam talian

Prinsip kaedah

Artikel ini menguraikan fungsi teras yang diperlukan untuk manipulasi jadual ke dalam set API maya (dipanggil operasi atom, lihat rajah di bawah), yang digunakan untuk menjana penyelesaian sebagai LLM Jambatan untuk interaksi dengan perisian aplikasi.

Urus permintaan dan gunakan model besar untuk menyelesaikan masalah: artifak pemprosesan carta SheetCopilot berada dalam talian

Kaedah paling mudah ialah menjana semua langkah tugasan dalam satu pertanyaan LLM. Walau bagaimanapun, apabila kerumitan tugasan meningkat, langkah-langkah seterusnya menjadi lebih bergantung pada keputusan pelaksanaan langkah-langkah sebelumnya, menyukarkan kawalan gelung terbuka jenis ini untuk mendapatkan hasil yang betul. Sebagai contoh, LLM menghadapi kesukaran untuk menentukan skop operasi jika ia tidak dapat menentukan tempat data akan kelihatan selepas penapisan.

Untuk mencapai kawalan gelung tertutup yang cekap, SheetCopilot mengoptimumkan penyelesaian berdasarkan maklum balas status perisian dan pangkalan pengetahuan operasi atom luaran, meningkatkan kadar kejayaan dan kecekapan.

Cara menilai

Artikel ini mencadangkan penanda aras penilaian berkualiti tinggi. Tugas penanda aras ini mempunyai rumusan yang pelbagai dan melibatkan operasi atom yang kaya, seperti yang ditunjukkan dalam perkataan awan di bawah:

Urus permintaan dan gunakan model besar untuk menyelesaikan masalah: artifak pemprosesan carta SheetCopilot berada dalam talian

Penanda aras ini menggunakan Metrik berikut tentang kadar kejayaan (lebih tinggi adalah lebih baik):

  • Exec@1: Kadar kejayaan pelaksanaan penyelesaian tugas yang dijana.
  • Lulus@1: Kadar lulus tugasan, iaitu, perkadaran penyelesaian yang boleh memadankan sebarang jawapan rujukan selepas pelaksanaan.

Tanda aras ini juga mempertimbangkan metrik kecekapan berikut (lebih rendah adalah lebih baik):

  • A50: Akan memenuhi keperluan misi Bilangan langkah dalam penyelesaian dibahagikan dengan bilangan langkah minimum dalam jawapan rujukan, dan kemudian median semua pengiraan diambil.
  • A90: Kaedah pengiraan adalah sama seperti di atas, tetapi persentil ke-90 daripada semua keputusan pengiraan diambil. Penunjuk ini mencerminkan pengagihan nilai melampau bilangan tindakan.

Hasil eksperimen

Urus permintaan dan gunakan model besar untuk menyelesaikan masalah: artifak pemprosesan carta SheetCopilot berada dalam talian

Jadual 1: Perbandingan pada Set data SheetCopilot GPT -3.5-Turbo, GPT-4, Claude dan cara menjana VBA.

Tidak menghairankan, GPT-4 mempunyai bahagian penyelesaian tertinggi yang memenuhi keperluan tugas dan mempunyai kecekapan terbaik, manakala GPT-3.5-Turbo mengikuti di belakang, dengan Claude menjadi masa yang paling cekap tetapi juga hampir dengan GPT-3.5-Turbo.

Hasil yang menarik ialah SheetCopilot mencapai kadar kejayaan yang cemerlang berbanding kaedah menterjemah arahan pengguna ke dalam kod VBA dan melaksanakannya pada Excel. Ini bermakna bahawa SheetCopilot membawa kawalan pintar perisian satu langkah besar lebih dekat kepada kami, membenarkan pengguna yang tidak dapat memprogram untuk mengarahkan komputer untuk menyelesaikan tugas yang kompleks melalui komunikasi harian.

Mari kita lihat kelebihan dan kekurangan setiap tiga LLM ini melalui penunjuk dalam setiap kategori subbahagian di bawah.

Urus permintaan dan gunakan model besar untuk menyelesaikan masalah: artifak pemprosesan carta SheetCopilot berada dalam talian

GPT-3.5 dan GPT-4 dengan mudah menyelesaikan Pengurusan (operasi pengurusan jadual seperti pengisihan dan penapisan) dan Kemasukan & tugasan manipulasi (input data dan manipulasi), kedua-duanya mencapai kadar kebolehlaksanaan 100%. Di samping itu, ketiga-tiga LLM masing-masing menunjukkan kecekapan terbaik dalam kategori tugasan yang berbeza Dapatan menarik ini menunjukkan bahawa setiap LLM mempunyai kelebihan tersendiri dan GPT-4 tidak dapat mengatasi model lain.

Kesimpulan

SheetCopilot menggunakan LLM untuk berjaya membentuk gelung tertutup persepsi, penaakulan dan membuat keputusan melalui antara muka teks, mencapai kawalan hamparan yang cekap dan mempromosikan perisian yang lebih pintar kawalan. Melangkah ke peringkat seterusnya juga membawa inspirasi baharu kepada penyelidik yang berminat dengan agen generalis.

Atas ialah kandungan terperinci Urus permintaan dan gunakan model besar untuk menyelesaikan masalah: artifak pemprosesan carta SheetCopilot berada dalam talian. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:51cto.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam