Rumah > Artikel > Peranti teknologi > Analisis data lengkap dalam satu ayat, pembantu data model besar Universiti Zhejiang yang baharu menghapuskan keperluan untuk pengumpulan
Untuk memproses data, alat AI yang satu ini sudah memadai!
Bergantung pada model bahasa besar (LLM) di belakangnya, anda hanya perlu menghuraikandata yang ingin anda lihat dalam satu ayat, dan serahkan yang lain!
Pemprosesan, analisis, dan juga visualisasi semuanya boleh dilakukan dengan mudah, Anda tidak perlu membuat koleksi sendiri.
Pictures
Pembantu data AI berasaskan LLM ini dipanggil Data-Copilot dan dibangunkan oleh pasukan Universiti Zhejiang.
Pracetak kertas berkaitan telah dikeluarkan.
Kandungan berikut disediakan oleh penyumbang
Pelbagai industri seperti kewangan, meteorologi dan tenaga menjana sejumlah besar data heterogen setiap hari. Terdapat keperluan mendesak untuk alat untuk mengurus, memproses dan memaparkan data ini dengan berkesan.
DataCopilot mengurus dan memproses data besar-besaran secara autonomi dengan menggunakan model bahasa yang besar untuk memenuhi pelbagai pertanyaan pengguna, pengiraan, ramalan, visualisasi dan keperluan lain.
Anda hanya perlu memasukkan teks untuk memberitahu DataCopilot data yang anda ingin lihat, tanpa operasi yang membosankan, Tidak perlu menulis kod anda sendiri, DataCopilot menukar data asal secara autonomi kepada hasil visualisasi yang paling sesuai dengan hasrat pengguna.
Untuk mencapai rangka kerja universal yang meliputi pelbagai bentuk tugas berkaitan data, pasukan penyelidik mencadangkan Data-Copilot.
Model ini menyelesaikan masalah risiko kebocoran data, kuasa pengkomputeran yang lemah dan ketidakupayaan untuk mengendalikan tugas rumit yang disebabkan oleh hanya menggunakan LLM.
Gambar
Apabila menerima permintaan yang kompleks, Data-Copilot akan mereka bentuk dan menjadualkansecara bebas antara muka bebas untuk membina aliran kerja bagi memenuhi hasrat pengguna.
Tanpa bantuan manusia, ia boleh dengan mahir mengubah data mentah daripada sumber yang berbeza dan dalam format yang berbeza kepada output yang dimanusiakan seperti grafik, jadual dan teks.
Gambar
Sumbangan utama projek Data-Copilot termasuk:
Anda juga boleh mengambil contoh berikut untuk melihat prestasi Data-Copilot:
Apakah kadar pertumbuhan tahun ke tahun keuntungan bersih semua saham konstituen Shanghai Stock Exchange 50 Index pada suku pertama tahun ini
Data-Copilot Kami mereka bentuk aliran kerja sedemikian secara bebas:
Pictures
Untuk menangani masalah kompleks ini, Data-Copilot menggunakan antara muka loop_rank untuk melaksanakan pertanyaan gelung berbilang .
Data-Copilot mendapat keputusan ini selepas melaksanakan aliran kerja ini:
Abcissa ialah nama setiap stok komponen, dan ordinat ialah kadar pertumbuhan tahun ke tahun untung bersih pada suku pertama
Gambar
Sebagai tambahan kepada umum Selain proses pemprosesan data, Data-Copilot juga boleh menjana pelbagai jenis aliran kerja.
Pasukan penyelidik menguji Data-Copilot dalam dua mod aliran kerja: ramalan dan selari.
Data-Copilot juga boleh meramalkan bahagian selain daripada data yang diketahui Contohnya, masukkan soalan berikut:
Ramalkan KDNK suku tahunan China dalam empat suku berikut
Data-Copilot menggunakan sejarah Aliran Kerja
ini:Data KDNK → Gunakan model regresi linear untuk meramal masa depan → Jadual output
gambar
Keputusan selepas pelaksanaan adalah seperti berikut:
. Hasilkan cartaGambar
Kerja berkaitan kedua-dua saham adalah selari pada masa yang sama, dan carta akhir adalah seperti berikut: GambarKaedah umum Dopi-Main sistem model bahasa besar dengan reka bentuk antara muka dan Terdapat dua peringkat utama penjadualan antara muka.
Reka bentuk antara muka: Pasukan penyelidik mereka bentuk proses permintaan sendiri untuk membolehkan LLM menjana permintaan yang mencukupi secara autonomi daripada sebilangan kecil permintaan benih. Kemudian, LLM secara berulang mereka bentuk dan mengoptimumkan antara muka berdasarkan permintaan yang dijana. Antara muka ini diterangkan menggunakan bahasa semula jadi, menjadikannya mudah untuk dilanjutkan dan dipindahkan antara platform yang berbeza.
Penjadualan antara muka: Selepas menerima permintaan pengguna, LLM merancang dan memanggil alat antara muka berdasarkan penerangan antara muka rekaan sendiri dan dalam demonstrasi konteks, menggunakan aliran kerja yang memenuhi keperluan pengguna dan membentangkan hasil kepada pengguna dalam pelbagai bentuk. Data-Copilot mencapai pemprosesan dan visualisasi data yang sangat automatik dengan menjana permintaan secara automatik dan mereka bentuk antara muka secara bebas untuk memenuhi keperluan pengguna dan memaparkan hasil kepada pengguna dalam pelbagai bentuk.
Gambar
Pertama sekali, LLM menggunakan sebilangan kecil permintaan benih dan secara bebas menjana sejumlah besar permintaan (meneroka data mengikut permintaan diri) untuk merangkumi pelbagai senario aplikasi sebanyak mungkin. Kemudian, LLM mereka bentuk antara muka yang sepadan untuk permintaan ini (takrifan antara muka: hanya termasuk perihalan dan parameter), dan secara beransur-ansur mengoptimumkan reka bentuk antara muka (gabungan antara muka) dalam setiap lelaran.
Akhir sekali, para penyelidik menggunakan keupayaan penjanaan kod LLM yang berkuasa untuk menjana kod tertentu (pelaksanaan antara muka) untuk setiap antara muka dalam perpustakaan antara muka. Proses ini memisahkan reka bentuk antara muka daripada pelaksanaan khusus, mewujudkan satu set alat antara muka serba boleh yang boleh memenuhi kebanyakan permintaan.Seperti yang ditunjukkan di bawah: Alat antara muka Data-Copilot yang direka bentuk sendiri untuk pemprosesan data
Data-Copilot terlebih dahulu melakukan analisis niat untuk memahami permintaan pengguna dengan tepat.
Setelah niat pengguna difahami dengan tepat, Data-Copilot akan merancang aliran kerja yang munasabah untuk mengendalikan permintaan pengguna. Data-Copilot akan menjana JSON format tetap yang mewakili setiap langkah penjadualan, seperti step={“arg”:””, “function”:””, “output”:””,”description”:””} . Berpandukan penerangan dan contoh antara muka, Data-Copilot mengatur penjadualan antara muka dalam setiap langkah, sama ada secara berurutan atau selari.
.co/spaces/zwq2018/Data-Copilot
Atas ialah kandungan terperinci Analisis data lengkap dalam satu ayat, pembantu data model besar Universiti Zhejiang yang baharu menghapuskan keperluan untuk pengumpulan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!