Rumah >Peranti teknologi >AI >Perkongsian teknologi alat enjin gunung berapi: gunakan AI untuk melengkapkan perlombongan data dan melengkapkan penulisan SQL dengan ambang sifar
Apabila menggunakan alat BI, soalan yang sering dihadapi ialah: "Bagaimana kita boleh menghasilkan dan memproses data jika kita tidak tahu SQL? Bolehkah kita melakukan analisis perlombongan jika kita tidak tahu algoritma ?"
Apabila pasukan algoritma profesional melakukan perlombongan data, analisis data dan visualisasi juga akan kelihatan agak berpecah-belah. Menyelesaikan kerja pemodelan algoritma dan analisis data dengan cara yang diperkemas juga merupakan cara yang baik untuk meningkatkan kecekapan.
Pada masa yang sama, untuk pasukan gudang data profesional, kandungan data dengan tema yang sama menghadapi masalah "pembinaan berulang, penggunaan dan pengurusan yang agak berselerak" - adakah terdapat cara untuk menghasilkannya pada masa yang sama dalam satu tugasan, dengan tema yang sama? Bolehkah set data yang dihasilkan digunakan sebagai input untuk mengambil bahagian semula dalam pembinaan data?
DataWind, cerapan data pintar platform BI yang dilancarkan oleh Volcano Engine, telah melancarkan ciri lanjutan baharu - pemodelan visual.
Pengguna boleh memudahkan proses pemprosesan dan pemodelan data yang kompleks menjadi proses kanvas yang jelas dan mudah difahami melalui operasi menyeret, menarik dan menyambung secara visual Semua jenis pengguna boleh melengkapkan pengeluaran dan pemprosesan data mengikut idea tentang apa yang mereka fikir adalah apa yang mereka dapat dengan itu menurunkan ambang untuk pengeluaran dan pemerolehan data.
Kanvas menyokong membina beberapa set proses kanvas pada masa yang sama Satu gambar boleh merealisasikan pembinaan pelbagai tugas pemodelan data, meningkatkan kecekapan pembinaan data dan mengurangkan kos pengurusan tugasan, di samping itu, lebih daripada 40 jenis pembersihan data disepadukan dan dibungkus dalam kanvas , pengendali kejuruteraan ciri, meliputi keupayaan pengeluaran data peringkat tinggi, tanpa memerlukan pengekodan untuk melengkapkan keupayaan data yang kompleks.
Penghasilan dan pemprosesan data ialah langkah pertama untuk mendapatkan dan menganalisis data.
Untuk pengguna bukan teknikal, terdapat ambang tertentu untuk menggunakan sintaks SQL Pada masa yang sama, fail tempatan tidak boleh dikemas kini dengan kerap, menyebabkan keperluan untuk membuat semula papan pemuka secara manual setiap kali. Tenaga kerja teknikal yang diperlukan untuk mendapatkan data selalunya perlu dijadualkan, dan ketepatan masa dan kepuasan pemerolehan data sangat dikurangkan Oleh itu, adalah penting untuk menggunakan alat pembinaan data kod sifar.
Dua senario biasa disenaraikan di bawah untuk menunjukkan cara pemprosesan data ambang sifar digunakan dalam kerja.
Apabila lelaran operasi produk memerlukan maklum balas input tepat pada masanya bagi data yang berbeza, proses pemprosesan data boleh diabstrak dan dibina melalui visualisasi Operator seret modular membina proses pemprosesan data.
Untuk mendapatkan bilangan pesanan dan jumlah pesanan mengikut tarikh dan butiran bandar, dan untuk mendapatkan data bandar bagi 10 data jumlah penggunaan harian teratas, operasi adalah seperti berikut:
Aliran pemprosesan data am |
Proses pemodelan visual |
|
|
Semasa proses pemprosesan data, terdapat berbilang sumber data yang perlu digabungkan dan digunakan Secara konvensional, sukar dan memakan masa untuk menguasai Vlookup dan algoritma lain melalui Excel. Pada masa yang sama, apabila jumlah data adalah besar, prestasi komputer mungkin tidak dapat melengkapkan pengiraan gabungan data.
Jika terdapat dua data pesanan besar dan jadual maklumat atribut pelanggan, jumlah keuntungan perlu dikira berdasarkan jumlah bil dan jumlah kos, dan kemudian 100 maklumat pesanan pengguna teratas diambil mengikut keuntungan sumbangan
Proses pemprosesan data am
|
Proses pemodelan visual | tr> ||||
VloopUp terpakai mencari data pengguna dalam susunan dan data pengguna dalam pelanggan, dan kemudian menggabungkan kedua-dua data untuk menjana data baharu |
|
Apabila pembersihan data asas tidak lagi dapat memenuhi pembinaan data dan analisis data, sokongan algoritma AI diperlukan untuk perlombongan. Apabila data mempunyai lebih banyak nilai tersembunyi. Pelajar pasukan algoritma mungkin mengalami ketidakupayaan untuk bekerja dengan baik dengan carta visual, dan tidak dapat menghasilkan data yang baik yang boleh digunakan dengan cepat manakala pengguna biasa mungkin terus ditindas oleh ambang tinggi kod AI untuk menyekat pembangunan algoritma ini - meningkatkan permintaan; tetapi takut permintaan Ia terlalu cetek dan nilainya tidak dapat dinilai dengan baik Pada masa ini, perlombongan algoritma menjadi kemewahan.
Pemodelan visual DataWind merangkumi lebih daripada 30 keupayaan pengendali AI biasa. Pengguna hanya perlu memahami fungsi algoritma dan mengkonfigurasi input dan matlamat latihan operator algoritma melalui konfigurasi untuk melengkapkan latihan model dengan cepat keputusan berdasarkan kandungan data yang dikonfigurasikan lain.
Dua senario biasa akan diambil sebagai contoh di bawah, Bagaimana untuk melengkapkan perlombongan data tanpa mengetahui cara menulis Python.
Kerja harian pengguna pada asasnya tidak melibatkan penulisan Python, tetapi terdapat senario permintaan untuk perlombongan data. Dia perlu melakukan perlombongan niat pelanggan berdasarkan sampel pelanggan niat tinggi sedia ada. Pada ketika ini, proses perlombongan data boleh dibina melalui pemodelan visual:
Pengguna perlu membina model berdasarkan sedia ada data Model belian semula pengguna. Semasa pembinaan model, adalah perlu untuk menggunakan pepohon penggalak kecerunan untuk membina model ramalan selepas pembersihan data dan penukaran format Pada masa ini, proses model belian semula boleh dibina berdasarkan pemodelan visual:
<.>
Sebagai penganalisis data, anda juga mempunyai banyak kerja harian untuk membina set data dan membina papan pemuka data. Tetapi biasanya jadual bawah yang diperoleh daripada gudang data akan menjadi jadual yang luas Atas dasar ini, tugas set data yang berbeza dibina mengikut keperluan senario yang berbeza.
Dalam penggunaan seterusnya, kami sering menghadapi lebih banyak set data yang serupa, tetapi logik khusus tidak dapat dibandingkan dan disahkan dengan baik. Pada masa ini, adalah bagus jika semua logik set data dikonfigurasikan dan dijana dalam satu set data, dan setiap set data boleh dinilai dan ditakrifkan melalui proses tugasan.
Untuk senario ini, keupayaan pemodelan visual DataWind juga boleh diselesaikan dengan baik. Fungsi pemodelan visual menyokong set data tunggal untuk diproses oleh berbilang proses logik pada masa yang sama untuk menjana berbilang set data. Ambil pemprosesan data pesanan dan data pengguna sebagai contoh:
Oleh itu, penjanaan 4 set data diselesaikan melalui satu tugasan dan dua input data 4 set data boleh membina kawasan subjek data, dan data berkaitan seterusnya boleh digunakan daripada ini titik pada. Output set data mengikut tugasan digunakan.
Volcano Engine Intelligent Data Insight DataWind ialah platform yang dipertingkatkan yang menyokong analisis layan diri secara terperinci. tahap platform ABI data besar. Daripada akses data, penyepaduan data, kepada pertanyaan dan analisis, ia akhirnya dipersembahkan kepada pengguna perniagaan dalam bentuk portal data visual, skrin besar digital, dan kokpit pengurusan, yang membolehkan data menggunakan nilai.
Atas ialah kandungan terperinci Perkongsian teknologi alat enjin gunung berapi: gunakan AI untuk melengkapkan perlombongan data dan melengkapkan penulisan SQL dengan ambang sifar. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!