Rumah  >  Artikel  >  Peranti teknologi  >  Gunakan enjin gunung berapi dan model besar untuk 'menyalakan' roda tenaga data

Gunakan enjin gunung berapi dan model besar untuk 'menyalakan' roda tenaga data

王林
王林ke hadapan
2023-09-20 21:21:031363semak imbas
Dalam proses model besar mengubah beribu-ribu industri, Volcano Engine menerajui dalam menyampaikan jawapan yang diperibadikan kepada industri data.

Pada 19 September, di "Sidang Kemuncak Teknologi Pacuan Data V-Tech Data Flywheel" yang diadakan di Shanghai, Volcano Engine mengumumkan keupayaan model bahasa besar (Model Bahasa Besar) platform kecerdasan digital VeDI.
Gunakan enjin gunung berapi dan model besar untuk menyalakan roda tenaga data
Selepas peningkatan produk, ia boleh menggunakan bahasa semula jadi untuk "mencari nombor", membantu pembangunan model gudang data, mengoptimumkan kod, dan juga melengkapkan penjanaan carta visual dan melaksanakan analisis atribusi semasa perbualan dan fungsi lain. Malah pengendali biasa tanpa kemahiran pengekodan boleh mencari nombor dan menganalisisnya dengan cepat. Pada masa ini, produk data berkaitan VeDI telah dijemput untuk ujian.

Produk data yang dinaik taraf telah banyak merendahkan ambang untuk menggunakan data. Pada masa lalu, jika pengendali biasa ingin mencari nombor itu, dia sering perlu meminta bantuan kakitangan R&D. Kakitangan R&D akan menulis kod untuk membantu mendapatkan nombor tersebut Menganalisis sekeping data yang diperlukan dengan menggabungkan banyak pengetahuan profesional. Kini, dengan bantuan produk data yang dinaik taraf, pengendali boleh memasukkan keperluan mereka dalam bahasa semula jadi pada bila-bila masa dan mendapatkan data yang mereka inginkan dalam masa nyata.

Ini akan merangsang lagi nilai data. Dalam perusahaan, ambang penggunaan yang lebih rendah akan membolehkan lebih ramai orang dalam rantaian penggunaan data mula menghubungi dan menggunakan data Keperluan data yang telah ditindas oleh ambang realistik pada masa lalu akan dipenuhi dan cerapan perniagaan berdasarkan data akan menjadi lebih tepat pada masanya. dan pembuatan keputusan akan lebih tepat pada masanya. Imaginasi perniagaan yang lebih saintifik dan berasaskan data akan dikeluarkan.

Bagi perusahaan yang sedang dalam proses pendigitalan, nilai data akan dikeluarkan dalam frekuensi peredaran yang lebih tinggi, dan roda tenaga data akan dipercepatkan lagi.

Model besar disepadukan ke dalam pautan data penuh, seterusnya mengurangkan ambang untuk pengeluaran dan penggunaan data

Berbanding dengan model kecil, model besar mempunyai keupayaan penaakulan alat generalisasi yang kuat dan keupayaan penaakulan luaran, kod Keupayaan penjanaan. Keupayaan ini mempunyai kesan yang ketara pada produk data.

Keupayaan penaakulan umum yang lebih kuat bermakna kecerdasan yang lebih tinggi, tetapi pada masa yang sama, ia juga perlu ditambah dengan menggabungkan banyak alat untuk menyesuaikan pelbagai kebolehan, seperti matematik dan kebolehan analisis. Model interaksi bahasa semula jadi yang dibuka pada era model besar juga telah membawa ruang imaginasi baharu kepada penggunaan produk data.

Bermula pada bulan Mac tahun ini, Byte secara dalaman mula menggabungkan model besar dengan produk data Dalam ujian berskala kecil dengan lelaran pantas, pasukan Luo Xuan tidak lama lagi mendapati bahawa dalam senario utama produk data, model besar The. penambahbaikan dan perubahan yang dibawa adalah jelas. Selepas itu, pasukan itu mula mencuba secara besar-besaran dalam senario produk data, sentiasa mengukur keutamaan senario, dan mempromosikan pelaksanaan model besar dalam produk.

Dalam proses model besar mengubah industri data, pemilihan senario adalah salah satu langkah paling kritikal Senario penggunaan yang sesuai bukan sahaja perlu diwujudkan berdasarkan teknologi semasa atau teknologi yang boleh dijangka, tetapi juga Ia adalah. dijamin bahawa selepas menambah model besar, pengguna atau pihak perniagaan boleh mendapat pengalaman yang lebih baik, dan pada masa yang sama membawa lebih banyak nilai penggunaan data, yang boleh memacu lagi pengeluaran data.

Luo Xuan berkongsi bahawa, sebagai contoh, jika penyelesaian asal hanya mengambil masa 1-2 saat dalam beberapa senario, selepas menggunakan model besar, disebabkan masalah kelewatan model besar, ia mungkin mengambil masa lebih daripada 5 saat untuk menggunakan bahasa semula jadi , maka senario ini tidak dapat memenuhi keperluan pengalaman perniagaan untuk ketepatan masa, dan ia tidak sah.

“Walau bagaimanapun, sebagai contoh, dalam proses penjanaan kod pendek, selepas menambah bahasa semula jadi, kecekapan adegan itu bertambah baik pada masa hadapan, kerana prestasi model besar terus bertambah baik, dalam semua aspek pautan data penuh, model besar boleh Perubahan pintar yang dibawa olehnya akan menjadi lebih berbaloi untuk dinanti-nantikan.”

Pada “Sidang Kemuncak Teknologi Pacuan Data V-Tech Data Flywheel”, peningkatan produk kecerdasan digital ini platform VeDI yang diumumkan oleh Volcano Engine terutamanya termasuk Terdapat dua bahagian: DataLeap dan DataWind. Antaranya, "Pembantu Nombor" dalam DataLeap boleh menyokong pencarian nombor dalam cara soal jawab, dan "Pembantu Pembangunan" boleh menyokong penjanaan dan pengoptimuman kod SQL dalam bahasa semula jadi yang DataWind - Pembantu Analisis; bahasa untuk melengkapkan pertanyaan dan analisis visualisasi data. Meliputi keseluruhan pautan mencari, mendapatkan semula dan menganalisis nombor, menurunkan ambang teknikal untuk keseluruhan proses pengeluaran dan penggunaan data.

DataLeap - Pembantu Mencari Nombor

"Mencari Nombor" biasanya merupakan langkah pertama dalam keseluruhan rantaian penggunaan data Hanya dengan mencari aset data yang betul boleh penggunaan data direalisasikan.Walau bagaimanapun, "mencari nombor" dalam proses tradisional bukanlah tugas yang mudah dan memerlukan pergantungan yang kuat pada input kepakaran perniagaan Biasanya orang hanya boleh mengesahkan melalui carian kata kunci dan kemudian menapis manual atau mencari pembangun data profesional. #🎜🎜 ##### 🎜🎜 ## 🎜🎜 ## 🎜🎜 ## 🎜🎜#Gunakan DataLeap -Cari pembantu "find count"#🎜🎜 ## 🎜🎜 ## 🎜🎜 ## 🎜🎜 ## 🎜 🎜🎜# Fungsi "pembantu mencari nombor", digabungkan dengan model bahasa besar (LLM), sangat merendahkan ambang "mencari nombor".
Menggunakan "pembantu mencari nombor", orang yang tidak mempunyai kemahiran pengekodan juga boleh melakukan pertanyaan "antropomorfik" melalui bahasa semulajadi

Sebagai contoh, pengendali e-dagang boleh bertanya secara langsung: "Bilangan Haowu secara langsung bilik penyiaran dalam tujuh hari terakhir Keadaan perniagaan, apakah jadual yang harus digunakan?” DataLeap - Pembantu mencari data akan mengesyorkan jadual yang berkaitan dengan keadaan perniagaan berdasarkan pangkalan pengetahuan perniagaan dan menerangkan dimensi data yang sepadan dengan setiap jadual. Gunakan enjin gunung berapi dan model besar untuk menyalakan roda tenaga data

Pada masa ini, "Pembantu Berangka" boleh melaksanakan pelbagai jenis data dan fungsi berkaitan termasuk jadual Hive, set data, papan pemuka, penunjuk data, dimensi, dsb. .

Selain itu, selain memudahkan "mencari nombor", "pembantu mencari nombor" yang menggabungkan keupayaan model besar juga boleh menjadikan " mencari nombor" Kadar ketepatan dipertingkatkan lagi. Di bawah penyelesaian teknikal tradisional pada masa lalu, perolehan semula aset data bergantung pada pengurusan data berstruktur dan data perniagaan tidak berstruktur mungkin mempunyai sambungan yang hilang Apabila kata kunci digunakan untuk mendapatkan semula, masalah pemecahan pautan mungkin berlaku, yang mungkin mengurangkan bilangan data berdasarkan pada. senario perniagaan Cari dan gunakan dengan cekap. Di samping itu, carian menyediakan satu set jawapan calon berdasarkan kata kunci, yang memerlukan pemeriksaan dan pengesahan manual, ia bukan jawapan langsung, menyukarkan pengguna untuk mendapat pengalaman yang baik.

Kini, dalam proses perbualan dengan pengguna, model bahasa besar (LLM) dapat memahami niat sebenar pengguna dan menjadikan proses carian lebih fokus . Ia menjimatkan kos pertimbangan manusia, dan "mencari nombor" itu sendiri menjadi lebih cepat Pada masa yang sama, dengan peningkatan beransur-ansur kebolehan pemahaman semantik dan analisis model, perolehan semula perbualan mempunyai kecekapan perolehan pautan penuh berbanding kata kunci mudah. pengambilan juga lebih tinggi.

DataLeap - Pembantu Pembangunan
#🎜🎜🎜##🎜🎜🎜##🎜🎜🎜##🎜 🎜#Dalam proses pengeluaran dan pemprosesan data, "Pembantu Pembangunan" boleh menyokong penggunaan bahasa semula jadi dan menjana kod SQL secara automatik untuk kod sedia ada, ia secara automatik boleh melaksanakan pembaikan pepijat, pengoptimuman kod, penjelasan dan anotasi, dan lain-lain , ia juga boleh melaksanakan dokumentasi melalui dialog Konsultasi mengenai isu penggunaan SQL seperti carian, penggunaan fungsi, contoh kod, dll.

                              Bangun kod SQL secara automatik
#🎜🎜🎜🎜🎜 🎜🎜#
#🎜 🎜# Lapisan bawah pembantu pembangunan menggunakan model bahasa besar (LLM) Selepas latihan kod dan korpus besar-besaran, ia secara automatik boleh mengaitkan maklumat metadata termasuk skema jadual mengikut input bahasa semula jadi pengguna, menjana kod pemprosesan data berkualiti tinggi, dan Keupayaan untuk memahami, menulis semula, dan kod soal jawab.
#🎜🎜 ## 自动##🎜🎜 ## 🎜🎜 ## 🎜🎜 ## 🎜🎜 ## 🎜🎜#
Pembantu pembangunan memecahkan halangan bahasa, yang sangat mengurangkan had pembangunan data “Pada asalnya, untuk (memproses) data, anda mungkin perlu mengetahui bahasa pengaturcaraan, seperti SQL atau Python, yang merupakan keperluan kemahiran yang agak kuat Namun, kini anda tidak lagi memerlukan bahasa pengaturcaraan dan boleh menggunakan bahasa semula jadi. Ini bermakna keperluan untuk orang yang melakukan ini telah dikurangkan lagi.” Kakitangan operasi yang tidak memahami SQL juga boleh melakukan beberapa ETL asas. Pengendali boleh membenarkan DataLeap menjana kod permintaan data secara automatik yang sepadan dengan keadaan perniagaan, seperti pesanan jualan mengikut bandar atau trafik bilik siaran langsung mengikut tempoh masa, dsb. Operator juga boleh bertanya tentang maksud kod, seperti "Adakah terdapat sebarang rancangan pengoptimuman semasa jadual ini berjalan?", atau mereka boleh mengadakan perbualan: "Bantu saya menyemak dan membetulkan rentetan kod ini." Anda juga boleh menghuraikan kod yang dijana dengan satu klik, memanggil alat SQL untuk menyemak jadual, dan klik untuk mengesahkan pembaikan automatik AI untuk mengoptimumkan lagi aset data.

Lebih penting, untuk pembangun profesional, DataLeap - Pembantu Pembangunan boleh membantu mereka melakukan beberapa kerja asas dan memproses data daripada analisis data Jurutera dan pengendali perniagaan yang bergantung pada data mempunyai beberapa keperluan yang kompleks tetapi asas Jurutera hanya perlu membetulkan dan menyemak ketepatan kod yang dihasilkan pada akhir.
Hasilnya, kakitangan R&D boleh menumpukan pada kerja yang lebih kreatif, lebih menumpukan kepada keperluan senario yang kompleks, menggunakan pembantu pembangunan untuk mengoptimumkan kod dan meningkatkan produktiviti dan kualiti kod P&P.

DataWind - Pembantu Analisis
#🎜🎜🎜##🎜🎜🎜##🎜🎜🎜##🎜 🎜#
Setelah menyedari pencarian dan perolehan nombor, kami datang ke pautan analisis data. DataWind - Pembantu Analisis, yang menggabungkan keupayaan model yang besar, boleh membantu orang dalam kedudukan bukan analitik menyelesaikan satu siri penerokaan perniagaan seperti pertanyaan dan analisis visualisasi data melalui dialog bahasa semula jadi, menurunkan ambang untuk pautan ini.
Pertama ialah penciptaan "set data". Dengan aset data, pengendali menggunakan kaedah drag-and-drop DataWind untuk mencipta set data, dan kemudian menggunakan bahasa semula jadi untuk mentakrifkan logik medan yang berbeza, seperti menyemak terus data "tempoh siaran langsung selebriti besar".

                    Generasi medan
#🎜##🎜🎜🎜##🎜 🎜#
Selepas menyemak, pengendali boleh melakukan analisis visual dan penerokaan. Pada masa lalu, alat BI biasanya menggunakan operasi drag-and-drop Walaupun ambang telah diturunkan dalam pengeluaran papan pemuka, dalam bidang analisis dan cerapan, sejumlah besar pengetahuan profesional masih diperlukan untuk memahami data dengan lebih baik satu "ambang".

                       Penerokaan visual#🎜🎜🎜#
                       Penerokaan visual#🎜🎜🎜🎜##🎜##🎜## 🎜🎜#
Walau bagaimanapun, dengan berkat keupayaan penaakulan umum yang lebih kukuh bagi model besar, DataWind telah dapat menjalankan andaian dan pengesahan asas serta mencadangkan idea analisis.

Fungsi analisis automatik AI yang disediakan oleh DataWind boleh menyokong penerokaan lanjut tentang sebab di sebaliknya berdasarkan carta. Sebagai contoh, AI boleh menganalisis secara automatik carta visual yang dijana seperti "graf trafik bilik siaran langsung mengikut tempoh masa" dan "kawasan teratas jualan bilik siaran langsung hanya perlu membuat atribusi lanjut melalui dialog berdasarkan hasil analisis". Gunakan enjin gunung berapi dan model besar untuk menyalakan roda tenaga data

Pada masa yang sama, DataWind juga berhubung dengan alat kerjasama pejabat seperti Feishu Pengguna boleh menjalankan analisis yang lebih lanjutan melalui langganan mesej IM dan perbualan semula jadi capai bila-bila masa Analisis fleksibel di mana-mana sahaja, memenuhi kecerdasan layan diri merentas keseluruhan rangkaian daripada set data, cerapan visual, langganan mesej, dll., dan penyepaduan pejabat China Unicom membolehkan analisis data disepadukan dengan lancar ke dalam kehidupan seharian.

Mesej IM yang diselaraskan Langgan untuk analisis sambungan

Analisis ambang untuk pembantu analisis akan mengurangkan lagi ambang analisis Daripada membaca "rajah data" untuk memahami secara langsung keputusan melalui dialog bahasa semula jadi, analisis data dan kitaran pemikiran telah sangat dipendekkan untuk menyelesaikan analisis masa lalu analisis masa lalu Dapatkan pandangan tentang titik kesakitan yang memerlukan banyak pengetahuan profesional dan memendekkan kitaran analisis data.

Pada peringkat ini, senario aplikasi DataWind - Pembantu Analisis sudah sangat kaya Di samping membolehkan penerokaan perbualan dalam senario analisis teras, Pembantu Analisis juga memperluaskan keupayaannya kepada penjanaan ekspresi dan tugas lain yang sebelum ini memerlukan lebih banyak. ambang teknikal di tempat kejadian.

Model besar mempercepatkan roda tenaga data untuk membantu perusahaan mencapai lebih baik dipacu data

ByteDance mempunyai gen terdorong data yang mendalam. Sejak penubuhannya, hampir semua senario dalam ByteDance telah tertakluk kepada ujian A/B dan pelarasan dibuat melalui maklum balas data untuk memacu strategi perniagaan, seperti sama ada kesan pengoptimuman kualiti video Douyin adalah baik, sama ada pengoptimuman strategi algoritma pengesyoran adalah tepat, malah Nama Toutiao juga telah diuji A/B.

Dalam Byte, skop penggunaan data adalah sangat luas. Dari segi organisasi, semua orang daripada pengurusan atasan hingga pertengahan, serta pekerja barisan hadapan, pada asasnya boleh melihat data dan menggunakan data untuk menilai status operasi, hasil dan perbelanjaan syarikat, kemajuan perniagaan dan strategi produk. Dalam senario tertentu, seperti pemasaran masa nyata dalam e-dagang langsung, reka bentuk operasi dan mendorong strategi pemasaran yang sepadan berdasarkan data masa nyata.

Byte telah mencapai keputusan saintifik dan tindakan tangkas melalui penggunaan data, yang telah meningkatkan nilai perniagaan melalui penggunaan data yang kerap dan pendapatan perniagaan, ia telah menyasarkan pembinaan aset data berkualiti tinggi pada kos rendah kepada lebih baik; menyokong aplikasi perniagaan.

Pada bulan April tahun ini, berdasarkan pengalaman praktikal yang dipacu data ByteDance lebih sepuluh tahun, Volcano Engine mengeluarkan paradigma baharu peningkatan kecerdasan digital perusahaan, "Data Flywheel", menggunakan "Data Flywheel" sepenuhnya. meringkaskan aliran data perusahaan Selepas disepadukan ke dalam aliran perniagaan, ia boleh mencapai kesan roda tenaga untuk menambah baik aset data dan aplikasi perniagaan.

Di bawah aliran keseluruhan pendigitalan, perniagaan korporat dalam beribu-ribu industri semakin hampir kepada pendigitalan, dan data menjadi semakin penting kepada perusahaan. Sebagai faktor pengeluaran baharu, data menyokong transformasi digital dan pintar perusahaan. Tetapi secara objektif bercakap, walaupun banyak syarikat telah melakukan banyak pembinaan digital, mereka tidak dapat mengeluarkan sepenuhnya nilai data.

"Sebuah perusahaan mungkin menggunakan produk data pada harga yang tinggi, tetapi mungkin terdapat sangat sedikit orang yang benar-benar menggunakannya secara dalaman. Jika data sukar untuk mengalir, ia akan menjadi sukar untuk merealisasikan nilainya." diperhatikan dalam pasaran produk data,
Banyak Perusahaan yang sedang menjalani pembinaan digital menghadapi masalah seperti kos pembinaan dan pengurusan data yang tinggi, halangan tinggi untuk menggunakan produk data, dan nilai aset data yang rendah.

Dari perspektif keseluruhan proses pendigitalan, sukar tetapi betul untuk menjadi "didorong data". Mengambil Byte sebagai contoh, Luo Xuan mendedahkan bahawa pada masa ini, 80% pekerja ByteDance boleh menggunakan produk data secara langsung, dan aset data yang boleh diurus dan beroperasi meliputi 80% daripada senario analisis harian. Berdasarkan pengalaman Byte, ini bermakna kadar penggunaan produk data dalaman dalam perusahaan dan liputan aset data terurus dan operasi dalam senario perlu ditingkatkan ke tahap yang lebih tinggi untuk membentuk "roda tenaga data" yang baik dalam syarikat.

Dalam proses ini, produk data yang disokong oleh model besar mungkin menjadi daya penggerak penting dalam membantu syarikat mencapai matlamat mereka.
Platform kecerdasan digital VeDI, yang telah dinaik taraf dengan keupayaan model yang besar, mengurangkan lagi keseluruhan proses pengeluaran dan penggunaan data seperti pencarian nombor, perolehan nombor dan analisis data. Di bawah tahap permintaan yang sama, menggunakan VeDI yang dinaik taraf, bilangan orang dalam syarikat yang mempunyai keupayaan untuk menggunakan produk data telah berkembang daripada penganalisis data profesional kepada semua orang yang mempunyai keperluan data, yang mungkin operasi, bos, pengurus produk, dsb., Penggunaan data menjadi inklusif.

"Hanya dengan menurunkan ambang dan menggunakan data kita boleh mengetahui jenis nilai yang akan dijana oleh data dalam peredaran." khazanah yang digali dan produk data ambang rendah mungkin menjadi kunci untuk membuka kuncinya.

Dengan sokongan model besar, "roda tenaga data" dalam perusahaan akan mempercepatkan putarannya.
Perniagaan syarikat mempunyai enjin yang lebih berkuasa, dan kakitangan perniagaan boleh mendapatkan maklum balas data dengan cepat daripada "data keluar dalam beberapa saat", dengan itu mengoptimumkan perniagaan dengan lebih pantas Dalam proses aliran data yang dipercepatkan, lebih banyak aset data berkualiti tinggi terus terkumpul. Beri perniagaan lebih cerapan dan akhirnya membuat keputusan perniagaan lebih saintifik dan tangkas.

Atas ialah kandungan terperinci Gunakan enjin gunung berapi dan model besar untuk 'menyalakan' roda tenaga data. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:jiqizhixin.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam