Rumah >Peranti teknologi >AI >Bolehkah kelesuan AI diselesaikan melalui tadbir urus data?

Bolehkah kelesuan AI diselesaikan melalui tadbir urus data?

王林ke hadapan: 2024-01-18 17:51:22932semak imbas

Tadbir urus data dan kelesuan AI mungkin terdengar seperti dua konsep yang berbeza, tetapi kedua-duanya dikaitkan secara intrinsik. Untuk memahaminya dengan lebih baik, mari kita mulakan dengan definisi mereka.

Tadbir Urus Data

Ia telah lama menjadi tumpuan utama industri data.

Tadbir urus data ialah semua langkah untuk memastikan data adalah selamat, peribadi, tepat, tersedia dan boleh dipercayai, termasuk pembangunan standard dalaman dan dasar data untuk mengawal selia pengumpulan, penyimpanan, pemprosesan dan pelupusan data. Proses ini penting untuk melindungi privasi pengguna dan mengekalkan integriti data.

Seperti yang diketengahkan oleh definisi ini, tadbir urus data adalah tentang mengurus data—tepatnya, enjin yang memacu model AI.

Walaupun hubungan antara tadbir urus data dan AI pada mulanya jelas, mengaitkannya dengan kelesuan AI dengan menekankan punca keletihan memastikan penggunaan istilah yang konsisten sepanjang artikel.

AI Keletihan

AI keletihan boleh berlaku disebabkan oleh halangan dan cabaran yang dihadapi oleh syarikat, pembangun atau pasukan, mengakibatkan pelaksanaan terhalang atau realisasi nilai sistem AI.

Sebab utama AI yang terlalu hyping adalah jangkaan yang tidak realistik terhadap keupayaannya. Pihak berkepentingan perlu diselaraskan dengan keupayaan, kemungkinan, had dan risiko AI untuk menilai nilai dan aplikasinya dengan betul.

Mengenai risiko, etika sering dianggap sebagai perkara yang difikirkan selepas itu, yang membawa kepada pengabaian inisiatif AI yang tidak patuh.

Anda pasti tertanya-tanya tentang peranan tadbir urus data dalam menyebabkan kelesuan AI – ini adalah premis artikel ini.

Di sinilah kita akan pergi seterusnya.

AI keletihan boleh dibahagikan secara kasar kepada pra-penyerahan dan pasca-pengerahan. Mari kita fokus pada kerja pra-penyerahan dahulu.

Pra-Penyerahan

Terdapat banyak faktor yang digunakan untuk menaik taraf Bukti Konsep (PoC) kepada penggunaan, seperti:

Apakah masalah yang kami cuba selesaikan
Mengapa keutamaan sekarang menjadi isu yang mendesak?
Ya Data apa yang tersedia
Adakah ia boleh diselesaikan secara ML
Adakah terdapat corak dalam data
Bolehkah fenomena ini diulang
Apakah data tambahan yang akan meningkatkan prestasi model?

Sebaik sahaja kami menilai Untuk menentukan masalah yang terbaik boleh diselesaikan menggunakan algoritma ML, pasukan sains data menjalankan analisis data penerokaan. Banyak corak data asas didedahkan pada peringkat ini, menyerlahkan sama ada data yang diberikan mengandungi isyarat kaya Ia juga membantu dalam mencipta ciri kejuruteraan untuk mempercepatkan proses pembelajaran algoritma.

Seterusnya, pasukan membina model garis dasar pertama dan sering mendapati prestasinya tidak pada tahap yang boleh diterima. Model yang outputnya sebaik menterbalikkan syiling tidak menambah apa-apa nilai, yang merupakan salah satu kemunduran pertama dan pengajaran yang dipelajari semasa membina model ML.

Syarikat mungkin berpindah dari satu masalah perniagaan ke masalah perniagaan yang lain, membawa kepada keletihan. Namun, jika data asas tidak membawa isyarat yang kaya, tiada algoritma AI boleh dibina di atasnya. Model mesti mempelajari perkaitan statistik daripada data latihan untuk digeneralisasikan kepada data yang tidak kelihatan. .

Jenis keletihan AI ini dipanggil fasa selepas penempatan.

Sebab yang tidak terkira banyaknya boleh menyebabkan kemerosotan prestasi, dan kualiti data yang lemah ialah masalah paling biasa yang melanda model, yang mengehadkan keupayaan model untuk meramalkan respons sasaran dengan tepat tanpa ketiadaan atribut utama.

Pertimbangkan bahawa salah satu ciri penting yang tiada dalam hanya 10% daripada data latihan kini menjadi batal 50% daripada masa dalam data pengeluaran, yang membawa kepada ramalan yang salah dan usaha untuk memastikan model berprestasi secara konsisten membuat saintis data dan Pasukan perniagaan menjadi letih, menghakis keyakinan dalam saluran paip data dan meletakkan pelaburan projek pada risiko.

Tadbir Urus Data Adalah Kunci

Langkah tadbir urus data yang teguh adalah penting untuk menangani kedua-dua jenis kelesuan AI. Memandangkan data adalah teras kepada model ML, data yang kaya dengan isyarat, bebas ralat dan berkualiti tinggi diperlukan untuk kejayaan projek ML. Menangani kelesuan AI memerlukan tumpuan yang kuat pada tadbir urus data. Oleh itu, kita mesti bekerja keras untuk memastikan kualiti data yang betul, meletakkan asas untuk membina model terkini dan menyampaikan cerapan perniagaan yang boleh dipercayai.

Kualiti Data

Kualiti data ialah kunci kepada tadbir urus data yang berkembang maju dan faktor kritikal dalam kejayaan algoritma pembelajaran mesin. Syarikat mesti melabur dalam kualiti data, seperti menerbitkan laporan kepada pengguna data. Dalam projek sains data, fikirkan tentang perkara yang berlaku apabila data berkualiti rendah memasuki model, yang boleh membawa kepada prestasi yang lemah.

Hanya semasa analisis ralat boleh pasukan mengenal pasti isu kualiti data, yang akhirnya membawa kepada keletihan di kalangan pasukan apabila isu ini dihantar ke hulu untuk pembetulan.

Jelas sekali, bukan hanya usaha yang dilakukan, tetapi banyak masa yang hilang sebelum data yang betul mula dimasukkan.

Oleh itu, adalah sentiasa disyorkan untuk membetulkan isu data di sumber untuk mengelakkan lelaran yang memakan masa sedemikian. Akhirnya, laporan kualiti data yang diterbitkan membayangkan bahawa pasukan sains data (atau mana-mana pengguna hiliran lain dan pengguna data) memahami kualiti data masuk yang boleh diterima.

Tanpa kualiti data dan langkah tadbir urus, saintis data akan dirundung masalah data, mengakibatkan model tidak berjaya yang membawa kepada kelesuan AI.

Kesimpulan

Artikel ini menyerlahkan dua peringkat permulaan kelesuan AI dan menerangkan cara langkah tadbir urus data seperti pelaporan kualiti data boleh memacu pembinaan model yang boleh dipercayai dan teguh.

Dengan mewujudkan asas yang kukuh melalui tadbir urus data, syarikat boleh membina pelan hala tuju untuk pembangunan dan penerimaan AI yang berjaya dan lancar, menyemai semangat.

Untuk memastikan artikel ini memberikan gambaran menyeluruh tentang pelbagai cara untuk menangani kelesuan AI, saya juga menyerlahkan peranan budaya organisasi, yang digabungkan dengan amalan terbaik lain seperti tadbir urus data akan membolehkan pasukan sains data bekerja dengan lebih pantas dan lebih banyak lagi. secara berkesan Bina sumbangan AI yang bermakna dengan cepat.

Atas ialah kandungan terperinci Bolehkah kelesuan AI diselesaikan melalui tadbir urus data?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

算法数据分析

Kenyataan：

Artikel ini dikembalikan pada:51cto.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam

Artikel sebelumnya：Cindy Elder: Ketua Pegawai Eksekutif OpenAI Sam Altman membincangkan penggunaan tenaga dan pendirian kawal selia AIArtikel seterusnya：Cindy Elder: Ketua Pegawai Eksekutif OpenAI Sam Altman membincangkan penggunaan tenaga dan pendirian kawal selia AI

Artikel berkaitan

Lihat lagi