Rumah  >  Artikel  >  Peranti teknologi  >  Cabaran utama dalam menggunakan data masa nyata

Cabaran utama dalam menggunakan data masa nyata

王林
王林ke hadapan
2023-04-13 08:07:071110semak imbas

Cabaran utama dalam menggunakan data masa nyata

Menganalisis data masa nyata sentiasa memberikan cabaran kepada mereka yang bekerja dengan model ML kerana mereka ingin meningkatkan ketepatan inferens mereka menggunakan data terkini.

Hanya AI dan ML boleh memahami volum besar penstriman data kerana data masa nyata dihantar terlalu cepat untuk analisis manual atau perisian tradisional untuk organisasi data. Tetapi semasa bekerja dengan data masa nyata ialah salah satu aplikasi model ML yang paling berharga, ia menimbulkan beberapa persoalan bagi mereka yang ingin memanfaatkan alat untuk analisis data.

Seterusnya, kami membincangkan beberapa cabaran utama yang dihadapi oleh mereka yang cuba menggunakan data masa nyata dan cara yang berpotensi untuk mengatasinya

Dalam kes penggunaan, perusahaan perlu menggunakan data penstriman dan bukannya Data kelompok? Secara keseluruhan, strim data boleh digunakan untuk membuat keputusan automatik masa nyata, yang mungkin melibatkan memanfaatkan model pembelajaran mesin dalam persekitaran pengeluaran pada set data yang kompleks. Contoh ini termasuk perdagangan algoritma dalam perdagangan frekuensi tinggi, pengesanan anomali dalam peranti perubatan, pengesanan pencerobohan dalam keselamatan siber atau model penukaran/pengekalan e-dagang. Oleh itu, bekerja dengan data kelompok terletak di bawah "segala-galanya", di mana pembuatan keputusan dan konteks masa nyata tidak sepenting mempunyai sejumlah besar data untuk dianalisis. Oleh itu, bekerja dengan data kelompok termasuk dalam kategori "segala-galanya", di mana keputusan dan konteks masa nyata tidak penting, sebaliknya sejumlah besar data dianalisis. Contoh ini termasuk ramalan permintaan, pembahagian pelanggan dan atribusi berbilang sentuhan.

Cabaran menggunakan data masa nyata

Semasa menggunakan data masa nyata untuk melatih model ML pada aliran data berterusan mempunyai kelebihan untuk menyesuaikan diri dengan cepat kepada perubahan dan dapat menjimatkan ruang penyimpanan data, ada juga cabaran. Menukar model kepada data masa nyata mungkin dikenakan overhed tambahan dan mungkin tidak memberikan hasil yang ideal jika cabaran ini tidak dipertimbangkan dengan betul.

Definisi masa nyata

Mengendalikan data masa nyata memberikan beberapa cabaran, yang pertama ialah konsep data masa nyata itu sendiri. Orang yang berbeza mempunyai pemahaman yang berbeza tentang perkataan "masa nyata". Dalam persekitaran analitis, sesetengah orang mungkin menganggap masa nyata bermakna mendapat jawapan dengan segera, manakala yang lain tidak kisah menunggu beberapa minit dari saat data dikumpulkan sehingga sistem analitis bertindak balas.

Takrifan masa nyata yang berbeza ini boleh membawa kepada hasil yang tidak jelas. Pertimbangkan senario di mana jangkaan dan pemahaman pasukan pengurusan tentang analisis masa nyata berbeza daripada yang melaksanakannya. Takrifan yang tidak jelas membawa kepada ketidakpastian tentang potensi kes penggunaan dan aktiviti perniagaan (semasa dan akan datang) yang boleh ditangani.

Kelajuan data malar dan variasi kapasiti

Secara umumnya, data masa nyata tidak mengalir pada kelajuan atau volum yang konsisten dan sukar untuk Meramalkan bagaimana ia akan berkelakuan. Tidak seperti memproses data kelompok, adalah tidak praktikal untuk sentiasa memulakan semula tugas sehingga kecacatan ditemui dalam perancangan. Memandangkan data sentiasa mengalir, sebarang ralat dalam memprosesnya boleh memberi kesan domino pada keputusan.

Sifat terhad peringkat pemprosesan data masa nyata menghalang lagi prosedur penyelesaian masalah standard. Oleh itu, walaupun ujian mungkin tidak menangkap setiap ralat yang tidak dijangka, platform ujian yang lebih baharu boleh mengawal dan mengurangkan masalah dengan lebih baik.

Kualiti Data

Mendapatkan cerapan berguna daripada data masa nyata juga bergantung pada kualiti data. Kekurangan kualiti data boleh memberi kesan kepada keseluruhan aliran kerja analitik, sama seperti pengumpulan data yang lemah boleh memberi kesan kepada prestasi keseluruhan saluran paip. Tidak ada yang lebih buruk daripada membuat kesimpulan perniagaan daripada data yang salah.

Dengan berkongsi tanggungjawab dan mendemokrasikan akses kepada data, tumpuan yang kuat pada ketepatan, kelengkapan dan kesempurnaan data boleh dicapai. Penyelesaian yang berkesan akan memastikan semua orang dalam setiap fungsi mengenali nilai data yang tepat dan menggalakkan mereka untuk bertanggungjawab untuk mengekalkan kualiti data. Selain itu, untuk memastikan hanya sumber data yang boleh dipercayai digunakan, prosedur automatik mesti digunakan untuk menggunakan dasar kualiti yang serupa pada data masa nyata, kerana ini mengurangkan usaha analisis yang tidak perlu.

Pelbagai sumber dan format data

Saluran pemprosesan data masa nyata boleh menghadapi kesukaran disebabkan oleh kepelbagaian format data dan peningkatan bilangan sumber data. Contohnya, dalam e-dagang, alat pemantauan aktiviti, penjejak aktiviti elektronik dan model tingkah laku pengguna semuanya menjejaki aktiviti web dalam dunia dalam talian. Begitu juga, dalam pembuatan, pelbagai jenis peranti IoT digunakan untuk mengumpul data prestasi daripada pelbagai peranti. Semua kes penggunaan ini mempunyai kaedah pengumpulan data yang berbeza dan selalunya format data yang berbeza juga.

Disebabkan perubahan dalam data ini, perubahan spesifikasi API atau kemas kini perisian tegar penderia boleh menyebabkan gangguan dalam aliran data langsung. Untuk mengelakkan analisis yang salah dan masalah masa depan yang berpotensi, data masa nyata mesti mengambil kira situasi di mana peristiwa tidak dapat direkodkan.

Teknologi Lapuk

Pelbagai sumber maklumat baharu menimbulkan masalah kepada perniagaan. Skala proses semasa untuk menganalisis data masuk telah berkembang dengan ketara. Mengumpul dan menyediakan maklumat menggunakan tasik maklumat di premis atau dalam awan mungkin memerlukan lebih banyak ujian daripada yang dijangkakan.

Masalah ini berpunca terutamanya daripada penggunaan sistem dan teknologi warisan, yang memerlukan pasukan pereka maklumat dan jurutera maklumat mahir yang sentiasa berkembang untuk menangkap dan menyegerakkan maklumat serta mencipta saluran pemeriksaan yang diperlukan untuk menyampaikan maklumat kepada aplikasi.

Memandangkan cabaran unik memproses data masa nyata, organisasi perlu mempertimbangkan alat yang akan membantu mereka menggunakan dan mengurus model AI dan ML dengan cara yang paling berkesan. Antara muka yang mudah digunakan yang membolehkan sesiapa sahaja dalam pasukan memanfaatkan metrik dan analitik masa nyata untuk menjejak, mengukur dan membantu meningkatkan prestasi ML adalah ideal.

Ciri kebolehmerhatian asas, seperti jejak audit masa nyata data yang digunakan dalam pengeluaran, boleh membantu pasukan mengenal pasti punca masalah dengan mudah. Akhirnya, daya saing perusahaan mungkin bergantung pada keupayaannya untuk memperoleh cerapan perniagaan yang boleh diambil tindakan daripada data masa nyata melalui saluran paip pemprosesan data yang dioptimumkan untuk volum data yang besar sambil tetap memberikan keterlihatan kepada prestasi model.

Atas ialah kandungan terperinci Cabaran utama dalam menggunakan data masa nyata. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:51cto.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam