Rumah > Artikel > Peranti teknologi > Aplikasi teknologi pengecaman emosi teks berdasarkan pembelajaran mendalam dalam pengurusan keselamatan dan platform kawalan berita buruk 5G
Pengarang| Sun Yue, Unit: China Mobile (Hangzhou) Information Technology Co., Ltd. | China Mobile Hangzhou R&D Center
Dengan pembangunan rangkaian 5G Memandangkan ia terus mendapat populariti, sebilangan besar pengguna mula berhubung dan menggunakan rangkaian 5G. Rangkaian 5G bukan sahaja boleh menghantar suara, video, teks dan maklumat lain rangkaian tradisional, tetapi juga boleh digunakan dalam senario aplikasi yang lebih praktikal dengan kependaman yang lebih rendah dan keupayaan kedudukan ketepatan tinggi, seperti: maklumat medan perang secara langsung, Penentududukan satelit, navigasi, dll.
Maklumat dalam talian sering dicampur dengan maklumat yang tidak baik, seperti maklumat berkaitan politik, maklumat lucah dan maklumat berkaitan hitam , maklumat penipuan, maklumat pengiklanan komersial, dsb., dan bilangan maklumat buruk semakin meningkat dari tahun ke tahun, menyebabkan gangguan besar kepada pengguna. Untuk membersihkan persekitaran rangkaian dan mengawal penyebaran maklumat buruk secara berkesan, platform kawalan keselamatan dan kawalan keselamatan berita buruk 5G China Mobile telah wujud.
Sumber data: Pusat Keselamatan Maklumat Kumpulan Mudah Alih China
Apabila menghadapi persekitaran maklumat rangkaian yang kompleks, ini platform Seperti mesej teks, mesej suara, mesej video, mesej media kaya, dsb., mengklasifikasikan mesej kepada: berkaitan politik, pornografi, berkaitan kumpulan, berkaitan penipuan, mesej pengiklanan komersial, mesej biasa, dsb., dan kemudian memintas mereka tepat pada masanya melalui strategi yang sepadan dan hukuman susulan akan dijalankan mengikut keterukan berita buruk, untuk membersihkan persekitaran rangkaian daripada punca utama dan mewujudkan ruang rangkaian yang baik.
Platform ini terutamanya memintas maklumat buruk melalui kaedah berikut:
①Tetapkan kata kunci peringkat pertama: Kata kunci peringkat pertama biasanya ditetapkan kepada beberapa perkataan yang sangat sensitif Jika pengguna menghantar mesej yang mengandungi kandungan kata kunci peringkat pertama, mesej itu akan dipintas serta-merta, kandungan maklumat tidak boleh dihantar, dan pengguna ditanda.
②Tetapkan kata kunci biasa: Kata kunci biasa ditetapkan kepada beberapa perkataan yang lebih sensitif Jika pengguna menghantar mesej yang mengandungi kandungan kata kunci biasa, dan dalam tempoh tertentu masa Dalam tempoh masa tertentu, jika bilangan kali pengguna menghantar mesej sensitif melebihi ambang pemintasan pratetap sistem, sistem akan menarik pengguna ke dalam senarai hitam, dan dalam tempoh masa tertentu, pengguna tidak akan dapat untuk menggunakan perkhidmatan rangkaian 5G penuh.
③Tetapkan pemantauan maklumat teks kompleks: Jika pengguna menghantar fail PDF, yang mengandungi teks dan gambar, teks dalam fail akan diekstrak dan ditapis Kata kunci lanjutan dan mekanisme kata kunci biasa, dan gambar ditapis oleh mekanisme media kaya mengikut hasil penapisan teks dan gambar masing-masing, prinsip pemprosesan berat diterima pakai sebagai hasil pemprosesan fail.
<.>
Mekanisme penapisan platform kawalan keselamatan berita buruk 5G sedia ada hanya boleh menapis frasa dan ayat pendek yang ditentukan dan terhad Dengan populariti Internet, perkataan baharu akan muncul dalam jumlah yang besar setiap hari , dan hanya penambahan manual diperlukan, anda tidak boleh mengemas kini perpustakaan perbendaharaan kata dengan cara yang tepat pada masanya dan pantas. Lebih-lebih lagi, apabila sebilangan besar pengguna hari ini menghantar mesej teks, walaupun keseluruhan mesej teks tidak mengandungi perkataan yang menyalahi undang-undang, fikiran dan emosi yang diluahkan mungkin mengandungi sejumlah besar kecenderungan emosi negatif Kata-kata dan ayat pendek sahaja tidak boleh berjaya memintas kandungan emosi negatif . Oleh itu, menggunakan analisis sentimen teks untuk mengemukakan ayat yang kaya dengan kecenderungan emosi negatif untuk semakan dan pemintasan boleh mengukuhkan lagi kesan kawalan maklumat yang tidak baik dan mengurangkan hakisan dan keracunan pengguna oleh maklumat spam. Dengan menubuhkan perpustakaan emosi teks yang mengandungi frasa Internet dan mesej berita yang popular, emosi yang kaya dengan teks dibahagikan kepada tiga kategori: emosi positif, emosi neutral dan emosi negatif, dan Tambah label yang sepadan dengan setiap teks mengikut tiga kategori ini, dan gunakan rangkaian pembelajaran mendalam untuk melatih teks dalam perpustakaan emosi Model terlatih boleh digunakan dalam platform pengurusan dan kawalan berita buruk 5G untuk memintas mesej emosi yang buruk. 4. Butiran pelaksanaan teknikal bagi sistem pengurusan dan kawalan buruk 5G berdasarkan pembelajaran mendalam Teknologi ini mengandungi tiga subjek utama: sistem pembahagian perkataan jieba, vektorisasi frasa dan algoritma pengecaman emosi teks Interaksi antara setiap subjek adalah seperti berikut:Carta alir interaksi setiap modul
Gunakan teknologi perangkak untuk merangkak perkataan Internet dan mesej berita sebagai teks asal, dan bahagikan teks asal kepada set latihan dan set ujian dalam nisbah 8:2, labelkan maklumat teks dalam set latihan, dan kemudian bahagikan teks dalam set ujian Maklumat dibahagikan melalui alat pembahagian perkataan jieba, contohnya: Dia datang ke Bangunan Hangyan Mudah Alih. Selepas pembahagian perkataan melalui alat pembahagian perkataan jieba, hasilnya ialah: dia/datang/pindah/Hangyan/bangunan, dan akhirnya data selepas pembahagian perkataan disusun menjadi korpus. Oleh kerana jumlah maklumat teks dalam set latihan dan set ujian adalah sangat besar (biasanya berjuta-juta data), jumlah data dalam korpus segmentasi pasca perkataan juga akan menjadi sangat besar (berpuluh juta data). Walaupun korpora ini boleh disimpan dalam bentuk bernombor dalam korpus, disebabkan jumlah data yang besar, ia adalah mudah untuk mengalami bencana dimensi. Oleh itu, untuk zarah modal yang muncul dalam maklumat teks, seperti: "le", "的", "我", dsb., walaupun perkataan ini muncul sangat kerap, ia mempunyai sedikit sumbangan kepada kesan emosi, jadi kami akan memilih untuk menghapuskan perkataan ini daripada Frasa korpus untuk mencapai tujuan mengurangkan dimensi.
Kami menghantar frasa vektor dalam set latihan ke rangkaian pembelajaran mendalam untuk pembelajaran dan latihan, mendapatkan model yang sepadan dan akhirnya meletakkan data dalam set ujian ke dalam model untuk dilihat pengiktirafan yang sepadan Akibatnya, apabila model boleh memperoleh kadar ketepatan yang lebih baik, model disambungkan kepada platform pengurusan dan kawalan buruk 5G, dan pengguna menghantar maklumat hujung ke hujung untuk penapisan. Semasa proses penapisan, jika maklumat buruk ditemui, ia akan dipintas tepat pada masanya, menjadikan pengurusan maklumat buruk 5G dan pemintasan sistem kawalan maklumat buruk lebih sistematik dan komprehensif.
Langkah-langkah khusus adalah seperti berikut:
5 Kelebihan sistem pemintasan 5G yang menggabungkan pembelajaran mendalam
<.>
Berbanding dengan sistem pemintasan 5G sedia ada, sistem pemintasan 5G yang menggabungkan pembelajaran mendalam mempunyai kelebihan berikut:Menggunakan teknologi pembelajaran mendalam menyediakan pengenalpastian berkesan dengan kebolehpercayaan dan keaslian yang tinggi;
Atas ialah kandungan terperinci Aplikasi teknologi pengecaman emosi teks berdasarkan pembelajaran mendalam dalam pengurusan keselamatan dan platform kawalan berita buruk 5G. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!