Rumah >Peranti teknologi >AI >Aplikasi teknologi pengecaman emosi teks berdasarkan pembelajaran mendalam dalam pengurusan keselamatan dan platform kawalan berita buruk 5G

Aplikasi teknologi pengecaman emosi teks berdasarkan pembelajaran mendalam dalam pengurusan keselamatan dan platform kawalan berita buruk 5G

王林
王林ke hadapan
2023-04-09 16:41:061667semak imbas

Pengarang| Sun Yue, Unit: China Mobile (Hangzhou) Information Technology Co., Ltd. | China Mobile Hangzhou R&D Center

Pengenalan Makmal

Dengan pembangunan rangkaian 5G Memandangkan ia terus mendapat populariti, sebilangan besar pengguna mula berhubung dan menggunakan rangkaian 5G. Rangkaian 5G bukan sahaja boleh menghantar suara, video, teks dan maklumat lain rangkaian tradisional, tetapi juga boleh digunakan dalam senario aplikasi yang lebih praktikal dengan kependaman yang lebih rendah dan keupayaan kedudukan ketepatan tinggi, seperti: maklumat medan perang secara langsung, Penentududukan satelit, navigasi, dll.

Maklumat dalam talian sering dicampur dengan maklumat yang tidak baik, seperti maklumat berkaitan politik, maklumat lucah dan maklumat berkaitan hitam , maklumat penipuan, maklumat pengiklanan komersial, dsb., dan bilangan maklumat buruk semakin meningkat dari tahun ke tahun, menyebabkan gangguan besar kepada pengguna. Untuk membersihkan persekitaran rangkaian dan mengawal penyebaran maklumat buruk secara berkesan, platform kawalan keselamatan dan kawalan keselamatan berita buruk 5G China Mobile telah wujud.

Aplikasi teknologi pengecaman emosi teks berdasarkan pembelajaran mendalam dalam pengurusan keselamatan dan platform kawalan berita buruk 5G

Sumber data: Pusat Keselamatan Maklumat Kumpulan Mudah Alih China

1. Senario aplikasi platform pengurusan dan kawalan maklumat 5G yang buruk

Apabila menghadapi persekitaran maklumat rangkaian yang kompleks, ini platform Seperti mesej teks, mesej suara, mesej video, mesej media kaya, dsb., mengklasifikasikan mesej kepada: berkaitan politik, pornografi, berkaitan kumpulan, berkaitan penipuan, mesej pengiklanan komersial, mesej biasa, dsb., dan kemudian memintas mereka tepat pada masanya melalui strategi yang sepadan dan hukuman susulan akan dijalankan mengikut keterukan berita buruk, untuk membersihkan persekitaran rangkaian daripada punca utama dan mewujudkan ruang rangkaian yang baik.

Aplikasi teknologi pengecaman emosi teks berdasarkan pembelajaran mendalam dalam pengurusan keselamatan dan platform kawalan berita buruk 5G

2. Teknologi pengurusan dan kawalan maklumat buruk 5G sedia ada platform Perkara Utama

Platform ini terutamanya memintas maklumat buruk melalui kaedah berikut:

①Tetapkan kata kunci peringkat pertama: Kata kunci peringkat pertama biasanya ditetapkan kepada beberapa perkataan yang sangat sensitif Jika pengguna menghantar mesej yang mengandungi kandungan kata kunci peringkat pertama, mesej itu akan dipintas serta-merta, kandungan maklumat tidak boleh dihantar, dan pengguna ditanda.

②Tetapkan kata kunci biasa: Kata kunci biasa ditetapkan kepada beberapa perkataan yang lebih sensitif Jika pengguna menghantar mesej yang mengandungi kandungan kata kunci biasa, dan dalam tempoh tertentu masa Dalam tempoh masa tertentu, jika bilangan kali pengguna menghantar mesej sensitif melebihi ambang pemintasan pratetap sistem, sistem akan menarik pengguna ke dalam senarai hitam, dan dalam tempoh masa tertentu, pengguna tidak akan dapat untuk menggunakan perkhidmatan rangkaian 5G penuh.

③Tetapkan pemantauan maklumat teks kompleks: Jika pengguna menghantar fail PDF, yang mengandungi teks dan gambar, teks dalam fail akan diekstrak dan ditapis Kata kunci lanjutan dan mekanisme kata kunci biasa, dan gambar ditapis oleh mekanisme media kaya mengikut hasil penapisan teks dan gambar masing-masing, prinsip pemprosesan berat diterima pakai sebagai hasil pemprosesan fail.

3 Kelemahan teknikal platform pengurusan dan kawalan lemah 5G sedia ada

<.>

Mekanisme penapisan platform kawalan keselamatan berita buruk 5G sedia ada hanya boleh menapis frasa dan ayat pendek yang ditentukan dan terhad Dengan populariti Internet, perkataan baharu akan muncul dalam jumlah yang besar setiap hari , dan hanya penambahan manual diperlukan, anda tidak boleh mengemas kini perpustakaan perbendaharaan kata dengan cara yang tepat pada masanya dan pantas. Lebih-lebih lagi, apabila sebilangan besar pengguna hari ini menghantar mesej teks, walaupun keseluruhan mesej teks tidak mengandungi perkataan yang menyalahi undang-undang, fikiran dan emosi yang diluahkan mungkin mengandungi sejumlah besar kecenderungan emosi negatif Kata-kata dan ayat pendek sahaja tidak boleh berjaya memintas kandungan emosi negatif . Oleh itu, menggunakan analisis sentimen teks untuk mengemukakan ayat yang kaya dengan kecenderungan emosi negatif untuk semakan dan pemintasan boleh mengukuhkan lagi kesan kawalan maklumat yang tidak baik dan mengurangkan hakisan dan keracunan pengguna oleh maklumat spam.

Dengan menubuhkan perpustakaan emosi teks yang mengandungi frasa Internet dan mesej berita yang popular, emosi yang kaya dengan teks dibahagikan kepada tiga kategori: emosi positif, emosi neutral dan emosi negatif, dan Tambah label yang sepadan dengan setiap teks mengikut tiga kategori ini, dan gunakan rangkaian pembelajaran mendalam untuk melatih teks dalam perpustakaan emosi Model terlatih boleh digunakan dalam platform pengurusan dan kawalan berita buruk 5G untuk memintas mesej emosi yang buruk.

4. Butiran pelaksanaan teknikal bagi sistem pengurusan dan kawalan buruk 5G berdasarkan pembelajaran mendalam

Teknologi ini mengandungi tiga subjek utama: sistem pembahagian perkataan jieba, vektorisasi frasa dan algoritma pengecaman emosi teks Interaksi antara setiap subjek adalah seperti berikut:

Aplikasi teknologi pengecaman emosi teks berdasarkan pembelajaran mendalam dalam pengurusan keselamatan dan platform kawalan berita buruk 5G

Carta alir interaksi setiap modul

Gunakan teknologi perangkak untuk merangkak perkataan Internet dan mesej berita sebagai teks asal, dan bahagikan teks asal kepada set latihan dan set ujian dalam nisbah 8:2, labelkan maklumat teks dalam set latihan, dan kemudian bahagikan teks dalam set ujian Maklumat dibahagikan melalui alat pembahagian perkataan jieba, contohnya: Dia datang ke Bangunan Hangyan Mudah Alih. Selepas pembahagian perkataan melalui alat pembahagian perkataan jieba, hasilnya ialah: dia/datang/pindah/Hangyan/bangunan, dan akhirnya data selepas pembahagian perkataan disusun menjadi korpus. Oleh kerana jumlah maklumat teks dalam set latihan dan set ujian adalah sangat besar (biasanya berjuta-juta data), jumlah data dalam korpus segmentasi pasca perkataan juga akan menjadi sangat besar (berpuluh juta data). Walaupun korpora ini boleh disimpan dalam bentuk bernombor dalam korpus, disebabkan jumlah data yang besar, ia adalah mudah untuk mengalami bencana dimensi. Oleh itu, untuk zarah modal yang muncul dalam maklumat teks, seperti: "le", "的", "我", dsb., walaupun perkataan ini muncul sangat kerap, ia mempunyai sedikit sumbangan kepada kesan emosi, jadi kami akan memilih untuk menghapuskan perkataan ini daripada Frasa korpus untuk mencapai tujuan mengurangkan dimensi.

Kami menghantar frasa vektor dalam set latihan ke rangkaian pembelajaran mendalam untuk pembelajaran dan latihan, mendapatkan model yang sepadan dan akhirnya meletakkan data dalam set ujian ke dalam model untuk dilihat pengiktirafan yang sepadan Akibatnya, apabila model boleh memperoleh kadar ketepatan yang lebih baik, model disambungkan kepada platform pengurusan dan kawalan buruk 5G, dan pengguna menghantar maklumat hujung ke hujung untuk penapisan. Semasa proses penapisan, jika maklumat buruk ditemui, ia akan dipintas tepat pada masanya, menjadikan pengurusan maklumat buruk 5G dan pemintasan sistem kawalan maklumat buruk lebih sistematik dan komprehensif.

Aplikasi teknologi pengecaman emosi teks berdasarkan pembelajaran mendalam dalam pengurusan keselamatan dan platform kawalan berita buruk 5G

Langkah-langkah khusus adalah seperti berikut:

  1. Rangkai korpus teks asal daripada Internet dan praproses teks asal, termasuk: mengalih keluar zarah modal, memadam tanda baca dan kawasan kosong yang muncul dalam teks, memadam penamat, perkataan jarang dan perkataan khusus yang muncul dalam teks ; gunakan Pustaka jieba melakukan pembahagian perkataan dan memotong ayat teks dengan tepat ke dalam frasa berasingan; menjadi: emosi positif, emosi negatif, dan emosi neutral. Dan gunakan perpustakaan jieba untuk membahagikan ayat teks dalam set latihan dan set ujian masing-masing, dan membina set latihan yang dibahagikan kepada korpus
  2. vektorkan frasa dalam langkah 1, supaya setiap pembahagian dipetakan menjadi satu; vektor bernilai berterusan berbilang dimensi untuk mendapatkan matriks vektor perkataan bagi keseluruhan set data.
  3. Kurangkan kerumitan ayat dengan mengekstrak klausa di mana perkataan emosi berada, dan kemudian meramalkan kedudukan objek emosi dalam klausa berdasarkan pelbagai ciri, dan kemudian mengeluarkan emosi dari kedudukan yang sepadan . Pengekstrakan emosi adalah untuk mendapatkan maklumat emosi yang berharga dalam teks dan menentukan peranan yang dimainkan oleh perkataan atau frasa dalam ekspresi emosi, termasuk tugas seperti pengenalpastian pengungkap emosi, pengenalpastian objek penilaian, dan pengenalan perkataan sudut pandangan emosi.
  4. Dapatkan model pengecaman emosi teks dengan menghantar vektor emosi yang diperolehi oleh operasi di atas ke dalam rangkaian pembelajaran mendalam, kemudian hantar vektor emosi dalam set ujian ke dalam model, semak keputusan ujian, dan teruskan dengan data dengan hasil pengesanan biasa Lakukan penapisan dasar biasa, seperti pemadanan teks, pengecaman media kaya, dsb.

5 Kelebihan sistem pemintasan 5G yang menggabungkan pembelajaran mendalam

<.>

Berbanding dengan sistem pemintasan 5G sedia ada, sistem pemintasan 5G yang menggabungkan pembelajaran mendalam mempunyai kelebihan berikut:

Menggunakan teknologi pembelajaran mendalam menyediakan pengenalpastian berkesan dengan kebolehpercayaan dan keaslian yang tinggi;

    Menggunakan teknologi pembelajaran mendalam untuk pengecaman emosi, dengan kurang campur tangan manual dan kecekapan kerja yang tinggi
  • Menggunakan pengecaman emosi teks, ia boleh menambah kekurangan utama perkataan; pemintasan;
  • Menggunakan pengecaman emosi teks, strategi boleh dikemas kini secara automatik dan ditambah dengan maklumat kemasukan baharu tepat pada masanya untuk meningkatkan kecekapan.
Tulis pada akhir:

Pada masa ini, bidang aplikasi pembelajaran mendalam sangat luas, bergantung pada latihan berulangnya dan kaedah pembelajaran kendiri Ia boleh mengurangkan beban kerja manual dan meningkatkan kecekapan dan ketepatan. Ia bukan sahaja sesuai untuk sistem pemintasan maklumat buruk yang disebutkan di atas, saya percaya bahawa dalam masa terdekat, teknologi ini juga akan bersinar dalam bidang baru muncul yang lain. Sudah tentu, pembelajaran mendalam itu sendiri tidak sempurna dan tidak dapat menyelesaikan semua masalah yang berduri. Oleh sebab itu, kita harus terus melabur teknologi pembelajaran mendalam dalam senario baharu dan bidang baharu untuk mencapai kejayaan baharu dan mencipta kehidupan pintar masa depan yang lebih baik.

Atas ialah kandungan terperinci Aplikasi teknologi pengecaman emosi teks berdasarkan pembelajaran mendalam dalam pengurusan keselamatan dan platform kawalan berita buruk 5G. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:51cto.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam