深層学習に基づくテキスト感情認識技術の5Gバッドニュースセキュリティ管理および制御プラットフォームへの応用
著者 | Sun Yue、部署: China Mobile (Hangzhou) Information Technology Co., Ltd. | China Mobile Hangzhou R&D Center
ラボ紹介
5G ネットワークの発展 普及が進むにつれて、多くのユーザーが 5G ネットワークに接触し、使用し始めています。 5G ネットワークは、従来のネットワークの音声、ビデオ、テキスト、その他の情報を送信できるだけでなく、戦場のライブ情報、衛星測位、ナビゲーション、等
# インターネット情報には、政治関連の情報、ポルノ情報、暴力団関連情報、詐欺情報、商業広告情報等、悪質な情報は年々増加しており、利用者に多大な嫌がらせを与えています。ネットワーク環境を浄化し、悪い情報の拡散を効果的に制御するために、チャイナモバイルの 5G 悪いニュースセキュリティ管理および制御プラットフォームが誕生しました。#データ ソース: 中国移動グループ情報セキュリティ センター
##複雑なネットワーク情報環境に直面した場合、このプラットフォームはテキスト メッセージ、音声メッセージ、ビデオ メッセージ、リッチ メディア メッセージなどを、政治関連、ポルノ、ギャング関連、詐欺関連、商業広告メッセージ、通常のメッセージなどに分類して傍受します。対応する戦略を通じてタイムリーに報復し、悪いニュースの重大度に応じてフォローアップの懲罰を実行し、ネットワーク環境を根本から浄化し、良好なネットワーク空間を作成します。
#2. 既存の 5G 不良情報管理および制御プラットフォーム技術重要なポイント
##プラットフォームは主に次の方法で悪質な情報を傍受します。
#①第 1 レベルのキーワードを設定する: 第 1 レベルのキーワードは通常、非常に機密性の高い単語に設定されます。ユーザーが第 1 レベルのキーワードの内容を含むメッセージを送信すると、メッセージはすぐに傍受されます。情報コンテンツは配信できず、ユーザーはマークされます。
② 共通キーワードの設定: 共通キーワードは、ユーザーが一定期間内に共通キーワードの内容を含むメッセージを送信した場合、よりセンシティブな単語に設定されます。一定期間内に、ユーザーが機密メッセージを送信した回数がシステムの事前設定された傍受しきい値を超えた場合、システムはユーザーをブラックリストに組み込み、一定期間内にユーザーはブラックリストに登録されなくなります。完全な5Gネットワークサービスを利用できるようになります。
#複雑なテキスト情報の監視を設定する: ユーザーがテキストと画像を含む PDF ファイルを送信した場合、ファイル内のテキストを抽出してフィルタリングします。高度なキーワードと通常のキーワードメカニズム、画像はリッチメディアメカニズムによってフィルタリングされ、テキストと画像のそれぞれのフィルタリング結果に従って、ファイルの処理結果として重い処理の原則が採用されます。
#3. 既存の 5G の悪い管理および制御プラットフォームの技術的弱点
既存の 5G 悪いニュースセキュリティ制御プラットフォームのフィルタリングメカニズムでは、指定された限られたフレーズや短い文章のみをフィルタリングできます。インターネットの普及に伴い、新しい単語が毎日大量に出現します。 、手動での追加のみが必要です。語彙に関しては、語彙ライブラリをタイムリーかつ迅速に更新することができなくなりました。さらに、今日多くのユーザーがテキスト メッセージを送信する場合、テキスト メッセージ全体に違法な単語が含まれていないとしても、表現される思考や感情には多くの否定的な感情的傾向が含まれる可能性があり、単語や短い文章だけでは否定的な感情的な内容をうまく遮断することはできません。 。したがって、テキスト感情分析を使用して、否定的な感情傾向に富んだ文章をレビューおよび傍受のために送信すると、悪い情報制御の効果をさらに強化し、スパム情報によるユーザーの浸食と汚染を軽減できます。 人気のインターネット フレーズやニュース メッセージを含むテキスト感情ライブラリを確立することにより、テキストに豊富に含まれる感情が、ポジティブな感情、ニュートラルな感情、ネガティブな感情の 3 つのカテゴリに分類されます。これら 3 つのカテゴリに従って各テキストに対応するラベルを作成し、深層学習ネットワークを使用して感情ライブラリ内のテキストをトレーニングします。トレーニングされたモデルは、5G の悪いニュース管理および制御プラットフォームで使用して、悪い感情的なメッセージを傍受できます。
##4. 深層学習に基づく 5G 欠陥管理および制御システムの技術実装の詳細
このテクノロジーには、jieba 単語分割システム、フレーズ ベクトル化、およびテキスト感情認識アルゴリズムという 3 つの主要な主題が含まれており、各主題間の相互作用は次のとおりです。
各モジュールの対話フローチャートクローラー技術を使用して、インターネット上の単語やニュースメッセージを原文としてクロールし、原文をトレーニングセットとテストセットに8:2の比率で分割し、トレーニングセット内のテキスト情報にラベルを付けて分割します。テスト セット内のテキスト。情報は jieba 単語分割ツールによって分割されます。例: 彼はモバイル ハンヤン ビルに来ました。 jieba 単語分割ツールによる単語分割後の結果は、彼/来た/移動/ハンヤン/建物となり、最終的に単語分割後のデータがコーパスに編成されました。トレーニング セットとテスト セット内のテキスト情報の量は非常に多いため (通常は数百万のデータ)、ポストワード セグメンテーション コーパス内のデータの量も非常に多くなります (数千万のデータ)。これらのコーパスは番号を付けてコーパスに保存できますが、データ量が膨大であるため、次元の災難に見舞われやすくなります。したがって、テキスト情報に出現する助詞「レ」、「的」、「我」などについては、出現頻度は高いものの、感情への寄与が少ないため、次元を削減するという目的を達成するために、コーパス フレーズからこれらの単語を削除します。
トレーニング セット内のベクトル化されたフレーズを学習とトレーニングのために深層学習ネットワークに送信し、対応するモデルを取得し、最後にテスト セット内のデータをモデルに入力して表示します。その結果、モデルがより高い精度を得ることができた場合、モデルは 5G 不良管理および制御プラットフォームに接続され、ユーザーはフィルタリングのためにエンドツーエンドの情報を送信します。フィルタリングプロセス中に悪い情報が見つかった場合、その情報は適時に傍受されるため、5Gの不正情報管理および制御システムによる悪い情報の傍受がより体系的かつ包括的になります。
#具体的な手順は次のとおりです。
- ## インターネットから元のテキスト コーパスをクロールし、モーダル助詞の削除、テキスト内に出現する句読点と空白領域の削除、ターミネータ、まばらな単語、テキスト内に出現する特定の単語の削除など、元のテキストを前処理します。 jieba ライブラリは単語の分割を実行し、テキスト文を個別のフレーズに正確に切り出します。
- クロールされたテキスト データ セットを特定の割合に従ってトレーニング セットとテスト セットに分割します。テキスト文は手動で注釈が付けられ、次のように分割されます。 : ポジティブな感情、ネガティブな感情、ニュートラルな感情。そして、jieba ライブラリを使用して、トレーニング セットとテスト セットのテキスト文をそれぞれセグメント化し、セグメント化されたトレーニング セットをコーパスに構築します。
- ステップ 1 でフレーズをベクトル化し、各セグメント化が次のようにマッピングされます。データセット全体のワードベクトル行列を取得するための多次元連続値ベクトル。
- まず感情語が含まれる文節を抽出することで文の複雑さを軽減し、その後さまざまな特徴に基づいて文節内で感情対象の位置を予測し、感情を抽出します対応する位置から。感情抽出とは、テキスト内の貴重な感情情報を取得し、感情表現において単語やフレーズが果たす役割を判断することであり、感情表現者の特定、評価対象の特定、感情的な観点の単語の特定などのタスクが含まれます。
- 上記の操作で取得した感情ベクトルを深層学習ネットワークに送信してテキスト感情認識モデルを取得し、次にテスト セット内の感情ベクトルをモデルに送信し、テスト結果を確認して、次の手順を続行します。正常な検出結果を持つデータ、テキスト マッチング、リッチ メディア認識などの定期的なポリシー フィルタリングを実行します。
- は感情認識に深層学習テクノロジーを使用しており、手動介入が少なく、高い作業効率を実現します。
- はテキスト感情認識を使用して重要な点を効果的に補います。単語インターセプトの割合;
- テキスト感情認識を使用すると、戦略を自動的に更新し、タイムリーに新しいエントリ情報を補足して、効率を向上させることができます。
最後に書いてください:
現在、深層学習の応用分野は、繰り返しの学習に依存して非常に広範囲に広がっています。手動の作業負荷を大幅に軽減し、効率と精度を向上させることができます。前述の悪質な情報傍受システムに適しているだけでなく、近い将来、他の新興分野でもこの技術が活躍すると信じています。もちろん、ディープラーニング自体は完璧ではなく、すべての厄介な問題を解決できるわけではありません。このため、新たなブレークスルーを達成し、より良い未来のスマートライフを生み出すために、私たちはディープラーニングテクノロジーを新たなシナリオや新たな分野に投資し続ける必要があります。
以上が深層学習に基づくテキスト感情認識技術の5Gバッドニュースセキュリティ管理および制御プラットフォームへの応用の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

オンデバイスAIの力を活用:個人的なチャットボットCLIの構築 最近では、個人的なAIアシスタントの概念はサイエンスフィクションのように見えました。 ハイテク愛好家のアレックスを想像して、賢くて地元のAI仲間を夢見ています。

AI4MHの最初の発売は2025年4月15日に開催され、有名な精神科医および神経科学者であるLuminary Dr. Tom Insel博士がキックオフスピーカーを務めました。 Insel博士は、メンタルヘルス研究とテクノでの彼の傑出した仕事で有名です

「私たちは、WNBAが、すべての人、プレイヤー、ファン、企業パートナーが安全であり、大切になり、力を与えられたスペースであることを保証したいと考えています」とエンゲルバートは述べ、女性のスポーツの最も有害な課題の1つになったものに取り組んでいます。 アノ

導入 Pythonは、特にデータサイエンスと生成AIにおいて、プログラミング言語として優れています。 大規模なデータセットを処理する場合、効率的なデータ操作(ストレージ、管理、アクセス)が重要です。 以前に数字とstをカバーしてきました

潜る前に、重要な注意事項:AIパフォーマンスは非決定論的であり、非常にユースケース固有です。簡単に言えば、走行距離は異なる場合があります。この(または他の)記事を最終的な単語として撮影しないでください。これらのモデルを独自のシナリオでテストしないでください

傑出したAI/MLポートフォリオの構築:初心者と専門家向けガイド 説得力のあるポートフォリオを作成することは、人工知能(AI)と機械学習(ML)で役割を確保するために重要です。 このガイドは、ポートフォリオを構築するためのアドバイスを提供します

結果?燃え尽き症候群、非効率性、および検出とアクションの間の隙間が拡大します。これは、サイバーセキュリティで働く人にとってはショックとしてはありません。 しかし、エージェントAIの約束は潜在的なターニングポイントとして浮上しています。この新しいクラス

即時の影響と長期パートナーシップ? 2週間前、Openaiは強力な短期オファーで前進し、2025年5月末までに米国およびカナダの大学生にChatGpt Plusに無料でアクセスできます。このツールにはGPT ‑ 4o、Aが含まれます。


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

SublimeText3 Linux 新バージョン
SublimeText3 Linux 最新バージョン

EditPlus 中国語クラック版
サイズが小さく、構文の強調表示、コード プロンプト機能はサポートされていません

PhpStorm Mac バージョン
最新(2018.2.1)のプロフェッショナル向けPHP統合開発ツール

MinGW - Minimalist GNU for Windows
このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポート ライブラリとヘッダー ファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。

ZendStudio 13.5.1 Mac
強力な PHP 統合開発環境
