ホームページ > 記事 > テクノロジー周辺機器 > セキュリティのための機械学習は美しい嘘なのでしょうか?
翻訳者 | Bugatti
レビュアー | Sun Shujuan
機械学習 (ML) は魔法のテクノロジーではありません。一般に、ML は大規模なデータセットを使用して狭い問題を解決するのに適しており、対象のパターンは再現性または予測可能性が高くなります。ほとんどのセキュリティ問題は ML を必要とせず、ML による恩恵も受けません。 Google を含む多くの専門家は、複雑な問題を解決する場合、他のすべての方法を使い尽くした後にのみ ML を試行することを推奨しています。
ML は、幅広い統計手法を組み合わせたものです。ML を使用すると、事前に正しい答えがプログラムされていない場合でも、問題を解決するための答えを推定できるようにコンピューターをトレーニングできます。適切に設計された ML システムを使用して適切な種類の問題に対処すると、他の方法では入手できない洞察を明らかにできます。
各組織の IT 環境には、目的、アーキテクチャ、優先順位、リスク許容度が異なります。すべてのシナリオでセキュリティのユースケースを幅広くサポートするアルゴリズム、ML、またはその他の製品を作成することは不可能です。これが、セキュリティにおける ML の応用例のほとんどが複数のアプローチを組み合わせて非常に特殊な問題を解決する理由です。典型的な例には、スパム フィルター、DDoS またはボットの軽減、マルウェアの検出などがあります。
ML の最大の課題は、実際の問題を解決するために関連性のある使用可能なデータを用意することです。教師あり ML の場合は、適切にラベル付けされた大規模なデータセットが必要です。たとえば、猫の写真を認識するモデルを構築するには、「猫」というラベルが付けられた多くの猫の写真と、「非猫」というラベルが付けられた多くの猫以外の写真を使用してモデルをトレーニングする必要があります。十分な写真がなかったり、正確にラベルが付けられていなかったりすると、モデルはうまく仕上がりません。
セキュリティにおいて、教師あり ML のよく知られたユースケースは、シグネチャレスのマルウェア検出です。多くのエンドポイント保護プラットフォーム (EPP) ベンダーは、ML を使用して多数の悪意のあるサンプルと無害なサンプルにラベルを付け、「マルウェアがどのようなものであるか」についてモデルをトレーニングしています。これらのモデルは、回避型の変異型マルウェアやその他のごまかし (シグネチャ検出方法を回避できるように改ざんされているが、依然として悪意のあるファイル) を正確に識別できます。 ML は、特徴を照合する代わりに、別の特徴セットを使用して悪意のあるコンテンツを予測し、多くの場合、特徴ベースの方法では見逃すマルウェアを検出します。
ML モデルは確率的であるため、トレードオフが必要です。 ML は、署名メソッドが見逃したマルウェアを検出できますが、署名メソッドが見逃したマルウェアも見逃す可能性があります。そのため、最新の EPP ツールはハイブリッド アプローチを使用し、ML と機能ベースの技術を組み合わせて最大限の保護範囲を実現します。
モデルが慎重に設計されている場合でも、ML は出力を解釈する際に次のような追加の課題をもたらします。確率。 ML モデルの出力可能性。モデルが猫を識別するように設計されている場合、「これは 80% の確率で猫である」というような結果が得られます。この不確実性は ML システムに固有のものであり、結果の解釈が困難になる可能性があります。猫の確率が 80% という確率は十分に正確ですか?
ML は、「悪意のあるコンテンツ」が明確に定義され、範囲が狭い場合に検出できます。また、予測可能性の高いシステムにおいて、予期された動作からの逸脱を検出することもできます。環境が安定しているほど、ML が異常を正確に特定できる可能性が高くなります。ただし、すべての例外が悪意があるわけではなく、オペレーターが応答するための十分なコンテキストを常に持っているとは限りません。
ML の力は、既存のメソッド、システム、チームを置き換えるのではなく、最適なカバレッジと効率を達成するために強化することにあります。
元のリンク: https://www.darkreading.com/vulnerabilities-threats/the-Beautiful-lies-of-machine-learning-in-security
以上がセキュリティのための機械学習は美しい嘘なのでしょうか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。