번역가 | Bugatti
리뷰어 | Sun Shujuan
머신러닝(ML)은 마법의 기술이 아닙니다. 일반적으로 ML은 대규모 데이터 세트의 좁은 문제를 해결하는 데 적합하며 관심 패턴은 반복 가능성이 높거나 예측 가능합니다. 대부분의 보안 문제에는 ML이 필요하지 않거나 ML이 도움이 되지 않습니다. Google을 포함한 많은 전문가들은 복잡한 문제를 해결할 때 다른 방법을 모두 사용한 후에만 ML을 시도해야 한다고 권장합니다.
ML은 광범위한 통계 기법을 결합합니다. ML을 사용하면 사전에 정답이 프로그래밍되어 있지 않더라도 문제에 대한 답을 추정하도록 컴퓨터를 훈련시킬 수 있습니다. 잘 설계된 ML 시스템을 사용하여 올바른 유형의 문제를 해결하면 다른 방법으로는 얻을 수 없는 통찰력을 얻을 수 있습니다.
모든 조직의 IT 환경에는 목적, 아키텍처, 우선순위 및 위험 허용 범위가 다릅니다. 모든 시나리오에서 보안 사용 사례를 광범위하게 지원하는 알고리즘, ML 또는 기타 제품을 만드는 것은 불가능합니다. 이것이 바로 보안 분야에서 ML을 성공적으로 적용한 대부분이 매우 특정한 문제를 해결하기 위해 여러 접근 방식을 결합하는 이유입니다. 일반적인 예로는 스팸 필터, DDoS 또는 봇 완화, 맬웨어 탐지 등이 있습니다.
ML의 가장 큰 과제는 실제 문제를 해결하는 데 관련 있고 유용한 데이터를 확보하는 것입니다. 지도 ML의 경우 적절하게 레이블이 지정된 대규모 데이터 세트가 필요합니다. 예를 들어 고양이 사진을 인식하는 모델을 구축하려면 '고양이'라는 라벨이 붙은 많은 고양이 사진과 '고양이 아님'이라는 라벨이 붙은 고양이가 아닌 사진 여러 개로 모델을 훈련해야 합니다. 사진이 부족하거나 라벨이 정확하게 지정되지 않으면 모델이 잘 나오지 않습니다.
보안 분야에서 잘 알려진 지도 ML 사용 사례는 시그니처 없는 악성 코드 탐지입니다. 많은 EPP(엔드포인트 보호 플랫폼) 공급업체는 ML을 사용하여 다수의 악성 및 양성 샘플에 라벨을 지정하고 "맬웨어의 형태"에 대한 모델을 교육합니다. 이러한 모델은 회피적인 돌연변이 악성 코드 및 기타 속임수(시그니처 탐지 방법을 회피할 수 있도록 변조되었지만 여전히 악성인 파일)를 올바르게 식별할 수 있습니다. 기능을 일치시키는 대신 ML은 다른 기능 세트를 사용하여 악성 콘텐츠를 예측하고 기능 기반 방법이 놓친 악성 코드를 포착하는 경우가 많습니다.
ML 모델은 확률적이므로 장단점이 있습니다. ML은 서명 방법으로 놓친 악성 코드를 포착할 수 있지만 서명 방법으로 놓친 악성 코드도 포착할 수 있습니다. 이것이 바로 최신 EPP 도구가 ML과 기능 기반 기술을 결합하여 최대 보호 범위를 달성하는 하이브리드 접근 방식을 사용하는 이유입니다.
모델이 잘 설계되었더라도 ML은 출력을 해석할 때 다음을 포함하여 몇 가지 추가적인 문제를 야기합니다.
에 대한 다른 이름이 아름답게 들리나요?
ML의 장단점 외에도 주목해야 할 사항이 하나 더 있습니다. 모든 "ML"이 실제로 ML인 것은 아닙니다. 통계적 방법은 데이터에 대한 몇 가지 결론을 제공할 수 있습니다. ML은 보유하고 있는 데이터와 보유하지 않은 데이터를 기반으로 예측을 수행합니다. 마케터들은 "ML"과 "인공 지능"이 일종의 현대적이고 혁신적이며 진보된 기술 제품이라고 주장하면서 이러한 인기를 활용하고 싶어합니다. 그러나 사람들은 ML이 올바른 접근 방식인지는 고사하고 이 기술이 ML을 사용하는지 여부에 대해 거의 생각하지 않는 경우가 많습니다.
ML은 '악성 콘텐츠'가 잘 정의되어 있고 범위가 좁은 경우를 감지할 수 있습니다. 또한 예측 가능성이 높은 시스템에서 예상되는 동작과의 편차를 감지할 수도 있습니다. 환경이 안정적일수록 ML이 이상치를 정확하게 식별할 가능성이 높아집니다. 그러나 모든 예외가 악의적인 것은 아니며 운영자가 항상 대응할 수 있는 충분한 컨텍스트를 갖고 있는 것은 아닙니다.
ML의 힘은 최적의 적용 범위와 효율성을 달성하기 위해 기존 방법, 시스템 및 팀을 대체하는 것이 아니라 강화하는 데 있습니다.
원본 링크: https://www.darkreading.com/vulnerabilities-threats/the-beautiful-lies-of-machine-learning-in-security
위 내용은 보안을 위한 머신러닝은 아름다운 거짓말인가요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!