5월 25일 외신 보도에 따르면 최근 국내 연구진이 다크웹 데이터를 기반으로 학습한 대규모 언어 모델인 DarkBERT를 개발했습니다. 이 AI 모델은 사이버 보안 전문가가 다크 웹에서 사이버 위협에 대한 인텔리전스를 추출할 수 있도록 설계되었습니다.
DarkBERT는 다크 웹을 조사하여 데이터 침해 및 랜섬웨어를 포함한 잠재적인 사이버 보안 위협을 식별하고 표시합니다.
한국과학기술원(KAIST) 연구진은 데이터 인텔리전스 기관인 S2W와 협력하여 다크 웹의 데이터 세트에 대해 특별히 훈련된 생성 AI 언어 모델 DarkBERT를 개발했습니다.
ChatGPT 또는 Bard와 같은 챗봇과 달리 이 모델은 데이터 세트를 분석하고 특정 쿼리에 응답하기 위한 도구로 설계되었습니다. DarkBERT는 다크 웹을 데이터 세트로 사용하여 AI 도구가 이러한 환경에서 사용되는 언어를 더 잘 이해할 수 있는지 확인함으로써 사이버 보안 전문가와 법 집행 기관에 도움을 줄 수 있습니다.
다크 웹에서 사용되는 언어에 맞게 DarkBert를 최적화하기 위해 연구팀은 프록시 Tor 네트워크를 크롤링하여 대규모 데이터베이스를 만들었습니다. 연구팀은 또한 중복 제거, 데이터 필터링 및 전처리 기술을 사용하여 민감한 정보가 많이 포함되어 있는 다크 웹 콘텐츠와 관련된 윤리적 우려를 완화합니다.
모델은 16일 이내에 두 세트의 데이터를 입력합니다. 전처리된 데이터에는 피해자 조직 이름, 유출된 데이터 내용, 위협 진술, 불법 이미지 및 기타 정보가 포함됩니다.
다크웹 정보의 잠재적 위험으로 인해 DarkBert는 당분간 대중에게 공개되지 않습니다. 그러나 사용자는 이 AI 모델을 학문적 목적으로 사용하도록 요청할 수 있습니다.
위 내용은 DarkBERT: 다크 웹에서 탄생한 AI, 다크 웹을 기반으로 훈련된 세계 최초의 AI 모델의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!