5月25日 根據外媒報導,韓國研究人員最近開發了一種基於暗網資料訓練的大型語言模型DarkBERT。這個AI模型旨在幫助網路安全專業人員從暗網提取有關網路威脅的情報。
DarkBERT可以研究暗網,以識別和標記潛在的網路安全威脅,包括資料外洩和勒索軟體。
韓國科學技術院(KAIST)的研究人員與資料情報機構S2W合作,開發出生成式AI語言模型DarkBERT,該模型專門針對來自暗網的資料集進行訓練。
不同於像ChatGPT或Bard這樣的聊天機器人,該模型是被設計成一種工具,用於分析資料集並回答特定的查詢。 DarkBERT可以驗證使用暗網作為資料集是否能讓AI工具更能理解這些環境中使用的語言,從而可以為網路安全專業人員和執法部門提供協助。
為了優化DarkBert適應暗網上使用的語言,研究小組透過爬行代理Tor網路創建了一個大型資料庫。研究團隊還採用重複資料刪除、資料過濾和預處理技術,以減輕與暗網內容相關的道德擔憂,而暗網內容通常包含大量敏感資訊。
該模型在16天內輸入了兩組數據,其中預處理的數據包括受害組織的名稱、洩露數據的詳細資訊、威脅聲明、非法圖像等資訊。
鑑於暗網資訊的潛在風險,DarkBert暫時不會對外開放。然而,使用者可以提出將這個AI模型用於學術目的的請求。
以上是DarkBERT:誕生自暗網的AI,全球首個基於暗網訓練的AI模型的詳細內容。更多資訊請關注PHP中文網其他相關文章!