譯者| 崔皓
審校| 孫淑娟
機器學習被企業應用到不同的業務場景解決不同的業務問題,隨著機器學習的廣泛應用也讓組織在選擇學習方法時不堪重負。
許多組織在機器學習的應用上使用了進階和經典的學習方法。有大家熟悉的監督學習和無監督學習二分法,還有例如對比學習、強化學習和自我監督學習等機器學習的新興變體。
此外,還有涉及圖形分析、深度神經網路、分割、行為分析和其他技術。當面對大規模複雜業務問題時——例如加強反洗錢措施從而打擊金融犯罪——組織如何決定使用哪種機器學習的方法?
使用整合建模,讓這個問題變得不那麼重要了。這種機器學習方法使組織能夠利用各種模型並將它們與預測準確性結合起來,從而獲得最佳結果。
這種方法可幫助金融服務、詐欺偵測和網路安全中的高維度資料提供完整上下文。使用整合建模的組織表示「整合建模讓模型的建立更加多樣化“,Resistant AI執行長Martin Rehak 承認,「我們並不希望單一模型一枝獨秀。」
使用模型的多樣性使組織能夠用不同的演算法來評估業務問題的各個方面,以便採用完全知情的、一致的決策方法——這些方法是可以解釋的。
前面提到的整合建模的原理是毋庸置疑的,資料科學家無需花費大量時間來為業務案例設計完美的模型,只需要將那些不完美的模型組合起來產生預測能力。 「當你以整合方法看待機器學習時,你會從小型演算法中做出決策,」Rehak 指出。 「而且,在我們的案例中,這些演算法是針對每筆交易動態組合的,以便做出最佳決策。」 更重要的是,也許這些模型中的每一個都可以專注於某一個垂直領域,例如辨識洗錢事件。
例如,一種模型只專注於交易的規模。另一個模型專注於交易的位置。不同的模型可以檢查哪些特定參與者參與了交易。目標是「沒有出現任何峰值」的情況,Rehak 解釋說。 「模型的分佈非常平坦,與模型對應的證據頁相對較弱。透過結合許多弱證據元素,就能夠做出更強有力的決定。」 另一個好處是,透過經典的機器學習和更簡單的模型,將模型投入生產所需的訓練資料(和註釋)減少。這樣的模型比需要大量訓練資料的深度神經網路更容易解釋。
將 Rehak 所描述的分佈平坦的建模方式與其他整合建模技術區分開來是很重要的。最常見的整合建模範例涉及 bagging 或boosting(後者可能需要 Xtreme Gradient Boosting)。隨機森林是基於不同決策樹組合的提升範例。使用這種方法,「你可以根據集合中的先前版本一個一個地建立集合,」Rehak 評論道。儘管它是一種快速建立具有高預測準確性的模型方法,但它存在過度擬合的風險(由於訓練資料集太小,導致模型變得不太適用於生產資料)。
Rehak 的整合方法更適合 AML 用例,因為它是基於影響這些事件的上下文。 「如果您詢問洗錢專家交易是否惡意,他們首先是查看帳戶的歷史記錄以及該人過去的行為方式,」雷哈克說。透過他的方法,與地理位置、時間、相關方和金融機構等相關因素,使用單獨的機器學習模型進行檢查。只有將這些模型的每個結果組合在一起,人工智慧系統才能確定是否存在犯罪交易,透過這種做法的誤報會大幅減少。 「透過機器學習可以解釋大多數異常值,否則海量的異常值會淹沒反洗錢團隊,」雷哈克說。
在用例進行整合建模時,使用超過 60 個模型針對分析交易的不同方面進行建模是常見的事情。集成方法的即時結果非常適合這種應用場景。 「這 60 種演算法中的一種可以將所有內容分割成段,然後對每秒平均交易大小進行建模,」Rehak 透露。 「我們可以有數千個片段,這些片段都是同時動態更新的。」
由於將大量模型整合到集合中,每個模型都會評估交易的不同方面從而發現潛在的犯罪行為,除此之外再不能創建更全面的方法了。 Rehak 透露:「我們從多個角度看待你,以至於塑造你行為的同時讓你避免所有這些犯罪行為變得非常困難。」「因為,為了不被識別出來,「犯罪分子」需要避免的不止一個決策邊界,而是大量動態的決策邊界。這些演算法中的每個模型都是獨立學習的,然後我們將它們組合在一起。」
這些集合如何增強可解釋性以及所對應的許多方面。 首先,他們沒有過度依賴先進的機器學習,只包含簡單、更可解釋的演算法(涉及傳統機器學習)。這些模型成為評估交易犯罪的基石。 「當我們說某件事很重要時,我們可以告訴你原因,」雷哈克說。 「我們可以告訴你哪些指標表明了這一點。我們可以針對為每個發現寫一份報告,指出由於這些因素會造成交易犯罪的高風險。」 儘管每種演算法都專注於特徵,但並非所有演算法在模型中都具有相同的權重。一般而言,涉及圖形分析(擅長檢查關係)的演算法比其他模型具有更大的權重。
模型不僅可以解釋可疑的行為,也可以告訴你異常值出現的原因。 「通常我們在整合中有四到五個占主導地位的演算法,也就是說當我相信這是一個異常值時由於有演算法的支撐,其他人也會表示同意,」Rehak 指出。 「而且,我們有四、五個觸發因素,這保證了在某種程度上使結果更偏向於異常。」 由於單一模型僅評估交易中的一個因素,因此它們提供了分數的可解釋性和單字的可解釋性。 「因為我們知道集合,知道微分段,還知道交易量,我們可以輕鬆地在分數旁邊通過問題顯示這些信息,而交易量對一家公司的財務部門非常重要,」雷哈克補充道。
最終,整合建模的使用效果超過了任何一種應用程序,儘管它對 AML 活動有巨大的幫助。如果應用得當,該技術可以提高可解釋性,同時減少解決業務關鍵問題所需的訓練資料和註釋數量。
整合建模利用各種資料科學技術來解決多種業務問題,而不是將問題限制在一個或兩個。因此,這種整合解決問題的方法可能會成為AI 部署的典型代表。
崔皓,51CTO社群編輯,資深架構師,擁有18年的軟體開發與架構經驗,10年分散式架構經驗。曾任惠普技術專家。樂於分享,寫了許多熱門科技文章,閱讀量超過60萬。 《分散式架構原理與實務》作者。
原文標題:Machine Learning Model Management: Ensemble Modeling
#以上是機器學習之模型管理:整合建模的詳細內容。更多資訊請關注PHP中文網其他相關文章!