聯邦學習是機器學習中一個非常火熱的領域,指多方在不傳遞資料的情況下共同訓練模型。隨著聯邦學習的發展,聯邦學習系統也層出不窮,例如 FATE, FedML, PaddleFL, TensorFlow-Federated 等等。然而,大部分聯邦學習系統不支持樹模型的聯邦學習訓練。相較於神經網絡,樹模型具有訓練快,可解釋性強,適合表格型資料的特性。樹模型在金融,醫療,網路等領域有廣泛的應用場景,例如用來做廣告推薦、股票預測等等。
決策樹的代表性模型為 Gradient Boosting Decision Tree (GBDT)。由於一棵樹的預測能力有限,GBDT 透過 boosting 的方法串列訓練多棵樹,透過每棵樹用來擬合當前預測值和標籤值的殘差的方式,最終達到一個好的預測效果。代表性的 GBDT 系統有 XGBoost, LightGBM, CatBoost, ThunderGBM,其中 XGBoost 多次被 KDD cup 的冠軍隊伍所使用。然而,這些系統都不支援聯邦學習場景下的 GBDT 訓練。近日,來自新加坡國立大學和清華大學的研究者提出了一種專注於訓練樹模式的聯邦學習新系統 FedTree。
- 論文網址:https://github.com/Xtra-Computing/FedTree/blob/main/FedTree_draft_paper. pdf
- 專案網址:https://github.com/Xtra-Computing/FedTree
##FedTree 系統介紹FedTree 架構圖如圖1 所示,共有5 個模組: 接口,環境,框架,隱私保護以及模型。
圖1: FedTree 系統架構圖
##介面:FedTree 支援兩種介面:命令列介面和Python 介面。使用者只需給定參數(參與者數量,聯邦場景等),就可以用一行命令來執行 FedTree 進行訓練。 FedTree 的 Python 介面和 scikit-learn 相容,可以呼叫 fit() 和 predict() 來進行訓練和預測。
環境:FedTree 支援在單機上模擬部署聯邦學習,和在多機上部署分散式聯邦學習。在單機環境上,FedTree 支援將資料進行劃分成多個子資料集,每個子資料集作為一個參與者進行訓練。在多機環境上,FedTree 支援將每個機器作為一個參與者,機器之間 透過 gRPC 進行通訊。同時,除了 CPU 以外,FedTree 支援使用 GPU 來加速訓練。
框架:FedTree 支援橫向和縱向聯邦學習場景下 GBDT 的訓練。在橫向場景下,不同參與者有著不同的訓練樣本和相同的特徵空間。在縱向場景下,不同參與者有著不同的特徵空間和相同的訓練樣本。為了確保效能,在這兩種情境下,多有參與方都共同參與每個節點的訓練。除此之外,FedTree 也支援整合學習,參與者並行地訓練樹之後再進行聚合,以此減少參與者之間的通訊開銷。
######隱私############:由於訓練過程中傳遞的梯度可能會洩露訓練資料的信息,FedTree 提供不同的隱私保護方法來進一步保護梯度訊息,包括同態加密(HE) 和安全聚合(SA)。同時,FedTree 提供了差分隱私來保護最終訓練得到的模型。 ##################模型############:以訓練一棵樹為基礎,FedTree 透過boosting/bagging 的方法支援訓練GBDT /random forest。透過設定不同的損失函數,FedTree 訓練得到的模型支援多種任務,包括分類和迴歸。 ######實驗表1 總結了不同系統在a9a, breast 和credit 上的AUC 和abalone 上的RMSE,FedTree 的模型效果和用所有資料訓練GBDT(XGBoost, ThunderGBM)以及FATE 中的SecureBoost (SBT) 幾乎一致。而且,隱私保護策略 SA 和 HE 並不會影響模型效能。
表1: 不同系統的模型效果比較
表2 總結了不同系統每棵樹的訓練時間(單位:秒),可以看到FedTree 相比於FATE 快了很多,在橫向聯邦學習場景下能達到100 倍以上的加速比。
表2: 不同系統每棵樹的訓練時間比較
更多研究細節請參考FedTree 論文原文。
#以上是專為決策樹打造,新加坡國立大學&清華大學聯合提出快速安全的聯邦學習新系統的詳細內容。更多資訊請關注PHP中文網其他相關文章!

用Microsoft Power BI圖來利用數據可視化的功能 在當今數據驅動的世界中,有效地將復雜信息傳達給非技術觀眾至關重要。 數據可視化橋接此差距,轉換原始數據i

專家系統:深入研究AI的決策能力 想像一下,從醫療診斷到財務計劃,都可以訪問任何事情的專家建議。 這就是人工智能專家系統的力量。 這些系統模仿Pro

首先,很明顯,這種情況正在迅速發生。各種公司都在談論AI目前撰寫的代碼的比例,並且這些代碼的比例正在迅速地增加。已經有很多工作流離失所

從數字營銷到社交媒體的所有創意領域,電影業都站在技術十字路口。隨著人工智能開始重塑視覺講故事的各個方面並改變娛樂的景觀

ISRO的免費AI/ML在線課程:通向地理空間技術創新的門戶 印度太空研究組織(ISRO)通過其印度遙感研究所(IIR)為學生和專業人士提供了絕佳的機會

本地搜索算法:綜合指南 規劃大規模活動需要有效的工作量分佈。 當傳統方法失敗時,本地搜索算法提供了強大的解決方案。 本文探討了爬山和模擬

該版本包括三種不同的型號,GPT-4.1,GPT-4.1 MINI和GPT-4.1 NANO,標誌著向大語言模型景觀內的特定任務優化邁進。這些模型並未立即替換諸如

Chip Giant Nvidia週一表示,它將開始製造AI超級計算機(可以處理大量數據並運行複雜算法的機器),完全是在美國首次在美國境內。這一消息是在特朗普總統SI之後發布的


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

DVWA
Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中

VSCode Windows 64位元 下載
微軟推出的免費、功能強大的一款IDE編輯器

SublimeText3 Linux新版
SublimeText3 Linux最新版

Atom編輯器mac版下載
最受歡迎的的開源編輯器

SublimeText3漢化版
中文版,非常好用