數位經濟時代,數據作為新的生產要素和策略性資源,是科技進步、政策制定和經濟發展的重要動力。但是,只有在隱私和安全得到保障的前提下,資料的價值才能最大化。
近年來,隨著《網路安全法》《資料安全法》和《個人資訊保護法》的頒布與實施,國家、產業、地方相繼出台了一系列資料安全相關配套性政策文件,完善資料要素治理制度,保障資料流通交易安全。特別是 2022 年底發布的「資料二十條」,進一步推動了公共資料、企業資料、個人資料合規高效流通使用,資料「可用不可見」「可控可計量」成為法定要求。
在推動資料二十條理念落地的途徑中,隱私計算作為平衡資料流通與價值釋放的關鍵「技術解」,得到了越來越多的重視。在 2022 年 Gartner 技術成熟度曲線列出的 25 項值得關注的新興技術中,有 6 項與隱私運算相關,足見其價值與潛力。
圖片來源:gartner.com
今年1 月,工信部、國家網信辦、國家發改委等16 部門印發《關於促進資料安全產業發展的指導意見》,明確提出加強隱私計算、資料流轉分析等關鍵技術攻關,加強資料品質評估、隱私權計算等產品研發。
隱私運算產業也正在加速崛起。根據中國資訊通信研究院的報告指出,中國的隱私計算市場規模預計在2025年達到100億元。
隱私計算是隱私保護計算(Privacy-preserving Computation)的簡稱,它能夠在保證資料提供者不洩露原始資料的前提下,對資料進行分析、處理和使用,是一個廣義的概念,涉及人工智慧、資料科學等眾多學科和領域的交叉融合,涵蓋了安全多方計算、同態加密、差分隱私、零知識證明、聯邦學習、可信賴執行環境等眾多技術子項,以及這些技術子項的組合及相關產品方案。
安全多方計算(Secure Multi-Party Computation)
由圖靈獎得主姚期智院士於1982 年透過提出和解答「百萬富翁問題」而創立。安全多方計算能確保各參與方僅獲得正確計算結果,無法獲得除計算結果之外的任何信息,是多種密碼學基礎工具的綜合應用,除混淆電路、秘密分享、不經意傳輸等密碼學原理構造的經典多方安全計算協定外,其他所有用於實現多方安全計算的密碼學演算法(如同態加密、零知識證明),都可以構成多方安全計算協定。經過30 多年的理論研究,安全多方運算在技術上已趨成熟,在需要識別共同客戶或興趣但又要保護其他資料的場景下,例如醫療領域進行共同研究,或企業之間分享資料以提高業務效率,已發揮重要的應用價值。
機密運算(Confidential Computing)
#機密運算的基本原理是將需要保護的資料或程式碼存儲在可信任執行環境(Trusted Execution Environment,TEE)中,對這些資料和程式碼的任何存取都必須經過基於硬體的存取控制,防止其在使用中未經授權被存取或修改,從而實現對資料處理流程的可驗證與控制,增強資料的安全性。其中,可信任執行環境定義為可在資料機密性、資料完整性和程式碼完整性三方面提供一定保護等級的環境,也包括雲端環境。機密運算可追溯至 2002 年 ARM 推出 TrustZone 技術,2015 年Intel 推出 SGX 技術標誌著機密運算進入快速發展階段,如今 AMD、華為等廠商也推出了各自的機密運算技術。
#使用聯邦學習在多個行動裝置聯合訓練機器學習模型。圖片來源:Wikipedia
Federated Learning)
#################################聯邦學習由Google 在2016 年提出,其核心思想是允許兩個或多個參與者在資料不出域的情況下,協同完成模型的建構與使用,強調「資料不動模型動,數據可用不可見」,適用於參與用戶多、數據特徵多且分佈廣泛的聯合計算應用場景。根據參與計算的資料在資料方之間分佈的情況不同,可以分為橫向聯邦學習、縱向聯邦學習和聯邦遷移學習。通常情況下,聯邦學習需要與其他隱私保護技術聯合使用,才能在計算過程中實現對資料的保護。
目前,隱私運算正處於快速發展階段,單點技術持續最佳化,在實際應用中呈現出多技術融合的態勢,以因應不同場景下的資料安全和隱私保護需求。根據Gartner《2022 隱私技術成熟度曲線》報告,預計未來5-10 年隱私運算技術將被大規模商業化應用,到2025 年60% 以上的大型組織將在資料分析、商業智慧或雲端運算中使用一種或多種隱私計算技術。
隨著技術增益與商業落地場景逐步豐滿,大數據、人工智慧、區塊鏈、雲端服務等類型的企業紛紛入局隱私運算,各類玩家在積極推高技術滲透率與拓展應用邊界的過程中,一同構成中國隱私運算產業圖景。
其中,騰訊、螞蟻、阿里、百度、字節跳動等互聯網巨頭有強大的技術實力,龐大的用戶群與合作夥伴,坐擁海量高價值數據,是隱私計算入局者中不可忽視的力量。這些企業不僅能推動隱私運算技術加速發展,催生出新的產業機會與發展空間,也望重塑企業與使用者之間的關係,甚至影響產業力量對比與市場格局。
騰訊
# 騰訊早在2009 年便自主研發大數據處理平台,2015 年發布高效能運算框架Angel,支援10 億維度的演算法訓練和非結構化資料處理,廣泛用於微信支付、QQ、騰訊視訊等業務。為了更好地應對資料安全和隱私保護需求,騰訊積極探索隱私運算技術,在 2019 年組建了專門的研發團隊,並發力內部人才培養。 2021 年,騰訊第四代大數據平台「天工」發布,旨在以安全的形式打通資料孤島,打造安全、智慧、統一的新型資料基礎設施。其中,隱私運算作為核心技術,確保機器學習和大數據分析在各個場景中落地時調用資料的安全。
天工平台的核心產品Angel PowerFL 安全聯合運算平台,是騰訊聚焦隱私運算尖端技術領域的落地成果,目前已通過中國金融認證中心(CFCA)、中國信通院等權威組織機構評測,在金融、廣告、醫療、政務等場景落地,並取得了較好的應用效果。另一個核心產品騰訊雲端安全隱私運算平台,是基於聯邦學習、多方安全運算、區塊鏈、TEE 等安全技術的分散式運算平台,依托Angel PowerFL 能力支持,圍繞強安全、高效能、強穩定、易使用四大核心能力特性,使原始合作資料不出本地便可實現聯合建模、安全求交(PSI)、隱匿查詢、安全統計分析等功能,助力產品應用層全方位滿足行業需求與用戶的痛點,已實際應用於跨機構資料合作、銀行信貸、保險、政務、線上教育等多個場景。
騰訊Angel PowerFL 隱私運算團隊也是國內較早進行隱私運算與聯邦學習技術研究與應用的團隊,在大數據、分散式運算、分散式機器學習、分散式訊息中間件、多方安全計算、應用密碼學等領域都有豐富的研發和應用經驗,已發表近10 篇隱私計算研究論文,提交了60 多件隱私計算技術發明專利申請,有多個商用隱私計算和聯邦學習的平台產品目前已經透過騰訊雲對外開放。團隊連續三年獲得隱私運算產業內最具影響力的權威獎項,分別是2020 年iDASH 國際隱私運算競賽可信賴運算賽道冠軍、2021 年iDASH 聯邦學習賽道冠軍、2022 年iDASH 同態加密賽道冠軍。
目前,騰訊隱私運算匯集了來自騰訊大數據、騰訊安全、騰訊計費、騰訊雲、騰訊廣告AI,華中科技大學的密碼學、隱私計算、大數據和機器學習領域的技術專家。透過結合騰訊多元的科技能力,深度整合聯邦學習、安全多方運算、區塊鏈等技術,幫助客戶打破資料孤島,啟動資料使用的最大價值。未來將持續整合隱私運算與雲端 AI 安全技術,並與其他企業和機構合作,推動隱私運算更廣泛的落地。
螞蟻
#螞蟻集團從2016 年起佈局隱私計算,在技術研發、產品服務、生態共建等方面取得許多成果。螞蟻擁有業內第一的隱私計算專利數量,並提出了可信密態計算、受控匿名化等新的技術。產品與服務方面,開源可信任隱私運算框架隱語(SecretFlow),支援目前幾乎所有主流的隱私運算技術,並且積極支援互聯互通;開源可信任執行環境隱私運算作業系統Occlum,相容於Linux 環境的API,使現有應用幾乎不需改造即可運作於可信任執行環境,大幅降低TEE 應用開發門檻;商用方面,螞蟻隱私運算一體機,提供集軟硬體全端可信賴一體的系統平台,為組織機構之間的資料聯合運算提供一站式安全解決方案;大規模多方安全運算商用平台螞蟻鏈摩斯,是業界首家透過多方安全運算產品評測(信通院MPC 評測)和首批透過金標委MPC 評測的產品,截止2022 年2 月已服務150 餘家產業客戶。生態方面,螞蟻也積極推動國際國內的產業標準制定,是多項重要標準的領導機構。
阿里
#阿里集團在隱私運算領域廣泛涉足,旗下的阿里安全、阿里雲和達摩本院均進行相關研究。阿里安全的雙子座實驗室專注於同態加密、安全多方運算等方向,其研發技術已廣泛應用於阿里系業務,部分技術達到業界領先。阿里雲在2020 年首次發布基於晶片安全的可信任虛擬化實例,2021 年發布DataTrust 隱私增強運算平台,基於同態加密與可信任執行環境,在保障資料安全與隱私的同時支援多方資料協同分析與預測,不受資料規模或複雜性影響,是國內首個公有雲原生加密運算產品。達摩院在2022 年發布了FederatedScope 聯邦學習框架並開源,支持在豐富應用場景中進行大規模、高效率的聯邦學習異步訓練,能兼容PyTorch、Tensorflow 等不同設備運行環境,大幅降低了聯邦學習在科學研究與實際應用中的開發難度與成本。
百度
# 百度2012 發布《資料安全策略》,2018 年成立資料隱私保護委員會,目前隱私運算作為底層基礎技術,在百度智慧雲端、百度安全、百度超級鍊等平台上部署,並結合多種技術推出解決方案實現應用程式落地。百度智慧雲端也與區塊鏈平台融合,透過將區塊鏈技術納入雲端運算與隱私運算的過程,推動隱私運算在各種場景中落地。百度大腦旗下的大數據服務平台百度點石,基於聯邦學習、多方安全運算、可信任執行環境等主流隱私運算技術,安全且有效率地實現資料賦能,協助客戶提升資料價值。百度點石安全運算平台(MesaTEE)是百度安全在隱私運算面向企業落地的重要平台。基於百度飛槳開發的開源聯邦學習框架 PaddleFL,讓企業之間的合作能夠在資料層面安全地進行。 PaddleFL 提供多種聯邦學習策略及其在電腦視覺、自然語言處理、推薦演算法等領域的應用。
位元組跳動
位元組跳動在隱私運算領域佈局較為集中,最主要的產品是 Fedlearner 聯邦學習平台。該計畫於 2019 年啟動,最初是針對單一企業進行客製化適配,基於神經網路縱向聯邦學習技術,幫助企業提高廣告投放效率,後續透過迭代,逐步在電商、網路金融和教育領域落地。 2020 年,Fedlearner 開源,支援多類聯邦學習模式,整個系統包括控制台、訓練器、資料處理、資料儲存等模組,各模組對稱部署在參與聯邦的雙方集群上,透過代理互相通訊實現訓練。位元組跳動作為隱私計算聯盟(CCC)成員之一,也參與推動隱私計算市場的發展,影響技術和法規標準,協助提高下一代互聯網的計算信任度和安全性。
隨著資料安全合規流通成為必然,隱私運算作為當下實現資料「可用不可見」的唯一技術解,對未來的科技產業以及實體經濟的關鍵領域將產生重要影響。除了典型的金融、醫療等場景,隱私運算也被探索用於越來越多的產業與領域。
例如,電力公司透過隱私運算,可實現對電網資料的全生命週期進行保護,使得資料能夠安全上雲,或外包給運算服務方進行運算,實現電力企業的降本增效。廣告平台使用隱私運算對使用者資料進行加密,讓原始資料不可識別,從而在不揭示個人資訊的前提下完成廣告定向和個人化推薦,運用聯邦學習等技術,可以在不共享原始使用者資料的前提下多方共同訓練一個機器學習模型,還能在用戶終端內完成個人化推薦,確保推薦效果的同時最大限度地保護用戶隱私。未來,創新的隱私保護方案,包括用於行動裝置的可信任執行環境,能在行動個人化推薦服務中實現令人滿意的使用者體驗並保護使用者隱私,真正實現雙贏。出行領域,隱私計算使營運商與服務提供者可在加密狀態下使用線上數據,對城市交通狀況與出行需求進行分析與預測,為交通調度與新業務創新提供基礎,同時保護用戶隱私和數據安全。
我們已經看到,充分釋放數據的價值能夠推動革命性的創新,試想一個個比ChatGPT 更加智能的產品進入生活,了解我們的興趣與習慣,提供定制化服務,讓工作和生活變得前所未有的便利與個人化。在這個過程中,隱私運算將作為新技術應用中不可或缺的一部分,讓資料在創造價值的同時保持安全可控,守護人們對隱私保護的合理預期。
以上是為數據而生,為隱私而戰:隱私運算產業加速崛起的詳細內容。更多資訊請關注PHP中文網其他相關文章!