為什麼人工智慧設計必須優先考慮資料隱私-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

為什麼人工智慧設計必須優先考慮資料隱私

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 12, 2023 pm 09:13 PM

人工智慧數據演算法

人工智慧是醫療保健、技術和其他領域發展不可或缺的一部分，但人們對如何監管資料隱私感到擔憂。
資料隱私對於獲得大眾對技術進步的信任至關重要。

資料隱私通常與基於消費者資料的人工智慧 (AI) 模型相關聯。可以理解的是，使用者對獲取和使用其數據的自動化技術持謹慎態度，其中可能包括敏感資訊。由於 AI

模型依賴資料品質來提供顯著的結果，因此它們的持續存在取決於隱私保護是其設計不可或缺的一部分。

良好的隱私和資料管理實踐不僅僅是消除客戶恐懼和擔憂的一種方式，與企業的核心組織價值觀、業務流程和安全管理有很大關係。隱私問題已被廣泛研究和宣傳，隱私感知調查數據表明，隱私保護是消費者關注的重要議題。

從上下文中解決這些問題至關重要，對於使用面向消費者的人工智慧的公司來說，有幾種方法和技術可以幫助解決通常與人工智慧相關的隱私問題。

有些產品和服務需要數據，但它們不需要侵犯任何人的隱私

使用人工智慧的企業在隱私方面已經面臨公眾的質疑。根據歐洲消費者組織 2020 年的一項調查顯示，45-60% 的歐洲人同意 AI

將導致更多的個人資料濫用。

有許多流行的線上服務和產品依賴大型資料集來學習和改進他們的 AI

演算法。即使是最不注重隱私的用戶，這些資料集中的一些資料也可能被認為是私有的。來自網路、社群媒體頁面、手機和其他裝置的資料流增加了企業用來訓練機器學習系統的資訊量。由於一些企業過度使用個人資料和管理不善，隱私權保護正在成為世界各地的公共政策議題。

我們收集的大部分敏感資料都是為了改善支援人工智慧的流程。許多分析的數據也是由機器學習採用驅動的，因為複雜的演算法需要根據這些數據集即時做出決策。搜尋演算法、語音助理和推薦引擎只是利用基於現實世界用戶資料的大型資料集的

AI 的少數解決方案。

海量資料庫可能包含廣泛的數據，最緊迫的問題之一是這些數據可能是個人可識別和敏感的。實際上，教導演算法做出決策並不依賴知道數據與誰相關。因此，此類產品背後的公司應專注於將其資料集私有化，幾乎沒有方法來識別來源資料中的用戶，並製定措施從其演算法中刪除邊緣情況以避免逆向工程和識別。

資料隱私和人工智慧之間的關係非常微妙。雖然某些演算法可能不可避免地需要私人數據，但有一些方法可以以更安全和非侵入性的方式使用它。以下方法只是使用私有資料的公司如何成為解決方案的一部分的一些方法。

考慮隱私的人工智慧設計

我們已經討論了逆向工程的問題，其中不良行為者會發現AI

模型中的漏洞並從模型的輸出中識別潛在的關鍵資訊。逆向工程是為什麼在面臨這項挑戰的情況下更改和改進資料庫和學習資料對於 AI 使用至關重要。

例如，在機器學習過程(對抗性學習)中組合衝突的資料集是區分 AI

演算法輸出中的缺陷和偏差的好選擇。也有使用不使用實際個人資料的合成資料集的選項，但它們的有效性仍然存在問題。

醫療保健是人工智慧和資料隱私治理的先驅，尤其是處理敏感的私人資料。它還在同意方面做了大量工作，無論是對於醫療程序還是處理他們的數據——風險很高，並且已得到法律強制執行。

對於 AI 產品和演算法的整體設計，透過匿名化和聚合的方式將資料與使用者解耦是任何使用使用者資料訓練其 AI 模型的企業的關鍵。

有許多考慮可以加強 AI 公司的隱私保護：

以隱私為核心：將隱私保護放在開發者的雷達上，並找到有效加強安全性的方法。
匿名化和聚合資料集，刪除所有個人識別碼和唯一資料點。
嚴格控制公司中誰可以存取特定資料集，並持續審核這些資料的存取方式，因為這是過去一些資料外洩背後的原因。
更多的數據並不總是最好的解決方案。使用最少的數據測試您的演算法，以了解您需要收集和處理的最少資料量，從而使您的用例可行。
必須提供一種簡化的方法來根據使用者的要求消除個人資料。只對用戶資料進行偽匿名化的公司應該使用最新的數據不斷地重新訓練他們的模型。
利用強大的去識別化策略，例如，具有完全匿名化的聚合和合成資料集，用於演算法訓練、稽核和品質保證等的不可逆標識符。
透過重新思考從第三方獲取和使用關鍵資訊的方式來保護使用者的自主權和隱私——仔細檢查資料來源，只使用那些在使用者明確和知情同意的情況下收集資料的來源。
考慮風險：攻擊是否可能從您的AI 系統輸出中危及用戶隱私?

資料隱私和人工智慧的未來是什麼?

人工智慧系統需要大量數據，如果沒有用於訓練人工智慧演算法的個人數據，一些頂級的線上服務和產品就無法運作。然而，有許多方法可以改善資料的取得、管理和使用，包括演算法本身和整體資料管理。尊重隱私的人工智慧需要尊重隱私的公司。

本文作者：Einaras von Gravrock，CUJO AI 執行長兼創辦人

以上是為什麼人工智慧設計必須優先考慮資料隱私的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文轉載於：51CTO.COM。如有侵權，請聯絡admin@php.cn刪除

擁抱面部是否7B型號奧林匹克賽車擊敗克勞德3.7？Apr 23, 2025 am 11:49 AM

擁抱Face的OlympicCoder-7B：強大的開源代碼推理模型開發以代碼為中心的語言模型的競賽正在加劇，擁抱面孔與強大的競爭者一起參加了比賽：OlympicCoder-7B，一種產品

4個新的雙子座功能您可以錯過Apr 23, 2025 am 11:48 AM

你們當中有多少人希望AI可以做更多的事情，而不僅僅是回答問題？我知道我有，最近，我對它的變化感到驚訝。 AI聊天機器人不僅要聊天，還關心創建，研究

Camunda為經紀人AI編排編寫了新的分數Apr 23, 2025 am 11:46 AM

隨著智能AI開始融入企業軟件平台和應用程序的各個層面（我們必須強調的是，既有強大的核心工具，也有一些不太可靠的模擬工具），我們需要一套新的基礎設施能力來管理這些智能體。總部位於德國柏林的流程編排公司Camunda認為，它可以幫助智能AI發揮其應有的作用，並與新的數字工作場所中的準確業務目標和規則保持一致。該公司目前提供智能編排功能，旨在幫助組織建模、部署和管理AI智能體。從實際的軟件工程角度來看，這意味著什麼？確定性與非確定性流程的融合該公司表示，關鍵在於允許用戶（通常是數據科學家、軟件

策劃的企業AI體驗是否有價值？Apr 23, 2025 am 11:45 AM

參加Google Cloud Next '25，我渴望看到Google如何區分其AI產品。有關代理空間（此處討論）和客戶體驗套件（此處討論）的最新公告很有希望，強調了商業價值

如何為抹布找到最佳的多語言嵌入模型？Apr 23, 2025 am 11:44 AM

為您的檢索增強發電（RAG）系統選擇最佳的多語言嵌入模型在當今的相互聯繫的世界中，建立有效的多語言AI系統至關重要。強大的多語言嵌入模型對於RE至關重要

麝香：奧斯汀的機器人需要每10,000英里進行干預Apr 23, 2025 am 11:42 AM

特斯拉的Austin Robotaxi發射：仔細觀察Musk的主張埃隆·馬斯克（Elon Musk）最近宣布，特斯拉即將在德克薩斯州奧斯汀推出的Robotaxi發射，最初出於安全原因部署了一支小型10-20輛汽車，並有快速擴張的計劃。 h

AI震驚的樞軸：從工作工具到數字治療師和生活教練Apr 23, 2025 am 11:41 AM

人工智能的應用方式可能出乎意料。最初，我們很多人可能認為它主要用於代勞創意和技術任務，例如編寫代碼和創作內容。然而，哈佛商業評論最近報導的一項調查表明情況並非如此。大多數用戶尋求人工智能的並非是代勞工作，而是支持、組織，甚至是友誼！報告稱，人工智能應用案例的首位是治療和陪伴。這表明其全天候可用性以及提供匿名、誠實建議和反饋的能力非常有價值。另一方面，營銷任務（例如撰寫博客、創建社交媒體帖子或廣告文案）在流行用途列表中的排名要低得多。這是為什麼呢？讓我們看看研究結果及其對我們人類如何繼續將