搜尋
首頁科技週邊人工智慧如何透過合成資料產生器來避免人工智慧的偏見問題

如何透過合成資料產生器來避免人工智慧的偏見問題

Apr 26, 2023 pm 02:40 PM
人工智慧數據生成器

如何透過合成資料產生器來避免人工智慧的偏見問題

人工智慧偏見是一個嚴重的問題,可能對個人產生各種後果。

隨著人工智慧的發展,圍繞數據科學解決方案的問題和道德困境開始浮出水面。因為人類已經將自己排除在決策過程之外,他們希望確保這些演算法所做的判斷既不帶有偏見,也不帶有歧視性。人工智慧必須在任何時候都受到監督。我們不能說這種可能的偏見是由人工智慧引起的,因為其是一個基於預測分析的數位系統,可以處理大量數據。這個問題在更早的時候就開始了,也就是「輸入」到系統中的無監督資料。

縱觀歷史,人類一直存有偏見和歧視。我們的行動似乎不會很快改變。在系統和演算法中發現了偏見,與人類不同,這些系統和演算法似乎對這個問題免疫。

什麼是人工智慧偏見?

當獲取數據的方式導致樣本不能正確代表利益群體時,AI偏差就會在數據相關領域發生。這表明來自特定種族、信仰、膚色和性別的人,在數據樣本中沒有得到充分代表。這可能會導致系統做出鑑別性的結論。也引發了關於什麼是數據科學諮詢以及其的重要性的問題。

AI中的偏見並不意味著創建的AI系統會故意偏向特定的人群。人工智慧的目標是使個人能夠透過範例而不是指令來表達他們的願望。所以,如果AI有偏差,那隻能是因為數據有偏差!人工智慧決策是一個在現實世界中運作的理想化過程,其無法掩蓋人類的缺陷。結合引導學習也是有利的。

為什麼會發生?

人工智慧偏見問題的出現​​是由於數據可能包含基於先入為主的人類選擇,這有利於得出良好的演算法結論。在現實生活中,有幾個關於人工智慧偏見的例子。種族人士和著名的變裝皇后被谷歌的仇恨言論檢測系統歧視。 10年來,亞馬遜的人力資源演算法主要是提供男性員工數據,這導致女性候選人更有可能被評為符合亞馬遜的工作資格。

麻省理工學院(MIT)的資料科學家表示,人臉辨識演算法在分析少數族裔(尤其是少數族裔女性)的面孔時,出錯率更高。這可能是因為演算法在訓練過程中主要提供了白人男性的臉。

由於亞馬遜的演算法是根據其在美國的1.12億Prime用戶,以及數千萬經常光顧該網站,並經常使用其其他商品的額外個人的數據進行訓練的,因此該公司可以預測消費者的購買行為。谷歌的廣告業務是基於預測演算法的,該演算法由其每天進行的數十億次網路搜尋以及市場上25億部Android智慧型手機的數據提供。這些網路巨頭建立了龐大的資料壟斷企業,在人工智慧領域擁有近乎不可逾越的優勢。

合成資料如何幫助解決人工智慧偏見?

在一個理想的社會中,沒有人會受到偏見,每個人都將擁有平等的機會,無論膚色、性別、宗教或性取向。然而,存在於現實世界中,在某些地區與大多數人不同的人更難找到工作和獲得教育,這使他們在許多統計數據中被低估。根據人工智慧系統的目標,這可能會導致錯誤的推斷,即這類人技能較低,不太容易被納入這些資料集,以及不太適合獲得良好的分數。

另一方面,人工智慧資料可能是朝著公正的人工智慧方向邁出的一大步。以下是一些需要考慮的概念:

查看現實世界的數據,看看偏差在哪裡。然後,利用真實世界的數據和可觀察到的偏差,合成數據。如果想要創建理想的虛擬資料產生器,則需要包含一個公平定義,其可嘗試將偏差的資料轉換為可能被認為是公平的資料。

人工智慧產生的資料可能會填補資料集中變化不大或不夠大的空白,從而形成一個公正的資料集。即使樣本量很大,也有可能有些人被排除在外,或與其他人相比,代表性不足。這個問題必須使用合成數據來解決。

資料探勘可能比產生公正的資料更昂貴。實際的資料收集需要測量、訪談、大量的樣本,而且無論如何都需要付出很多努力。人工智慧產生的數據價格低廉,而且只需要使用數據科學和機器學習演算法即可。

過去幾年,許多獲利性合成資料公司以及Synthea的創辦人MitreCorp.的高層都注意到,人們對他們的服務的興趣激增。然而,隨著演算法被更廣泛地用於做出改變生活的決定,人們發現它們會加劇種族主義、性別歧視和其他高影響領域的有害偏見,包括臉部辨識、犯罪預測和醫療保健決策。研究人員表示,使用演算法產生的資料訓練演算法,會增加人工智慧系統在許多情況下延續有害偏見的可能性。

以上是如何透過合成資料產生器來避免人工智慧的偏見問題的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
一個提示可以繞過每個主要LLM的保障措施一個提示可以繞過每個主要LLM的保障措施Apr 25, 2025 am 11:16 AM

隱藏者的開創性研究暴露了領先的大語言模型(LLM)的關鍵脆弱性。 他們的發現揭示了一種普遍的旁路技術,稱為“政策木偶”,能夠規避幾乎所有主要LLMS

5個錯誤,大多數企業今年將犯有可持續性5個錯誤,大多數企業今年將犯有可持續性Apr 25, 2025 am 11:15 AM

對環境責任和減少廢物的推動正在從根本上改變企業的運作方式。 這種轉變會影響產品開發,製造過程,客戶關係,合作夥伴選擇以及採用新的

H20芯片禁令震撼中國人工智能公司,但長期以來一直在為影響H20芯片禁令震撼中國人工智能公司,但長期以來一直在為影響Apr 25, 2025 am 11:12 AM

最近對先進AI硬件的限制突出了AI優勢的地緣政治競爭不斷升級,從而揭示了中國對外國半導體技術的依賴。 2024年,中國進口了價值3850億美元的半導體

如果Openai購買Chrome,AI可能會統治瀏覽器戰爭如果Openai購買Chrome,AI可能會統治瀏覽器戰爭Apr 25, 2025 am 11:11 AM

從Google的Chrome剝奪了潛在的剝離,引發了科技行業中的激烈辯論。 OpenAI收購領先的瀏覽器,擁有65%的全球市場份額的前景提出了有關TH的未來的重大疑問

AI如何解決零售媒體的痛苦AI如何解決零售媒體的痛苦Apr 25, 2025 am 11:10 AM

儘管總體廣告增長超過了零售媒體的增長,但仍在放緩。 這個成熟階段提出了挑戰,包括生態系統破碎,成本上升,測量問題和整合複雜性。 但是,人工智能

'AI是我們,比我們更多''AI是我們,比我們更多'Apr 25, 2025 am 11:09 AM

在一系列閃爍和惰性屏幕中,一個古老的無線電裂縫帶有靜態的裂紋。這堆易於破壞穩定的電子產品構成了“電子廢物之地”的核心,這是沉浸式展覽中的六個裝置之一,&qu&qu

Google Cloud在下一個2025年對基礎架構變得更加認真Google Cloud在下一個2025年對基礎架構變得更加認真Apr 25, 2025 am 11:08 AM

Google Cloud的下一個2025:關注基礎架構,連通性和AI Google Cloud的下一個2025會議展示了許多進步,太多了,無法在此處詳細介紹。 有關特定公告的深入分析,請參閱我的文章

IR的秘密支持者透露,Arcana的550萬美元的AI電影管道說話,Arcana的AI Meme,Ai Meme的550萬美元。IR的秘密支持者透露,Arcana的550萬美元的AI電影管道說話,Arcana的AI Meme,Ai Meme的550萬美元。Apr 25, 2025 am 11:07 AM

本週在AI和XR中:一波AI驅動的創造力正在通過從音樂發電到電影製作的媒體和娛樂中席捲。 讓我們潛入頭條新聞。 AI生成的內容的增長影響:技術顧問Shelly Palme

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

EditPlus 中文破解版

EditPlus 中文破解版

體積小,語法高亮,不支援程式碼提示功能

Dreamweaver Mac版

Dreamweaver Mac版

視覺化網頁開發工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

MantisBT

MantisBT

Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具