搜尋
首頁科技週邊人工智慧AI疲勞問題能透過數據治理解決嗎?

AI疲勞問題能透過數據治理解決嗎?

Jan 18, 2024 pm 05:51 PM
資料安全資料治理ai疲勞

AI疲勞問題能透過數據治理解決嗎?

資料治理和AI疲勞聽起來像是兩個不同的概念,但兩者之間有著內在的連結。為了更好地理解它,讓我們從它們的定義開始。

資料治理

長期以來,它一直是資料產業的核心焦點。

資料治理是確保資料安全、私有、準確、可用和可靠的一切措施,包括制定內部標準和資料政策,規範資料的收集、儲存、處理和處置。這個過程對於保護用戶隱私和維護資料的完整性至關重要。

正如這一定義所強調的那樣,資料治理是關於管理資料——準確地說,是驅動AI模型的引擎。

雖然資料治理和AI之間的聯繫初步顯現,但是將其與AI疲勞聯繫起來是因為強調導致疲憊的原因,這確保了整篇文章中對該術語的一致使用。

AI疲勞

由於公司、開發人員或團隊遇到的挫折和挑戰,AI疲勞可能會出現,導致AI系統的實施或價值實現受阻。

AI過度炒作的主要原因在於對其能力的不切實際期望。利害關係人需要與AI的能力、可能性、限制和風險保持一致,才能合理地評估其價值和應用。

談到風險,道德通常被認為是事後的想法,導致放棄不符合規定的AI倡議。

你一​​定想知道資料治理在導致AI疲勞方面的作用-這是本文的前提。

這就是我們接下來要去的地方。

AI疲勞大致可分為部署前和部署後。讓我們先關注部署前的工作。

部署前

將概念驗證(PoC)升級到部署的因素有很多,例如:

  • 我們正在努力解決什麼問題?
  • 為什麼現在就確定優先順序會成為一個緊迫的問題?
  • 有哪些數據可用?
  • #它首先是ML——可解的嗎?
  • 數據有規律嗎?
  • 這種現象可以重演嗎?
  • 哪些額外數據會提升模型的性能?
##一旦我們評估了使用ML演算法可以最好地解決問題,數據科學團隊就會執行探索性的數據分析。在這個階段揭示了許多底層資料模式,突出了給定資料是否包含豐富的訊號,它還有助於創建工程特徵,以加快演算法的學習過程。

接下來,團隊建立第一個基準模型,通常會發現它的性能沒有達到可接受的水平。一款輸出像擲硬幣一樣好的車型不會增加任何價值,這是建立ML模型時的首批挫折之一,也就是經驗教訓。

公司可能會從一個業務問題轉移到另一個業務問題,從而導致疲勞。儘管如此,如果底層資料沒有攜帶豐富的訊號,任何AI演算法都無法建立在它的基礎上,該模型必須從訓練資料中學習統計關聯,以對看不見的資料進行概括。

部署後

儘管經過訓練的模型在驗證集上顯示了有希望的結果,但根據合格的業務標準,例如70%的精度,如果模型在生產環境中不能充分發揮作用,仍可能會出現疲勞。

這種類型的AI疲勞被稱為部署後階段。

無數原因可能會導致效能下降,而糟糕的資料品質是困擾該模型的最常見問題,它限制了模型在缺少關鍵屬性的情況下準確預測目標反應的能力。

考慮在訓練資料中只有10%缺失的基本特徵之一,現在生產資料中50%的時間變為空,從而導致錯誤預測,這樣的迭代和確保模型一致執行的努力會讓資料科學家和業務團隊感到疲憊,從而削弱人們對數據管道的信心,並使專案投資面臨風險。

資料治理是關鍵

穩健的資料治理措施對於解決這兩種類型的AI疲勞至關重要。鑑於數據是ML模型的核心,訊號豐富、無錯誤和高品質的數據是ML項目成功的必要條件。解決AI疲勞問題需要高度關注資料治理。因此,我們必須嚴格工作,確保正確的數據質量,為建立最先進的模型和提供值得信賴的業務見解奠定基礎。

資料品質

資料品質是蓬勃發展的資料治理的關鍵,也是機器學習演算法成功的關鍵因素。公司必須在數據品質方面進行投資,例如向數據消費者發布報告。在資料科學專案中,想想當品質不佳的資料進入模型時會發生什麼,這可能會導致效能不佳。

只有在錯誤分析期間,團隊才能識別資料品質問題,當這些問題被送到上游修復時,最終會導致團隊之間的疲勞。

顯然,這不僅僅是花費的努力,而且在正確的資料開始輸入之前,還會損失大量的時間。

Поэтому всегда рекомендуется исправлять проблемы с данными в источнике, чтобы предотвратить такие трудоемкие итерации. В конечном счете, опубликованные отчеты о качестве данных подразумевают, что группа по обработке данных (или любые другие последующие пользователи и потребители данных) понимают приемлемое качество входящих данных.

Без мер по обеспечению качества данных и управлению специалисты по данным будут перегружены проблемами с данными, что приведет к созданию неудачных моделей и усталости ИИ.

Заключение

В этой статье освещаются две стадии наступления усталости ИИ и описывается, как меры управления данными, такие как отчеты о качестве данных, могут способствовать построению надежных и надежных моделей.

Создавая прочную основу посредством управления данными, компании могут построить дорожную карту для успешной и беспрепятственной разработки и внедрения ИИ, вселяя энтузиазм.

Чтобы в этой статье был представлен всесторонний обзор различных подходов к борьбе с усталостью от искусственного интеллекта, я также подчеркиваю роль организационной культуры, которая в сочетании с другими передовыми практиками, такими как управление данными, позволит командам по анализу данных быстрее и быстрее создавать значимый вклад ИИ.

以上是AI疲勞問題能透過數據治理解決嗎?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
AI遊戲開發通過Upheaval的Dreamer Portal進入其代理時代AI遊戲開發通過Upheaval的Dreamer Portal進入其代理時代May 02, 2025 am 11:17 AM

動盪遊戲:與AI代理商的遊戲開發徹底改變 Roupheaval是一家遊戲開發工作室,由暴風雪和黑曜石等行業巨頭的退伍軍人組成,有望用其創新的AI驅動的Platfor革新遊戲創作

Uber想成為您的Robotaxi商店,提供商會讓他們嗎?Uber想成為您的Robotaxi商店,提供商會讓他們嗎?May 02, 2025 am 11:16 AM

Uber的Robotaxi策略:自動駕駛汽車的騎車生態系統 在最近的Curbivore會議上,Uber的Richard Willder推出了他們成為Robotaxi提供商的乘車平台的策略。 利用他們在

AI代理玩電子遊戲將改變未來的機器人AI代理玩電子遊戲將改變未來的機器人May 02, 2025 am 11:15 AM

事實證明,視頻遊戲是最先進的AI研究的寶貴測試理由,尤其是在自主代理商和現實世界機器人的開發中,甚至有可能促進人工通用情報(AGI)的追求。 一個

創業公司工業綜合體VC 3.0和James Currier的宣言創業公司工業綜合體VC 3.0和James Currier的宣言May 02, 2025 am 11:14 AM

不斷發展的風險投資格局的影響在媒體,財務報告和日常對話中顯而易見。 但是,對投資者,初創企業和資金的具體後果經常被忽略。 風險資本3.0:範式

Adobe在Adobe Max London 2025更新創意云和螢火蟲Adobe在Adobe Max London 2025更新創意云和螢火蟲May 02, 2025 am 11:13 AM

Adobe Max London 2025對Creative Cloud和Firefly進行了重大更新,反映了向可訪問性和生成AI的戰略轉變。 該分析結合了事件前簡報中的見解,並融合了Adobe Leadership。 (注意:Adob

Llamacon宣布的所有元數據Llamacon宣布的所有元數據May 02, 2025 am 11:12 AM

Meta的Llamacon公告展示了一項綜合的AI策略,旨在直接與OpenAI等封閉的AI系統競爭,同時為其開源模型創建了新的收入流。 這個多方面的方法目標bo

關於AI僅僅是普通技術的主張的釀造爭議關於AI僅僅是普通技術的主張的釀造爭議May 02, 2025 am 11:10 AM

人工智能領域對這一論斷存在嚴重分歧。一些人堅稱,是時候揭露“皇帝的新衣”了,而另一些人則強烈反對人工智能僅僅是普通技術的觀點。 讓我們來探討一下。 對這一創新性人工智能突破的分析,是我持續撰寫的福布斯專欄文章的一部分,該專欄涵蓋人工智能領域的最新進展,包括識別和解釋各種有影響力的人工智能複雜性(請點擊此處查看鏈接)。 人工智能作為普通技術 首先,需要一些基本知識來為這場重要的討論奠定基礎。 目前有大量的研究致力於進一步發展人工智能。總目標是實現人工通用智能(AGI)甚至可能實現人工超級智能(AS

模型公民,為什麼AI值是下一個業務碼模型公民,為什麼AI值是下一個業務碼May 02, 2025 am 11:09 AM

公司AI模型的有效性現在是一個關鍵的性能指標。自AI BOOM以來,從編寫生日邀請到編寫軟件代碼的所有事物都將生成AI使用。 這導致了語言mod的擴散

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

SecLists

SecLists

SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

Atom編輯器mac版下載

Atom編輯器mac版下載

最受歡迎的的開源編輯器

EditPlus 中文破解版

EditPlus 中文破解版

體積小,語法高亮,不支援程式碼提示功能

PhpStorm Mac 版本

PhpStorm Mac 版本

最新(2018.2.1 )專業的PHP整合開發工具

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中