GenAI時代的資料治理藍圖

GenAI時代的資料治理藍圖

Nov 20, 2023 pm 05:33 PM

人工智慧genai

GenAI時代的資料治理藍圖

隨著我們深入ML和GenAI領域，對資料品質的重視變得至關重要。 KMS Technology高級技術創新小組的技術長John Jeske深入研究了資料治理方法，如資料沿襲追蹤和聯合學習，以確保頂級模型的性能。

資料品質是模型永續性和利害關係人信任的關鍵。在建模過程中，資料品質使長期維護變得更容易，並使你能夠在利害關係人社群中建立使用者信心和信心。在包括大規模語言和生成性演算法在內的複雜模型中，『垃圾輸入，垃圾輸出』的影響會加劇。「Jeske說。

基因AI偏向與數據代表性問題

無論你為用例選擇哪種模型，糟糕的數據品質都不可避免地會導致GenAI模型的扭曲。陷阱通常來自培訓數據，這些數據錯誤地表示了公司的範圍、客戶基礎或應用程式範圍。

真正的財富在於數據本身，而不是短暫的模型或建模結構。在過去幾個月裡，隨著大量建模框架的湧現，數據作為可貨幣化資產的價值變得更加突顯

KMS Technology軟體服務高級副總裁Jeff Scott進一步解釋道：「當AI生成的內容與預期輸出有偏差時，並非演算法錯誤，而是培訓資料不足或扭曲的反映

嚴格的資料完整性治理

#資料治理的最佳實踐包括元資料管理、資料管理和自動化品質檢查等活動。例如，確保資料來源的可靠性，在獲取用於培訓和建模的資料時使用經過認證的資料集，並考慮使用自動化資料品質工具。儘管這可能增加複雜性，但這些工具對於確保資料完整性非常有幫助

為了提高資料質量，我們使用了提供資料有效性、完整性檢查和時間一致性等屬性的工具，這促進了可靠、一致的數據，而這對健壯的AI模型來說是不可或缺的。

AI發展中的責任追究和持續改進

在每個人看來，數據都是一個問題。在公司內，分配資料治理的責任是一項重要任務

最重要的是確保功能按設計工作，並且從潛在客戶的角度來看，正在訓練的資料是合理的。回饋加強了學習，然後在下一次訓練模型時考慮到回饋，從而調用持續改進，直到信任點。

在我們的工作流程中，AI和ML模型在公開推出之前都要經過嚴格的內部測試。資料工程團隊不斷收到回饋，允許對模型進行迭代改進，以最大限度地減少偏差和其他異常情況

風險管理與客戶信任

資料治理需要在相關的業務領域進行資料管理，並且需要有主題專家持續參與，以確保團隊和系統中的資料得到適當的整理和一致的負責任

必須了解與接收來自技術的不準確結果相關的風險，公司必須評估其透明度，從資料來源和處理智慧財產權到整體資料品質和完整性。

透明度對客戶的信任是不可或缺的，資料治理不僅僅是一項技術工作，由於風險從不準確的AI預測轉移到最終用戶，它還會影響公司的聲譽。

隨著GenAI的不斷發展，資料治理的掌握變得愈發重要。這不僅是為了保證資料質量，也是為了理解資料與AI模型之間的複雜關係。這種洞察力對於技術進步、業務健康以及維護利益相關者和更廣泛公眾的信任至關重要

以上是GenAI時代的資料治理藍圖的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文轉載於：51CTO.COM。如有侵權，請聯絡admin@php.cn刪除

閱讀AI索引2025：AI是您的朋友，敵人還是副駕駛？

閱讀AI索引2025：AI是您的朋友，敵人還是副駕駛？Apr 11, 2025 pm 12:13 PM

斯坦福大學以人為本人工智能研究所發布的《2025年人工智能指數報告》對正在進行的人工智能革命進行了很好的概述。讓我們用四個簡單的概念來解讀它：認知（了解正在發生的事情）、欣賞（看到好處）、接納（面對挑戰）和責任（弄清我們的責任）。認知：人工智能無處不在，並且發展迅速我們需要敏銳地意識到人工智能發展和傳播的速度有多快。人工智能係統正在不斷改進，在數學和復雜思維測試中取得了優異的成績，而就在一年前，它們還在這些測試中慘敗。想像一下，人工智能解決複雜的編碼問題或研究生水平的科學問題——自2023年

開始使用Meta Llama 3.2 -Analytics Vidhya

開始使用Meta Llama 3.2 -Analytics VidhyaApr 11, 2025 pm 12:04 PM

Meta的Llama 3.2：多模式和移動AI的飛躍 Meta最近公佈了Llama 3.2，這是AI的重大進步，具有強大的視覺功能和針對移動設備優化的輕量級文本模型。以成功為基礎

AV字節：Meta＆＃039; llama 3.2，Google的雙子座1.5等

AV字節：Meta＆＃039; llama 3.2，Google的雙子座1.5等Apr 11, 2025 pm 12:01 PM

本週的AI景觀：進步，道德考慮和監管辯論的旋風。 OpenAI，Google，Meta和Microsoft等主要參與者已經釋放了一系列更新，從開創性的新車型到LE的關鍵轉變

與機器交談的人類成本：聊天機器人真的可以在乎嗎？

與機器交談的人類成本：聊天機器人真的可以在乎嗎？Apr 11, 2025 pm 12:00 PM

連接的舒適幻想：我們在與AI的關係中真的在蓬勃發展嗎？這個問題挑戰了麻省理工學院媒體實驗室“用AI（AHA）”研討會的樂觀語氣。事件展示了加油

了解Python的Scipy圖書館

了解Python的Scipy圖書館Apr 11, 2025 am 11:57 AM

介紹想像一下，您是科學家或工程師解決複雜問題 - 微分方程，優化挑戰或傅立葉分析。 Python的易用性和圖形功能很有吸引力，但是這些任務需要強大的工具

3種運行Llama 3.2的方法-Analytics Vidhya

3種運行Llama 3.2的方法-Analytics VidhyaApr 11, 2025 am 11:56 AM

Meta's Llama 3.2：多式聯運AI強力 Meta的最新多模式模型Llama 3.2代表了AI的重大進步，具有增強的語言理解力，提高的準確性和出色的文本生成能力。它的能力t

使用dagster自動化數據質量檢查

使用dagster自動化數據質量檢查Apr 11, 2025 am 11:44 AM

數據質量保證：與Dagster自動檢查和良好期望保持高數據質量對於數據驅動的業務至關重要。隨著數據量和源的增加，手動質量控制變得效率低下，容易出現錯誤。

大型機在人工智能時代有角色嗎？

大型機在人工智能時代有角色嗎？Apr 11, 2025 am 11:42 AM

大型機：AI革命的無名英雄雖然服務器在通用應用程序上表現出色並處理多個客戶端，但大型機是專為關鍵任務任務而建立的。這些功能強大的系統經常在Heavil中找到

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼（黃色晶體）

3 週前By尊渡假赌尊渡假赌尊渡假赌

R.E.P.O.最佳圖形設置

3 週前By尊渡假赌尊渡假赌尊渡假赌

刺客信條陰影：貝殼謎語解決方案

2 週前ByDDD

R.E.P.O.如果您聽不到任何人，如何修復音頻

3 週前By尊渡假赌尊渡假赌尊渡假赌

WWE 2K25：如何解鎖Myrise中的所有內容

3 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

EditPlus 中文破解版

EditPlus 中文破解版

體積小，語法高亮，不支援程式碼提示功能

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SecLists

SecLists

SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合，這些清單在安全評估過程中經常使用，而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表，幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上，他就可以存取所需的每種類型的清單。

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

這個專案正在遷移到osdn.net/projects/mingw的過程中，你可以繼續在那裡關注我們。 MinGW：GNU編譯器集合（GCC）的本機Windows移植版本，可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔；包括對MSVC執行時間的擴展，以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

強大的PHP整合開發環境

熱門話題

gmail信箱登陸入口在哪裡

7467

15

1376

52

steam的賬戶名稱是什麼格式

77

11

win11激活密鑰永久

46

19

NYT連接提示和答案

18

20