隨著我們深入ML和GenAI領域,對資料品質的重視變得至關重要。 KMS Technology高級技術創新小組的技術長John Jeske深入研究了資料治理方法,如資料沿襲追蹤和聯合學習,以確保頂級模型的性能。
資料品質是模型永續性和利害關係人信任的關鍵。在建模過程中,資料品質使長期維護變得更容易,並使你能夠在利害關係人社群中建立使用者信心和信心。在包括大規模語言和生成性演算法在內的複雜模型中,『垃圾輸入,垃圾輸出』的影響會加劇。 「Jeske說。
基因AI偏向與數據代表性問題
無論你為用例選擇哪種模型,糟糕的數據品質都不可避免地會導致GenAI模型的扭曲。陷阱通常來自培訓數據,這些數據錯誤地表示了公司的範圍、客戶基礎或應用程式範圍。
真正的財富在於數據本身,而不是短暫的模型或建模結構。在過去幾個月裡,隨著大量建模框架的湧現,數據作為可貨幣化資產的價值變得更加突顯
KMS Technology軟體服務高級副總裁Jeff Scott進一步解釋道:「當AI生成的內容與預期輸出有偏差時,並非演算法錯誤,而是培訓資料不足或扭曲的反映
嚴格的資料完整性治理
#資料治理的最佳實踐包括元資料管理、資料管理和自動化品質檢查等活動。例如,確保資料來源的可靠性,在獲取用於培訓和建模的資料時使用經過認證的資料集,並考慮使用自動化資料品質工具。儘管這可能增加複雜性,但這些工具對於確保資料完整性非常有幫助
為了提高資料質量,我們使用了提供資料有效性、完整性檢查和時間一致性等屬性的工具,這促進了可靠、一致的數據,而這對健壯的AI模型來說是不可或缺的。
AI發展中的責任追究和持續改進
在每個人看來,數據都是一個問題。在公司內,分配資料治理的責任是一項重要任務
最重要的是確保功能按設計工作,並且從潛在客戶的角度來看,正在訓練的資料是合理的。回饋加強了學習,然後在下一次訓練模型時考慮到回饋,從而調用持續改進,直到信任點。
在我們的工作流程中,AI和ML模型在公開推出之前都要經過嚴格的內部測試。資料工程團隊不斷收到回饋,允許對模型進行迭代改進,以最大限度地減少偏差和其他異常情況
風險管理與客戶信任
資料治理需要在相關的業務領域進行資料管理,並且需要有主題專家持續參與,以確保團隊和系統中的資料得到適當的整理和一致的負責任
必須了解與接收來自技術的不準確結果相關的風險,公司必須評估其透明度,從資料來源和處理智慧財產權到整體資料品質和完整性。
透明度對客戶的信任是不可或缺的,資料治理不僅僅是一項技術工作,由於風險從不準確的AI預測轉移到最終用戶,它還會影響公司的聲譽。
隨著GenAI的不斷發展,資料治理的掌握變得愈發重要。這不僅是為了保證資料質量,也是為了理解資料與AI模型之間的複雜關係。這種洞察力對於技術進步、業務健康以及維護利益相關者和更廣泛公眾的信任至關重要
以上是GenAI時代的資料治理藍圖的詳細內容。更多資訊請關注PHP中文網其他相關文章!

斯坦福大學以人為本人工智能研究所發布的《2025年人工智能指數報告》對正在進行的人工智能革命進行了很好的概述。讓我們用四個簡單的概念來解讀它:認知(了解正在發生的事情)、欣賞(看到好處)、接納(面對挑戰)和責任(弄清我們的責任)。 認知:人工智能無處不在,並且發展迅速 我們需要敏銳地意識到人工智能發展和傳播的速度有多快。人工智能係統正在不斷改進,在數學和復雜思維測試中取得了優異的成績,而就在一年前,它們還在這些測試中慘敗。想像一下,人工智能解決複雜的編碼問題或研究生水平的科學問題——自2023年

Meta的Llama 3.2:多模式和移動AI的飛躍 Meta最近公佈了Llama 3.2,這是AI的重大進步,具有強大的視覺功能和針對移動設備優化的輕量級文本模型。 以成功為基礎

本週的AI景觀:進步,道德考慮和監管辯論的旋風。 OpenAI,Google,Meta和Microsoft等主要參與者已經釋放了一系列更新,從開創性的新車型到LE的關鍵轉變

連接的舒適幻想:我們在與AI的關係中真的在蓬勃發展嗎? 這個問題挑戰了麻省理工學院媒體實驗室“用AI(AHA)”研討會的樂觀語氣。事件展示了加油

介紹 想像一下,您是科學家或工程師解決複雜問題 - 微分方程,優化挑戰或傅立葉分析。 Python的易用性和圖形功能很有吸引力,但是這些任務需要強大的工具

Meta's Llama 3.2:多式聯運AI強力 Meta的最新多模式模型Llama 3.2代表了AI的重大進步,具有增強的語言理解力,提高的準確性和出色的文本生成能力。 它的能力t

數據質量保證:與Dagster自動檢查和良好期望 保持高數據質量對於數據驅動的業務至關重要。 隨著數據量和源的增加,手動質量控制變得效率低下,容易出現錯誤。

大型機:AI革命的無名英雄 雖然服務器在通用應用程序上表現出色並處理多個客戶端,但大型機是專為關鍵任務任務而建立的。 這些功能強大的系統經常在Heavil中找到


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

EditPlus 中文破解版
體積小,語法高亮,不支援程式碼提示功能

記事本++7.3.1
好用且免費的程式碼編輯器

SecLists
SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

MinGW - Minimalist GNU for Windows
這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

ZendStudio 13.5.1 Mac
強大的PHP整合開發環境