首頁  >  文章  >  科技週邊  >  企業正在充分利用機器學習營運來獲取商業利益

企業正在充分利用機器學習營運來獲取商業利益

PHPz
PHPz轉載
2023-04-10 08:51:05886瀏覽

當企業最初開始部署 AI 和啟動機器學習專案時,其重點往往是理論層面。是否存在某一可以提供必要結果的模型?如何建構該模型?如何訓練這一模型?

企業正在充分利用機器學習營運來獲取商業利益

#但資料科學家用來開發這些概念驗證的工具通常不能很好地轉化為生產系統。因此,根據IDC公司的數據,部署一個 AI 或機器學習解決方案平均需要 9 個多月的時間。

IDC司分析師史利南·蘇布蘭馬尼安(Sriram Subramanian) 說:「我們稱之為'模型速度',即一個模型從開始到結束所需的時間。」

這就是MLOps 可發揮作用之處。 MLOps(機器學習營運)是一系列最佳實踐、框架和工具,可協助企業管理資料、模型、部署、監控工作以及採用某一理論概念驗證 AI 系統並投入使用的其他方面工作。

「MLOps 可將模型速度縮短到幾週時間——有時是幾天,」蘇布蘭馬尼安說。 「就像使用開發營運(DevOps) 可縮短開發應用程式的平均時間一樣,因此你需要使用MLOps。」

他表示,透過使用MLOps,企業可以建立更多的模型、更快地進行創新,並處理更多的用例。 「其價值主張非常明確。」他說。

IDC公司預測,到 2024 年,60% 的企業將使用 MLOps 來實現其機器學習工作流程。蘇布蘭馬尼安表示,就企業在使用 AI 和機器學習技術時所面臨的難題,而對其進行調查時,缺乏 MLOps 已成為企業接納 AI 和機器學習技術的主要障礙,僅次於成本。

在此,我們將研究什麼是 MLOPs,它是如何演變的,以及哪些組織機構需要使用和牢記,以為實施 AI 技術而充分利用這一新興方法。

MLOps 的演變

幾年前,當歐亨尼奧·祖卡雷利(Eugenio Zuccarelli) 首次開始設計機器學習在專案時,MLOps 只是一系列最佳實踐。從那時起,祖卡雷利已在多家公司從事 AI 項目,包括醫療和金融服務領域的一些公司,隨著時間的推移,他經歷了 MLOps 逐步發展,並包含了多種工具和平台。

如今,MLOps 可為實現AI 技術提供一個相當強大的框架,祖卡雷利表示,他現在擔任西維斯健康公司 (CVS Health) 的創新資料科學家。舉例來說,祖卡雷利提到了他之前從事的一個項目,該項目是為開發一款可預測不良後果(例如再次住院或疾病惡化)的應用程式。

「我們當時在研究資料集和模型,並與醫生交談以找出最佳模型的特徵,」他說。 「但要讓這些模型真正有用,我們需要將這些模型放到實際用戶面前。」

這意味著要開發一款可靠、快速且穩定的行動應用程序,並在後端有一個透過API 連接的機器學習系統。 「如果沒有 MLOps,我們將無法保證做到這一點。」他說。

他的團隊使用 H2O MLOps 平台和其他工具為該模型創建了一個健康儀表板。 「你不希望該模型發生重大變化,」他說。 「而且你不想引入偏見。這個健康儀表板可讓我們了解系統是否發生了變化。」

#使用 MLOps 平台還可以讓我們對生產系統進行更新。 「在不停止應用程式運作的情況下替換某一檔案是非常困難的,」祖卡雷利說。 「即使系統正在生產過程中,MLOps 工具也可以對該系統進行更換,而且對該系統本身的干擾極小。」

他表示,隨著MLOps 平台的成熟,這些平台會加快整個模型開發的過程,因為企業不必為每個專案都白費力氣做一些重複性工作。資料管道管理功能對於實施 AI 也至關重要。

「如果我們有多個需要相互通訊的資料來源,那麼 MLOps 就可以發揮作用,」他說。 「你希望流入機器學習模型的所有數據都是一致且高品質的。就像他們說的那樣,無用數據輸入,無用數據輸出。如果模型所獲得的資訊品質很差,那麼其預測結果本身就會很差。」

MLOps 的基本原理:移動目標

但不要僅僅因為現在可使用一些平台和工具,就​​認為可以忽略MLOps 的核心原則。剛開始涉足這一領域的企業應該記住,MLOps 的核心是在數據科學和數據工程之間建立強大的聯繫。

「為了確保 MLOps 專案能夠成功,你需要在同一團隊中同時配備資料工程師和資料科學家。」祖卡雷利說。

#

此外,還要配備一些必要的工具以防止偏見、保證透明度、提供可解釋性和支持職業道德平台——這些工具仍在開發中,他表示。 「這肯定還需要大量的工作,因為這是一個很新的領域。」

因此,如果沒有一個完整的交鑰匙解決方案可供使用,則企業必須精通所有方面,才能在實施AI 技術時使MLOps 變得如此有效率。這意味著在各項工作中學習專業知識,位於美國坦佩的 Insight 技術諮詢公司的 AI 團隊的國內業務經理 Meagan Gentry 說。

MLOps 涵蓋了從資料收集、驗證和分析到管理機器資源和追蹤模型效能的所有方面。可為企業提供協助的一些工具可以部署在本地端、雲端或邊緣。這些工具可以是開源的或私有的。

但掌握技術方面的知識只是解決問題的一部分。 MLOps 也藉鑒了開發營運 (DevOps) 中的敏捷方法以及迭代開發原則,金特里說。此外,與敏捷開發相關的領域一樣,溝通是至關重要的。

「每個角色之間的溝通都至關重要,」她說。 「資料科學家和資料工程師之間的溝通。與開發營運人員的溝通,以及與更大的IT 團隊之間的溝通。」

對於剛起步的公司而言,MLOps 可能會讓你感到困惑。可以看到一些一般性原則,有數十家供應商,甚至有更多的開源工具箱。

「這就會存在一些陷阱,」凱捷美洲公司 (Capgemini Americas) 企業架構高級經理海倫•里斯托夫 (Helen Ristov) 說。 「其中許多陷阱都在開發過程中。沒有一套正式的指南,就像你在開發營運(DevOps) 中看到的那樣。這是一項新興技術,一些指南和策略需要一定時間才能發展出來。 」

里斯托夫建議企業從他們的資料平台開啟自己的MLOps 行程。 「也許他們擁有多個數據集,但這些數據集位於不同的地方,並且沒有一個緊密相連的環境。」她說。

她表示,企業無需將所有資料轉移到一個平台上,但確實需要一種方法將來自不同資料來源的資料引入,這可能會因應用情況不同而存在差異。例如,對於那些需要低成本儲存且頻繁進行大量分析的公司,則非常適合使用資料湖。

她表示,MLOps 平台通常會提供一些工具來建立和管理資料管道,同時記錄不同版本的訓練數據,但這並不是一勞永逸的。

然後還提供模型建立、版本管理、日誌記錄、衡量特徵集,以及管理模型本身的其他方面。

「這涉及到大量的編碼工作,」里斯托夫說,並補充道,建立一個MLOps 平台可能需要幾個月的時間,而且當涉及到整合方面的工作時,平台供應商仍有許多工作要做。

「在不同方向有很大的發展,」她說。 「有很多工具正在開發中,這個生態系統非常大,人們只是在選擇他們需要的東西。MLOps 正處於不成熟階段。大多數組織機構仍在尋找最佳配置。」

了解MLOps 的格局

IDC公司的蘇布蘭馬尼安表示,到2025 年,MLOps 市場規模預計將從2020 年的約1.85 億美元增長到約7 億美元。但他表示,這可能是一種嚴重的低估,因為 MLOps 產品通常與更大的平台捆綁在一起。他表示,到 2025 年,這一市場的真實規模可能超過 20 億美元。

蘇布蘭馬尼安表示,MLOps 供應商通常分為三類,首先是大型雲端供應商,包括亞馬遜網路服務(AWS)、Azure 雲端和Google雲,這些雲端平台將MLOps 功能作為一項服務來提供。

然後是一些機器學習平台供應商,如 DataRobot、Dataiku、Iguazio 等。

「第三類是他們過去所說的資料管理供應商,」他說。 「如Cloudera、SAS 和DataBricks 等公司。他們的優勢在於資料管理能力和資料操作,然後他們擴展到具備機器學習能力,並最終擴展到具備MLOps 能力。」

蘇布蘭馬尼安表示,這三個領域都在呈現爆炸式增長,並補充道,讓MLOps 供應商脫穎而出的關鍵在於他們是否能夠同時支援在本地和雲端部署模型、他們是否能夠實施可信賴和負責任的AI、他們是否能提供即插即用的方案,以及他們的方案是否可以輕鬆擴展。 「這就是不同供應商之間的差異所在。」他說。

根據IDC公司最近的一項調查,缺乏實施負責任AI 的方法是使用AI 和機器學習技術的三大障礙之一,與缺乏MLOps 本身並列第二位。

#

Gartner顧問公司AI 和機器學習技術研究分析師 Sumit Agarwal 表示,這在很大程度上是因為除了使用 MLOps 之外,沒有其他選擇。

「其他方法都是手動方式,」他說。 「所以,的確沒有其他選擇。如果你想擴大規模,你就需要自動化。你需要自己的程式碼、數據和模型具有可追溯性。」

##根據Gartner諮詢公司最近的一項調查,一個模型從概念驗證到投入使用所需的平均時間已從9 個月降至7.3 個月。 「但 7.3 個月仍是一個很長的周期,」阿加瓦爾說。 「組織機構有很多機會可以利用MLOps。」

將組織文化轉向MLOps

簡柏特公司(Genpact) 全球分析業務負責人阿瑪雷什•特里帕蒂(Amaresh Tripathy) 表示,MLOps 也要求企業的AI 團隊進行組織文化方面的轉變。

「資料科學家給人們的一個普遍形像是一個瘋狂的科學家,努力在做一個大海撈針的事情,」他說。 「資料科學家是一個發現者和探索者,而不是一個生產小部件的工廠車間。但這就是你真正要擴大規模時所需要做的事情。」

他表示,企業往往會低估自己所需要付出的努力。

「人們對軟體工程有更好的認識,」他說。 「關於使用者體驗和要求有很多規則。但不知何故,人們不認為當自己部署一個模型時,必須經歷同樣的過程。人們還有一種錯誤的觀念是,所有擅長在測試環境中工作的資料科學家都會很自然地去部署並能夠部署某一模型,或者他們可以派幾個IT 同事就能夠完成這項工作。人們對自己所需要做的工作缺乏理解。」

企業還沒有意識到,MLOps 可能會對公司的其他部門產生連鎖反應,而且通常會導致巨大的變化。

「你可以將MLOps 部署在客服中心,但平均回應時間實際上會增加,這是因為一些簡單的工作由機器、AI 負責處理,而交給人工處理的工作實際上需要更長的時間,因為這些工作更為複雜。」他說。 「因此,你需要重新考慮將要做的工作是什麼,你需要什麼樣的人,以及應該具備什麼樣的技能。」

他表示,如今,一個組織中只有不到5% 的決策是由演算法驅動的,但這種情況正在迅速改變。 「我們預計,在未來五年內,將有20% 到25% 的決策由演算法驅動。我們研究的每一個統計數據都表明,我們正處於AI 快速擴張的拐點。」

他表示,MLOps 是關鍵要素。

「百分之百,」他說。 「如果沒有 MLOps,你將無法持續使用 AI。MLOps 是企業中擴大使用 AI 的催化劑。」

以上是企業正在充分利用機器學習營運來獲取商業利益的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:51cto.com。如有侵權,請聯絡admin@php.cn刪除