#本文為人人都是產品經理《原創激勵計畫》出品。
儘管大型AI模型現在非常受歡迎,每個企業都想在其中分一杯羹,但實現這一過程所涉及的演算法和數據並不是易如反掌的。其中,資料的傳輸和管理是個大問題。本文圍繞著AI應用訓練的瓶頸展開敘述,對AI訓練困難進行總結並結合IDC分析報告,得出「數據」是最大瓶頸的結論,並針對該問題思考解決策略。
一、產品背景
「最近身邊再次響起了討論AI的聲音,與前兩年對AI持觀望態度不同,很多人都說隨著ChatGPT應用,AI時代真的來了,產品、運營同學們都在忙著了解什麼是ChatGPT、什麼是Stable Diffusion等等,但是演算法工程師卻在瘋狂頭疼,瘋狂抱怨,領導要求他們盡快搞出大模型,盡快提升演算法模型指標,服務業務,路過演算法組聽到張工和胡工的以下的對話:
張工:胡哥,你的模型訓練的怎麼樣了啊?
胡工:哎,一言難盡,沒數據啊,好不容易跟業務部門提了數據,他們不是收集不上來,就是收集上來的數據各式各樣,沒法用啊?
張工:誰不是呢,我這邊也是,最近客戶的圖片,影片加起來10多個T,讓我們自己傳,光來回導資料就耽誤了我們組好長時間。
胡工表示,如果公司能建立一個數據平台,讓我們可以快速地獲取數據,並且能夠管理數據,這樣我們在日常工作中使用數據的時候會更加方便。 ”
聽到以上的對話,我靈機一動,最近基於數據編織想法給客戶做的數據管理平台不就剛好可以解決他們問題嘛,於是我趕緊給他們做了詳細的產品介紹,講述下如何通過「資料編織」的設計概念建構資料管理平台幫助使用者突破AI在應用訓練中的資料瓶頸。
二、AI訓練應用難點
除去人員主觀問題外,我們將AI應用訓練的客觀難點總結,可以歸納為以下三點:
高品質數據:演算法訓練想取得好的效果,首要條件是高品質數據,但是如何取得高品質數據,存在如下困難:
高效算力:指訓練模型時,通常需要大量算力,同時如何將算力高效發揮成為困難
成熟框架:指演算法應用需要成熟穩定,擴展性強的演算法框架
小結:從AI應用訓練的3個難點分析,都與資料有關,所以如果能解決資料問題,可有效助力AI應用訓練突破瓶頸。
三、資料是否為AI應用的瓶頸?
雖然從應用程式側總結出資料是AI應用訓練的瓶頸,但是到底有多少使用者這麼認為呢?需要用一份數據來說明。
人工智慧應用的主要挑戰排名
人工智慧模型開發過程中,投入多少工作量用於資料準備
附註:資料來自IDC統計報告
從數據統計可以看出,其中有29%的用戶認為人工智慧的應用缺少訓練和測試數據,85%的用戶認為至少花費了一半以上的工作量用於準備數據。
小結:既然資料被證實確實是AI應用的瓶頸,那麼就可以考慮從資料尋找切入點,以提供統一標準、快速存取的大批量的高可用資料來源為定位進行產品規劃。
四、產品設計
在尋找到以資料為切入點後,思考如何建立資料類別的產品,根據上述的分析,可以發現要在我們的產品中解決3個資料類別問題:
我們在傳統資料管理平台的基礎上,採用「資料編織 知識圖譜」的理念進行變革設計,以因應上述問題。其中各問題的突破點如下:
#接下來是產品的詳細設計,從產品定位、應用架構、差異化競爭力和建設路徑展開介紹。
1. 產品架構
1)產品定位
#以資料編織想法提供知識圖譜式的資料管理平台,服務需要高品質資料的客戶。
註:雖然主要目標是解決AI應用訓練的資料瓶頸,但是從產品規劃角度,我們將使用者場景擴大,但凡需要資料服務的都是該產品的目標使用者。
2)產品應用架構
#從資料層到產品應用層,我們設計如下的產品架構:
資料層:支援存取不同種類資料類型,以及結構化資料和非結構化數據,AI訓練的資料類別較多,尤其是多模態應用更需要多種類型的資料。
儲存層:針對資料的離散性,要支援資料在不同位置的存儲,從雲端資料到本地資料都需要支援存取。
資料管理平台:本次需要設計的核心產品,主要包含四塊:
資料服務:在設計完平台後,需要預留對外服務的出口,從產品的定位出發,以toB客戶為主,所以既要考慮可視化服務、也要提供API類的服務。
圖註:天眼查截圖只用於學習參考
2. 商業化
產品一旦落地,商業化是無法取得的,所以在產品規劃階段需要將商業化方向先考慮清楚,從以下3個關鍵面向考慮:
1)販賣內容
#針對B端客戶,我們提供兩類販賣內容,包括「資料管理平台」標品和「技術方案」。
2)販賣方式
#B端產品常見的兩種販售模式“通路合作”和“直銷”,在本產品中也採用這些方式。
3)差異化優勢
#既然是基於新的設計思維打造的資料管理平台,那麼在產品銷售過程中,就需要體現出與傳統資料管理平台的差異化優勢,才能後來居上,吸引用戶,我們可以概況為以下3個優勢點:
產品的成熟還需要有持續的建設路徑,在本產品建設過程中,立足“項目打磨產品”,分兩個2個大的階段進行建設。
本文圍繞著AI應用訓練的瓶頸展開敘述,對AI訓練難點進行總結並結合IDC分析報告,得出「數據」是最大瓶頸的結論,並針對該問題思考解決策略。
以資料編織與知識圖譜的概念進行產品變革設計,從產品定位、產品架構、應用場景等角度詳細介紹了一個「資料找人」的智慧化資料管理平台,同時也介紹了產品後續的商業推廣思路及建設路徑,對有數據應用場景的客戶,如AI訓練平台,數據標註平台,甚至是傳統數據管理產品需要改造升級的客戶可以提供幫助。
後續我們會進一步探索將資料編織的想法擴展到模型並行訓練的實際過程中,尋求更多的資料高效化的可行性。
專欄作家
Eric_d,人人都是產品經理專欄作家。我熱衷於專注於AI、大數據和其他領域,擁有出色的需求分析、產品流程和架構設計技能,同時喜歡健行。
本文為人人都是產品經理《原創激勵計畫》出品。
題圖來自 Unsplash,基於CC0協定。
以上是AI產業應用:資料編織助力AI應用訓練突破的詳細內容。更多資訊請關注PHP中文網其他相關文章!