5月26日,網易伏羲有靈眾包平台在中國國際大數據產業博覽會上首次亮相。該平台是網易伏羲基於自身研發的人機協作線上任務平台,目前市場上獨一無二地支援即時人機互動標註方式的眾包平台。伏羲有靈眾包平台的目標是為各行各業解決勞動力短缺問題,並為整個社會提供更多便利、有趣的線上就業機會。企業客戶可以透過該平台快速建模並發布任務,而每個零工用戶則可以自由領取任務,不受時間和地理的限制。透過這種方式,伏羲有靈眾包平台為企業和個人提供了更有效率和更靈活的工作模式。
在當今時代,人工智慧技術正迅速改變著人類的生活和工作方式。隨著大語言模型、多模態大模型等人工智慧技術的快速發展,數據標註這一領域迎來了一個蓬勃發展的新時代。各個領域不斷湧現大量的數據,然而在這個令人興奮的時代,需求方和提供者都面臨著巨大的挑戰。他們需要找到一種高效率的方式,以提供高品質、低成本的數據支撐。這不僅關係到人工智慧技術的精確性和實用性,也關乎整個產業的發展前景。因此,數據標註產業需要不斷創新和改進,以滿足人工智慧技術的需求,推動產業的持續發展。
為了適應大數據時代的趨勢,許多人工智慧企業開始建立資料訓練師的培訓和管理體系,不斷進行技術創新和提高資料品質。然而,隨著勞動成本的上升,越來越多的組織開始尋找更有效率和經濟的數據標註方式。網易伏羲有靈眾包平台應運而生,基於HITL(Human-in-the-Loop)的思路。
在本屆資料博會上,伏羲有靈眾包平台展現了其獨特的能力優勢:將人類的智力和決策力與機器學習的運算能力相結合,實現了高品質的數據標註。透過細緻而嚴謹的標註流程和科學的評分系統,平台維護了數據的準確性和可靠性。同時,伏羲有靈也採取了一系列前沿的技術舉措,包括降低成本、縮短標註週期和保證數據質量,以提高效率和效果。
資料閉環
標註員在完成資料標註後,平台提供即時回流模型訓練的支持,任務發佈者可以評估模型訓練前後的效果對比,感受資料標註結果對模型的最佳化提升,並自動更新模型。更新後的模型能夠輔助後續的資料標註任務,進一步提升資料標註的品質與效率。
資料全檢
平台支援自動質檢全量任務數據,任務發布者可以靈活配置質檢流程,平台將結合用戶歷史做任務水準及使用者畫像,進行任務質檢,同時引入模型參與質檢,實現AI與人同時參與品質把控,最終實現任務高準確率交付。
用戶畫像
平台擁有完整的用戶畫像和任務匹配機制,基於用戶過往做任務成績並結合用戶個人標籤數據,實現根據不同任務類型的多樣化需求進行匹配,將任務分配給最擅長的人來做,從而滿足資料標註任務的品質、效率和成本要求。
群體智慧
平台將基於使用者畫像定位多元化的標註員,引入冗餘標註的形式,透過區間估計和真值推論等演算法方式,實現他們共同參與標註決策並獲得最終標註結果,確保最終結果的客觀性和準確性。
就平台負責人介紹:目前平台上以認知類工作內容為主,來自AIGC等人工智慧技術對文字、圖片、語音等多模態資料的擷取與標註需求;隨著5G等通訊技術的廣泛應用,平台未來會更多的承接遠端操控等決策類任務,基於數位孿生技術將線下工作數位化線上化,讓使用者在數位孿生環境中遊戲化做任務,快樂工作。
網易伏羲有靈平台透過AI技術和人工標註,確保資料標註的品質與準確性,並提升資料標註效率。它不僅為企業提供了可靠且有效率地數據服務,並為AI技術蓬勃發展做出了貢獻。
展會同期,網易伏羲實驗室吳潤澤博士也圍繞《網易伏羲數據眾包賦能大模型應用實踐》的主題展開了分享。
吳博士表示:網易伏羲從2019年開始深耕大模型技術,以文字預訓練和多模態預訓練為主要切入點,依托資料眾包平台提供高品質資料回饋閉環,攻克了統一表徵建構、分散式物件儲存、大規模向量引擎等關鍵技術挑戰,入選浙江省「尖兵計畫」獲得官方認可資助,成功孵化了丹青約美術平台以及遊戲智慧NPC等兩大遊戲垂域落地產品。
目前,伏羲有靈眾包平台已在網易集團內部多個產品及場景中應用實踐:在《逆水寒》手遊的開放世界中,情感細膩、反應靈敏、動作真實、表情豐富的智慧NPC深受玩家的喜愛。而智慧NPC的背後需要大量的優質Human Feedback數據作支撐。
網易伏羲有靈眾包為遊戲中的智慧NPC模型提供涉及語音擷取、文字標註、情緒判斷、圖片標註等多數據服務,最終支援創造文字、語音、表情動作等多維度智能化的遊戲NPC。這是網易在遊戲引擎及AI領域累積深度融合,解決大規模算力資料及預訓練模型閉環問題。
目前,網易伏羲有靈眾包平台已處理了上億級數據量,在保證遊戲AI性能同時,更加高效地收集遊戲玩家反饋,並進一步提升AI性能,從而將科技應用在更多元場景中。網易伏羲將本著開放、合作、共贏的概念,邀請產業鏈上、下游的合作夥伴,共同打造全新的AI 數位新時代。
以上是智慧數據標註解決方案:迎接大模型時代的靈眾包平台的詳細內容。更多資訊請關注PHP中文網其他相關文章!