首頁  >  文章  >  科技週邊  >  北京擬對 AI 訓練所需的算力推行統籌供給,整合大模型中文語料庫

北京擬對 AI 訓練所需的算力推行統籌供給,整合大模型中文語料庫

王林
王林轉載
2023-05-18 10:19:23924瀏覽

北京拟对 AI 训练所需的算力推行统筹供给,整合大模型中文语料库

5 月17 日消息,北京市於5 月12 日發布了關於對《北京市促進通用人工智慧創新發展的若干措施(2023-2025 年)(徵求意見稿)》(下稱《徵求意見稿》)公開徵集意見的公告,擬對AI 訓練所需的算力推行統籌供給。

北京拟对 AI 训练所需的算力推行统筹供给,整合大模型中文语料库

《徵求意見稿》提出,加強算力資源統籌供給能力,加強與頭部公有雲廠商等市場主體合作,實施算力夥伴計劃,並確定首批夥伴計畫成員,明確供給技術標準、軟硬體服務需求、算力供給規模、優惠策略等,向在京高校院所及中小企業公佈一批優質算力供應商。

《徵求意見稿》稱,利用政府統一入口,降低公有雲採購成本,普惠中小企業,同時減少企業分別面對不同雲廠商的溝通成本。針對彈性算力需求,建置統一的多雲算力調度平台,實現異質算力環境統一管理、統一運營,方便企業在不同雲端環境上無縫、經濟、高效地運行各類人工智慧運算任務。建置北京與河北、天津、山西、內蒙古等省(市)算力集群的直連基礎光傳輸網絡,進一步提昇平台對四地算力資源感知能力,探索進行算力交易。

《徵求意見稿》也表示,針對目前大模型訓練高品質中文語料佔比過少,不利於中文語境表達及產業應用的問題,整合現有開源中文預訓練資料集和高品質網路中文資料並進行合規清洗。同時持續擴展高品質多模態資料來源,建置合規安全的中文、圖文對、音訊、視訊等大模型預訓練語料庫,透過北京國際大數據交易所社會資料專區進行定向有條件開放。

IT之家附《北京市促進通用人工智慧創新發展的若干措施(2023-2025 年)(徵求意見稿)》完整文件:點此查看


#

以上是北京擬對 AI 訓練所需的算力推行統籌供給,整合大模型中文語料庫的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:51cto.com。如有侵權,請聯絡admin@php.cn刪除