9 月8 日消息,目前市面上已經有不少能夠輔助寫程式碼的AI 產品了,在今日的外灘大會分論壇上,螞蟻集團首次開源了程式碼大模型CodeFuse,加入這一市場競爭中。
據介紹,這是螞蟻自研的程式碼產生專屬大模型,可以根據開發者的輸入提供智慧建議和即時支持,幫助開發者自動產生程式碼、自動增加註解、自動產生測試案例、修復和最佳化程式碼等,以提升研發效率。
螞蟻集團表示,無論是初學者還是有經驗的開發者,CodeFuse 都能夠大大提高編程效率和準確性,使每個人都能夠編程和創新成為現實
CodeFuse 基於螞蟻基礎大模型研發,在近期代碼補全的HumanEval 評測中,CodeFuse 得分74.4%,超過GPT-4(67%)的成績,也超過了WizardCoder-34B 73.2% 的得分。本次開源內容包含程式碼框架、模型等,現已上架相關平台,本站小夥伴可在 HuggingFace 下載模型。
程式碼框架部分包括自研的多任務微調(Multi-task fine-tuning,縮寫為 MFT)框架。 MFT 支援程式碼產生、程式碼翻譯、測試案例產生、bug 修復等數 10 個任務一起微調。 MFT 微調框架支援螞蟻自研模型,以及多個開源大模型的程式碼能力微調。同時,框架內含創新的微調資料打包技術,號稱可提升微調速度約 8 倍;並使用多重部署最佳化技術,使推理加速約 2 倍。
模型部分包括 CodeFuse13B-4K、CodeFuse-CodeLlaMa34B-MFT 兩個大模型。在模型訓練過程中,CodeFuse 使用了程式分析校驗技術,對高品質程式碼資料進行篩選,並建立了程式碼領域專用字典,編碼平均長度低 10% 。
螞蟻集團透露,CodeFuse 早在今年6 月就開始內測,用以真實開發環境,可以助力開發者低門檻編程,例如用自然語言編寫H5 小遊戲、快速開發支付寶小程序等。基於 CodeFuse 的應用場景有開發助手、IDE 外掛程式、資料分析器等,涵蓋了目前研發工作的主要需求,在螞蟻集團內部研發流程中陸續得到驗證。
以上是程式設計師 AI 助理新競品,螞蟻集團宣布開源程式碼大模型 CodeFuse的詳細內容。更多資訊請關注PHP中文網其他相關文章!