本週一,Stability AI 開源了小體量預訓練模型 Stable Code Instruct 3B。
Stable Code Instruct 3B 是建立在 Stable Code 3B 基礎上的指令調整編碼語言模型(Code LM)。透過提供自然語言提示,該模型可應用於多種任務,包括程式碼生成、數學問題以及其他與軟體工程相關的任務。
Stability AI聲稱,他們的模型在規模為3B時表現出了最先進的性能,優於CodeLlama的7B Instruct等更大規模的模型,在軟體工程相關任務中,甚至與StarChat的15B模型性能相當。
- #模式:https://huggingface.co/stabilityai/stable- code-instruct-3b
- HuggingFace 試試:https://huggingface.co/spaces/stabilityai/stable-code-instruct-3b
- Stable Code 技術報告:https://static1.squarespace.com/static/6213c340453c3f502425776e/t/6601c5713150412edcd56f8e/1711392114564/Stable_Code_TechReport_release.pdf
Stable Code Instruct 3B已經升級了程式碼補全功能,並且支援自然語言交互,旨在提高程式設計和軟體開發任務的效率和直覺性。實驗結果顯示,這個模型在各種編碼相關任務中表現優異,超過了Codellama 7B Instruct和DeepSeek-Coder Instruct 1.3B等競爭對手模型。
方法介紹
Stable Code 建立在 Stable LM 3B 的基礎上。 Stable Code 是因果純解碼器transformer,類似於LLaMA 架構,與LLaMA 的主要區別如下:
- 位置嵌入,旋轉位置嵌入應用於頭嵌入維度的前25%,以提高吞吐量;
- 標準化,帶有學得偏差項的LayerNorm;
- 偏差,除了鍵、查詢和值投影的偏差,Stable Code 從前饋網路和多頭自註意力層中刪除了所有偏差項。
下表給出了預訓練語料庫資料集的取樣權重、 epoch、類別等資訊。
#根據Stack Overflow 2023 開發者調查報告,Stable Code Instruct 3B 重點專注於Python、Javascript、Java、C、C 和Go 等語言,這些語言對於各種開發人員來說是最受歡迎和最有影響力的。雖然這些語言被選為訓練的重點,但該模型也針對其他廣泛採用的語言(例如 SQL、PHP 和 Rust)進行了訓練。
即使對於原本未包含在訓練集中的語言(例如Lua),Stable Code Instruct 3B 也能提供強大的測試性能。這種熟練程度可能源自於其對底層編碼原理的理解,以及利用編碼任務固有的可預測性,在不同程式環境中適應概念的能力。
Stable Code Instruct 3B 不僅精通程式碼生成,還精通 FIM(Fill in the Middle)任務、資料庫查詢、程式碼翻譯、解釋和創建。其指令調整使其能夠理解並按照細緻入微的指令採取行動,促進除簡單代碼完成之外的廣泛編碼任務,包括數學理解、邏輯推理和圍繞軟體開發處理複雜的技術描述。
效能評估
與Codellama 7B Instruct 和DeepSeek-Coder Instruct 1.3B 等領先模型相比,Stable Code Instruct 3B 在一系列編碼任務中展現出卓越的表現。
研究團隊也在 Multi-PL 基準上比較了三種模型。儘管參數量較少,但 Stable Code Instruct 3B 在所有語言上的表現都明顯優於 CodeLlama Instruct。
下表8 展示了幾個模型在FIM 任務上的表現:
實驗測試表明,Stable Code Instruct 3B 在程式碼完成準確性、對自然語言指令的理解以及跨不同程式語言的能力方面可與其他模型媲美甚至超越。
Stable Code Instruct 3B 的參數規模和低硬體要求使其可供廣泛的受眾使用,使開發人員能夠更有效率地工作。值得一提的是,Stable Code Instruct 3B 現在可以透過 Stability AI 會員資格用於商業目的。
以上是Stability AI開源3B程式碼產生模型:可補全,還能Debug的詳細內容。更多資訊請關注PHP中文網其他相關文章!

法律技術革命正在獲得動力,促使法律專業人員積極採用AI解決方案。 對於那些旨在保持競爭力的人來說,被動抵抗不再是可行的選擇。 為什麼技術採用至關重要? 法律專業人員

許多人認為與AI的互動是匿名的,與人類交流形成了鮮明的對比。 但是,AI在每次聊天期間都會積極介紹用戶。 每個單詞的每個提示都經過分析和分類。讓我們探索AI Revo的這一關鍵方面

成功的人工智能戰略,離不開強大的企業文化支撐。正如彼得·德魯克所言,企業運作依賴於人,人工智能的成功也同樣如此。 對於積極擁抱人工智能的組織而言,構建適應AI的企業文化至關重要,它甚至決定著AI戰略的成敗。 西蒙諾諮詢公司(West Monroe)近期發布了構建蓬勃發展的AI友好型企業文化的實用指南,以下是一些關鍵要點: 1. 明確AI的成功模式: 首先,要對AI如何賦能業務有清晰的願景。理想的AI運作文化,能夠實現人與AI系統之間工作流程的自然融合。 AI擅長某些任務,而人類則擅長創造力、判

Meta升級AI助手應用,可穿戴式AI時代來臨!這款旨在與ChatGPT競爭的應用,提供文本、語音交互、圖像生成和網絡搜索等標準AI功能,但現在首次增加了地理位置功能。這意味著Meta AI在回答你的問題時,知道你的位置和正在查看的內容。它利用你的興趣、位置、個人資料和活動信息,提供最新的情境信息,這在以前是無法實現的。該應用還支持實時翻譯,這徹底改變了Ray-Ban眼鏡上的AI體驗,使其實用性大大提升。 對外國電影徵收關稅是對媒體和文化的赤裸裸的權力行使。如果實施,這將加速向AI和虛擬製作的

人工智能正在徹底改變網絡犯罪領域,這迫使我們必須學習新的防禦技巧。網絡罪犯日益利用深度偽造和智能網絡攻擊等強大的人工智能技術進行欺詐和破壞,其規模前所未有。據報導,87%的全球企業在過去一年中都成為人工智能網絡犯罪的目標。 那麼,我們該如何避免成為這波智能犯罪的受害者呢?讓我們探討如何在個人和組織層面識別風險並採取防護措施。 網絡罪犯如何利用人工智能 隨著技術的進步,犯罪分子不斷尋找新的方法來攻擊個人、企業和政府。人工智能的廣泛應用可能是最新的一個方面,但其潛在危害是前所未有的。 特別是,人工智

最好將人工智能(AI)與人類智力(NI)之間的複雜關係理解為反饋循環。 人類創建AI,對人類活動產生的數據進行培訓,以增強或複制人類能力。 這個AI

Anthropic最近的聲明強調了有關尖端AI模型缺乏了解,引發了專家之間的激烈辯論。 這是一個真正的技術危機,還是僅僅是通往更秘密的道路上的臨時障礙

印度是一個多元化的國家,具有豐富的語言,使整個地區的無縫溝通成為持續的挑戰。但是,Sarvam的Bulbul-V2正在幫助彌合其高級文本到語音(TTS)T


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

Dreamweaver CS6
視覺化網頁開發工具

VSCode Windows 64位元 下載
微軟推出的免費、功能強大的一款IDE編輯器

SublimeText3 Linux新版
SublimeText3 Linux最新版

禪工作室 13.0.1
強大的PHP整合開發環境

Safe Exam Browser
Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。