搜尋
首頁科技週邊人工智慧Stability AI開源3B程式碼產生模型:可補全,還能Debug

本週一,Stability AI 開源了小體量預訓練模型 Stable Code Instruct 3B。

Stable Code Instruct 3B 是建立在 Stable Code 3B 基礎上的指令調整編碼語言模型(Code LM)。透過提供自然語言提示,該模型可應用於多種任務,包括程式碼生成、數學問題以及其他與軟體工程相關的任務。

Stability AI聲稱,他們的模型在規模為3B時表現出了最先進的性能,優於CodeLlama的7B Instruct等更大規模的模型,在軟體工程相關任務中,甚至與StarChat的15B模型性能相當。

Stability AI开源3B代码生成模型:可补全,还能Debug


  • #模式:https://huggingface.co/stabilityai/stable- code-instruct-3b
  • HuggingFace 試試:https://huggingface.co/spaces/stabilityai/stable-code-instruct-3b
  • Stable Code 技術報告:https://static1.squarespace.com/static/6213c340453c3f502425776e/t/6601c5713150412edcd56f8e/1711392114564/Stable_Code_TechReport_release.pdf

Stable Code Instruct 3B已經升級了程式碼補全功能,並且支援自然語言交互,旨在提高程式設計和軟體開發任務的效率和直覺性。實驗結果顯示,這個模型在各種編碼相關任務中表現優異,超過了Codellama 7B Instruct和DeepSeek-Coder Instruct 1.3B等競爭對手模型。

方法介紹

Stable Code 建立在 Stable LM 3B 的基礎上。 Stable Code 是因果純解碼器transformer,類似於LLaMA 架構,與LLaMA 的主要區別如下:

  • 位置嵌入,旋轉位置嵌入應用於頭嵌入維度的前25%,以提高吞吐量;
  • 標準化,帶有學得偏差項的LayerNorm;
  • 偏差,除了鍵、查詢和值投影的偏差,Stable Code 從前饋網路和多頭自註意力層中刪除了所有偏差項。

Stability AI开源3B代码生成模型:可补全,还能Debug

下表給出了預訓練語料庫資料集的取樣權重、 epoch、類別等資訊。

Stability AI开源3B代码生成模型:可补全,还能Debug

Stability AI开源3B代码生成模型:可补全,还能Debug

#根據Stack Overflow 2023 開發者調查報告,Stable Code Instruct 3B 重點專注於Python、Javascript、Java、C、C 和Go 等語言,這些語言對於各種開發人員來說是最受歡迎和最有影響力的。雖然這些語言被選為訓練的重點,但該模型也針對其他廣泛採用的語言(例如 SQL、PHP 和 Rust)進行了訓練。

Stability AI开源3B代码生成模型:可补全,还能Debug

即使對於原本未包含在訓練集中的語言(例如Lua),Stable Code Instruct 3B 也能提供強大的測試性能。這種熟練程度可能源自於其對底層編碼原理的理解,以及利用編碼任務固有的可預測性,在不同程式環境中適應概念的能力。

Stable Code Instruct 3B 不僅精通程式碼生成,還精通 FIM(Fill in the Middle)任務、資料庫查詢、程式碼翻譯、解釋和創建。其指令調整使其能夠理解並按照細緻入微的指令採取行動,促進除簡單代碼完成之外的廣泛編碼任務,包括數學理解、邏輯推理和圍繞軟體開發處理複雜的技術描述。

效能評估

與Codellama 7B Instruct 和DeepSeek-Coder Instruct 1.3B 等領先模型相比,Stable Code Instruct 3B 在一系列編碼任務中展現出卓越的表現。

Stability AI开源3B代码生成模型:可补全,还能Debug

研究團隊也在 Multi-PL 基準上比較了三種模型。儘管參數量較少,但 Stable Code Instruct 3B 在所有語言上的表現都明顯優於 CodeLlama Instruct。

Stability AI开源3B代码生成模型:可补全,还能Debug

下表8 展示了幾個模型在FIM 任務上的表現:

Stability AI开源3B代码生成模型:可补全,还能Debug

實驗測試表明,Stable Code Instruct 3B 在程式碼完成準確性、對自然語言指令的理解以及跨不同程式語言的能力方面可與其他模型媲美甚至超越。

Stability AI开源3B代码生成模型:可补全,还能Debug

Stable Code Instruct 3B 的參數規模和低硬體要求使其可供廣泛的受眾使用,使開發人員能夠更有效率地工作。值得一提的是,Stable Code Instruct 3B 現在可以透過 Stability AI 會員資格用於商業目的。

以上是Stability AI開源3B程式碼產生模型:可補全,還能Debug的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
從摩擦到流:AI如何重塑法律工作從摩擦到流:AI如何重塑法律工作May 09, 2025 am 11:29 AM

法律技術革命正在獲得動力,促使法律專業人員積極採用AI解決方案。 對於那些旨在保持競爭力的人來說,被動抵抗不再是可行的選擇。 為什麼技術採用至關重要? 法律專業人員

這就是AI對您的看法,對您的了解這就是AI對您的看法,對您的了解May 09, 2025 am 11:24 AM

許多人認為與AI的互動是匿名的,與人類交流形成了鮮明的對比。 但是,AI在每次聊天期間都會積極介紹用戶。 每個單詞的每個提示都經過分析和分類。讓我們探索AI Revo的這一關鍵方面

建立蓬勃發展的AI-Ready企業文化的7個步驟建立蓬勃發展的AI-Ready企業文化的7個步驟May 09, 2025 am 11:23 AM

成功的人工智能戰略,離不開強大的企業文化支撐。正如彼得·德魯克所言,企業運作依賴於人,人工智能的成功也同樣如此。 對於積極擁抱人工智能的組織而言,構建適應AI的企業文化至關重要,它甚至決定著AI戰略的成敗。 西蒙諾諮詢公司(West Monroe)近期發布了構建蓬勃發展的AI友好型企業文化的實用指南,以下是一些關鍵要點: 1. 明確AI的成功模式: 首先,要對AI如何賦能業務有清晰的願景。理想的AI運作文化,能夠實現人與AI系統之間工作流程的自然融合。 AI擅長某些任務,而人類則擅長創造力、判

Netflix New Scroll,Meta AI的遊戲規則改變者,Neuralink價值85億美元Netflix New Scroll,Meta AI的遊戲規則改變者,Neuralink價值85億美元May 09, 2025 am 11:22 AM

Meta升級AI助手應用,可穿戴式AI時代來臨!這款旨在與ChatGPT競爭的應用,提供文本、語音交互、圖像生成和網絡搜索等標準AI功能,但現在首次增加了地理位置功能。這意味著Meta AI在回答你的問題時,知道你的位置和正在查看的內容。它利用你的興趣、位置、個人資料和活動信息,提供最新的情境信息,這在以前是無法實現的。該應用還支持實時翻譯,這徹底改變了Ray-Ban眼鏡上的AI體驗,使其實用性大大提升。 對外國電影徵收關稅是對媒體和文化的赤裸裸的權力行使。如果實施,這將加速向AI和虛擬製作的

今天採取這些步驟以保護自己免受AI網絡犯罪的侵害今天採取這些步驟以保護自己免受AI網絡犯罪的侵害May 09, 2025 am 11:19 AM

人工智能正在徹底改變網絡犯罪領域,這迫使我們必須學習新的防禦技巧。網絡罪犯日益利用深度偽造和智能網絡攻擊等強大的人工智能技術進行欺詐和破壞,其規模前所未有。據報導,87%的全球企業在過去一年中都成為人工智能網絡犯罪的目標。 那麼,我們該如何避免成為這波智能犯罪的受害者呢?讓我們探討如何在個人和組織層面識別風險並採取防護措施。 網絡罪犯如何利用人工智能 隨著技術的進步,犯罪分子不斷尋找新的方法來攻擊個人、企業和政府。人工智能的廣泛應用可能是最新的一個方面,但其潛在危害是前所未有的。 特別是,人工智

共生舞蹈:人工和自然感知的循環共生舞蹈:人工和自然感知的循環May 09, 2025 am 11:13 AM

最好將人工智能(AI)與人類智力(NI)之間的複雜關係理解為反饋循環。 人類創建AI,對人類活動產生的數據進行培訓,以增強或複制人類能力。 這個AI

AI最大的秘密 - 創作者不了解,專家分裂AI最大的秘密 - 創作者不了解,專家分裂May 09, 2025 am 11:09 AM

Anthropic最近的聲明強調了有關尖端AI模型缺乏了解,引發了專家之間的激烈辯論。 這是一個真正的技術危機,還是僅僅是通往更秘密的道路上的臨時障礙

Sarvam AI的Bulbul-V2:印度最佳TTS模型Sarvam AI的Bulbul-V2:印度最佳TTS模型May 09, 2025 am 10:52 AM

印度是一個多元化的國家,具有豐富的語言,使整個地區的無縫溝通成為持續的挑戰。但是,Sarvam的Bulbul-V2正在幫助彌合其高級文本到語音(TTS)T

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

VSCode Windows 64位元 下載

VSCode Windows 64位元 下載

微軟推出的免費、功能強大的一款IDE編輯器

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Safe Exam Browser

Safe Exam Browser

Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。