這些模型目前有三種不同的大小,已經在600多種程式語言(包括低資源語言)上進行了培訓,以幫助企業在其開發工作流程中加速各種與程式碼相關的任務,它們是在開放的BigCode專案下開發的,該專案是ServiceNow和Huging Face共同發起的,以確保負責任地開發和使用大型程式碼語言模型,在開放負責任的AI許可證下,它們是免費提供的。
StarCoder2的推出證實了開放的科學合作和負責任的AI實踐與道德數據供應鏈的結合可以帶來巨大的力量。 ServiceNow的StarCoder2開發團隊負責人和BigCode的共同負責人Harm de Vries在聲明中指出,新的開放存取模式不僅改善了先前的GenAI效能,也提升了開發人員的生產效率,讓他們更容易取得程式碼產生AI的好處,從而使得任何規模的企業都能更輕鬆地實現其全部業務潛力。
StarCoder2:滿足三種不同需求的三種型號
BigCode的最新產品不僅僅是StarCoder LLM的升級,它引入了三種不同規模的模型:3B、7B和15B ,並且擴展了支援的程式語言達到了619種。在新一代產品中,被稱為Stack的模型訓練資料量比之前增加了將近七倍。這意味著BigCode不斷進化,為開發者提供更強大和全面的工具和資源,以幫助他們在各種程式設計任務中取得成功。這種創新精神和不斷改進的態度使得BigCode成為開發者們信賴和依賴的首選平台,為他們提供了更廣泛的學習和應用機會。 BigCode的發展展示了對技術和程式設計領域的持續投入和關注,為整個行業帶來了新的可能性和機會。
BigCode社群採用了最新一代的訓練技術,以確保模型能夠理解和產生低資源程式語言,例如COBOL、數學和程式原始碼。這種方法對於幫助使用者更好地掌握多樣化的程式語言和程式碼討論至關重要。
30億參數模型採用了ServiceNow的Fast LLM框架進行訓練,而7B模型則是基於Hugging Face的Nantron框架開發的。這兩種模型都旨在為文字到程式碼和文字到工作流程生成提供高效能,同時又需要較少的運算資源。
同時,使用端到端的英偉達 Nemo雲端本地框架和英偉達 TensorRT-LLM軟體對最大的150億參數模型進行了訓練和最佳化。
儘管這些機型在不同編碼場景下的表現仍有待觀察,但兩家公司注意到最小的3B模型的性能與最初的15B StarCoder LLM相當。
根據他們的需求,企業團隊可以使用這些模型中的任何一個,並根據不同用例的企業資料對其進行進一步的微調,這可以是任何特殊任務,從應用程式原始碼生成、工作流程產生和文字摘要到程式碼完成、高級程式碼摘要和程式碼片段檢索。
兩家公司強調,這些模型經過更廣泛和深入的培訓,能夠提供更具上下文感知性和準確性的預測。這種高度訓練的模型能夠更好地理解儲存庫的背景資訊。最終,這些努力為加速開發工作鋪平了道路,使工程師和開發人員能夠將更多精力集中在更關鍵的任務上。
英偉達應用研究副總裁Jonathan Cohen在新聞聲明中表示:“由於每個軟體生態系統都有專有的程式語言,程式碼LLM可以推動每個行業在效率和創新方面的突破。”
“英偉達與ServiceNow和Huging Face的合作引入了安全、負責任的開發模式,並支持更廣泛地接觸負責任的GenAI,我們希望這將使全球社會受益”,他補充道。
如何開始使用StarCoder2?
如前所述,StarCoder2系列中的所有模型都是在Open Rail-M許可證下提供的,可以免版稅存取和使用。支援程式碼可以在BigCode專案的GitHub庫中找到。作為另一種選擇,團隊也可以下載並使用擁抱臉的所有三個模型。
也就是說,由英偉達培訓的15B模型也將出現在英偉達 AI Foundation上,使開發人員能夠直接從他們的瀏覽器或透過API端點進行試驗。
雖然StarCoder不是AI驅動的程式碼產生領域的第一個進入者,但該專案的最新一代帶來的廣泛選擇肯定允許企業在應用程式開發中利用LLMS,同時還可以節省運算。
該領域的其他知名參與者包括OpenAI和亞馬遜,前者提供Codex,為GitHub聯合試點服務提供支持,而後者提供CodeWhisper工具,還有來自Replit和Codenium的激烈競爭,Replit在Hugging Face上有幾個小型AI編碼模型,Codenium最近以5億美元的估值獲得了6500萬美元的B輪融資。
以上是英偉達、Hugging Face和ServiceNow發布用於程式碼生成的新StarCoder2 LLM的詳細內容。更多資訊請關注PHP中文網其他相關文章!

動盪遊戲:與AI代理商的遊戲開發徹底改變 Roupheaval是一家遊戲開發工作室,由暴風雪和黑曜石等行業巨頭的退伍軍人組成,有望用其創新的AI驅動的Platfor革新遊戲創作

Uber的Robotaxi策略:自動駕駛汽車的騎車生態系統 在最近的Curbivore會議上,Uber的Richard Willder推出了他們成為Robotaxi提供商的乘車平台的策略。 利用他們在

事實證明,視頻遊戲是最先進的AI研究的寶貴測試理由,尤其是在自主代理商和現實世界機器人的開發中,甚至有可能促進人工通用情報(AGI)的追求。 一個

不斷發展的風險投資格局的影響在媒體,財務報告和日常對話中顯而易見。 但是,對投資者,初創企業和資金的具體後果經常被忽略。 風險資本3.0:範式

Adobe Max London 2025對Creative Cloud和Firefly進行了重大更新,反映了向可訪問性和生成AI的戰略轉變。 該分析結合了事件前簡報中的見解,並融合了Adobe Leadership。 (注意:Adob

Meta的Llamacon公告展示了一項綜合的AI策略,旨在直接與OpenAI等封閉的AI系統競爭,同時為其開源模型創建了新的收入流。 這個多方面的方法目標bo

人工智能領域對這一論斷存在嚴重分歧。一些人堅稱,是時候揭露“皇帝的新衣”了,而另一些人則強烈反對人工智能僅僅是普通技術的觀點。 讓我們來探討一下。 對這一創新性人工智能突破的分析,是我持續撰寫的福布斯專欄文章的一部分,該專欄涵蓋人工智能領域的最新進展,包括識別和解釋各種有影響力的人工智能複雜性(請點擊此處查看鏈接)。 人工智能作為普通技術 首先,需要一些基本知識來為這場重要的討論奠定基礎。 目前有大量的研究致力於進一步發展人工智能。總目標是實現人工通用智能(AGI)甚至可能實現人工超級智能(AS

公司AI模型的有效性現在是一個關鍵的性能指標。自AI BOOM以來,從編寫生日邀請到編寫軟件代碼的所有事物都將生成AI使用。 這導致了語言mod的擴散


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 英文版
推薦:為Win版本,支援程式碼提示!

SublimeText3漢化版
中文版,非常好用

WebStorm Mac版
好用的JavaScript開發工具

VSCode Windows 64位元 下載
微軟推出的免費、功能強大的一款IDE編輯器