這些模型目前有三種不同的大小,已經在600多種程式語言(包括低資源語言)上進行了培訓,以幫助企業在其開發工作流程中加速各種與程式碼相關的任務,它們是在開放的BigCode專案下開發的,該專案是ServiceNow和Huging Face共同發起的,以確保負責任地開發和使用大型程式碼語言模型,在開放負責任的AI許可證下,它們是免費提供的。
StarCoder2的推出證實了開放的科學合作和負責任的AI實踐與道德數據供應鏈的結合可以帶來巨大的力量。 ServiceNow的StarCoder2開發團隊負責人和BigCode的共同負責人Harm de Vries在聲明中指出,新的開放存取模式不僅改善了先前的GenAI效能,也提升了開發人員的生產效率,讓他們更容易取得程式碼產生AI的好處,從而使得任何規模的企業都能更輕鬆地實現其全部業務潛力。
StarCoder2:滿足三種不同需求的三種型號
BigCode的最新產品不僅僅是StarCoder LLM的升級,它引入了三種不同規模的模型:3B、7B和15B ,並且擴展了支援的程式語言達到了619種。在新一代產品中,被稱為Stack的模型訓練資料量比之前增加了將近七倍。這意味著BigCode不斷進化,為開發者提供更強大和全面的工具和資源,以幫助他們在各種程式設計任務中取得成功。這種創新精神和不斷改進的態度使得BigCode成為開發者們信賴和依賴的首選平台,為他們提供了更廣泛的學習和應用機會。 BigCode的發展展示了對技術和程式設計領域的持續投入和關注,為整個行業帶來了新的可能性和機會。
BigCode社群採用了最新一代的訓練技術,以確保模型能夠理解和產生低資源程式語言,例如COBOL、數學和程式原始碼。這種方法對於幫助使用者更好地掌握多樣化的程式語言和程式碼討論至關重要。
30億參數模型採用了ServiceNow的Fast LLM框架進行訓練,而7B模型則是基於Hugging Face的Nantron框架開發的。這兩種模型都旨在為文字到程式碼和文字到工作流程生成提供高效能,同時又需要較少的運算資源。
同時,使用端到端的英偉達 Nemo雲端本地框架和英偉達 TensorRT-LLM軟體對最大的150億參數模型進行了訓練和最佳化。
儘管這些機型在不同編碼場景下的表現仍有待觀察,但兩家公司注意到最小的3B模型的性能與最初的15B StarCoder LLM相當。
根據他們的需求,企業團隊可以使用這些模型中的任何一個,並根據不同用例的企業資料對其進行進一步的微調,這可以是任何特殊任務,從應用程式原始碼生成、工作流程產生和文字摘要到程式碼完成、高級程式碼摘要和程式碼片段檢索。
兩家公司強調,這些模型經過更廣泛和深入的培訓,能夠提供更具上下文感知性和準確性的預測。這種高度訓練的模型能夠更好地理解儲存庫的背景資訊。最終,這些努力為加速開發工作鋪平了道路,使工程師和開發人員能夠將更多精力集中在更關鍵的任務上。
英偉達應用研究副總裁Jonathan Cohen在新聞聲明中表示:“由於每個軟體生態系統都有專有的程式語言,程式碼LLM可以推動每個行業在效率和創新方面的突破。”
“英偉達與ServiceNow和Huging Face的合作引入了安全、負責任的開發模式,並支持更廣泛地接觸負責任的GenAI,我們希望這將使全球社會受益”,他補充道。
如何開始使用StarCoder2?
如前所述,StarCoder2系列中的所有模型都是在Open Rail-M許可證下提供的,可以免版稅存取和使用。支援程式碼可以在BigCode專案的GitHub庫中找到。作為另一種選擇,團隊也可以下載並使用擁抱臉的所有三個模型。
也就是說,由英偉達培訓的15B模型也將出現在英偉達 AI Foundation上,使開發人員能夠直接從他們的瀏覽器或透過API端點進行試驗。
雖然StarCoder不是AI驅動的程式碼產生領域的第一個進入者,但該專案的最新一代帶來的廣泛選擇肯定允許企業在應用程式開發中利用LLMS,同時還可以節省運算。
該領域的其他知名參與者包括OpenAI和亞馬遜,前者提供Codex,為GitHub聯合試點服務提供支持,而後者提供CodeWhisper工具,還有來自Replit和Codenium的激烈競爭,Replit在Hugging Face上有幾個小型AI編碼模型,Codenium最近以5億美元的估值獲得了6500萬美元的B輪融資。
以上是英偉達、Hugging Face和ServiceNow發布用於程式碼生成的新StarCoder2 LLM的詳細內容。更多資訊請關注PHP中文網其他相關文章!

對於那些可能是我專欄新手的人,我廣泛探討了AI的最新進展,包括體現AI,AI推理,AI中的高科技突破,及時的工程,AI培訓,AI,AI RE RE等主題

歐洲雄心勃勃的AI大陸行動計劃旨在將歐盟確立為人工智能的全球領導者。 一個關鍵要素是建立了AI Gigafactories網絡,每個網絡都有大約100,000個高級AI芯片 - 2倍的自動化合物的四倍

微軟對AI代理申請的統一方法:企業的明顯勝利 微軟最近公告的新AI代理能力清晰而統一的演講給人留下了深刻的印象。 與許多技術公告陷入困境不同

Shopify首席執行官TobiLütke最近的備忘錄大膽地宣布AI對每位員工的基本期望是公司內部的重大文化轉變。 這不是短暫的趨勢。這是整合到P中的新操作範式

IBM的Z17大型機:集成AI用於增強業務運營 上個月,在IBM的紐約總部,我收到了Z17功能的預覽。 以Z16的成功為基礎(於2022年推出並證明持續的收入增長

解鎖不可動搖的信心,消除了對外部驗證的需求! 這五個CHATGPT提示將指導您完全自力更生和自我感知的變革轉變。 只需複制,粘貼和自定義包圍

人工智能安全與研究公司 Anthropic 最近的一項[研究]開始揭示這些複雜過程的真相,展現出一種令人不安地與我們自身認知領域相似的複雜性。自然智能和人工智能可能比我們想像的更相似。 窺探內部:Anthropic 可解釋性研究 Anthropic 進行的研究的新發現代表了機制可解釋性領域的重大進展,該領域旨在反向工程 AI 的內部計算——不僅僅觀察 AI 做了什麼,而是理解它在人工神經元層面如何做到這一點。 想像一下,試圖通過繪製當有人看到特定物體或思考特定想法時哪些神經元會放電來理解大腦。 A

高通的龍翼:企業和基礎設施的戰略飛躍 高通公司通過其新的Dragonwing品牌在全球範圍內積極擴展其範圍,以全球為目標。 這不僅僅是雷布蘭


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

WebStorm Mac版
好用的JavaScript開發工具

DVWA
Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中

SublimeText3 Linux新版
SublimeText3 Linux最新版

Safe Exam Browser
Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。

MantisBT
Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。