想了解更多AIGC的內容,請造訪:
51CTO AI.x社群
https://www.51cto.com/ aigc/
最近,有很多人在為AI 取代自己的工作而擔憂。
上個月火遍AI圈的「首位AI 程式設計師」Devin,利用大模型能力已經掌握了全端技能,只需要人類給出自然語言指令,就可以自動完成複雜的程式碼任務。
Devin展示的工具能力非常驚艷,特別是這款自走閉源路線的新創公司。目前只有少數人才能使用這種內測名額的人才能夠擁有。
本週二,普林斯頓大學NLP組的研究人員發布了SWE-agent——一個開源版AI程式設計師,不到一天就獲得了上千的GitHub Star數量。這個SWE-agent是基於深度學習的技術,能夠自動編寫高效且可靠的程式碼。他的發布引起了廣泛的關注,許多開發者對他的技術和性能表示了高度的認可。這些成就也證明了NLP領域在AI研
#SWE-agent 是一款用於自主解決 GitHub 儲存庫中問題的新系統。它在 SWE-bench 上獲得了與 Devin 相似的準確度,平均耗時 93 秒。
- 專案網站:https://swe-agent.com/
- GitHub :https://github.com/princeton-nlp/SWE-agent
#該專案的作者John Yang 表示,相關論文的預印版也將在4 月10 號上傳。
從原理上看,SWE-agent 透過將大模型(例如 GPT-4)轉變為軟體工程智能體,可以修復真實 GitHub 儲存庫中的錯誤和問題。
在完整的 SWE-bench 測試集上,SWE-agent 解決了 12.29% 的問題,並實現了 SOTA 效能。
為了提供開發過程中的自動化,SWE-agent 透過與專用終端互動來運作,它可以開啟、搜尋檔案內容,使用自動語法檢查、編輯特定行,也可以編寫並執行測試。
該專案的開發者精心設計了 UI 介面,並在 GitHub 上進行了介紹。
智能體- 電腦介面(ACI)
#研究團隊設計了簡單的以大模型(LM)為中心的指令與回饋格式,使大模型能夠更方便地瀏覽儲存庫、檢視、編輯和執行程式碼文件,這被稱為智慧體- 電腦介面(ACI)。研究團隊也建立了 SWE 智能體儲存庫,以便輕鬆迭代儲存庫層級編碼智慧體的 ACI 設計。
就像語言模型需要良好的提示工程(prompt engineering)一樣,良好的 ACI 設計在使用智能體時會帶來更好的結果。沒有經過良好調整的 ACI 的基線智能體的表現比 SWE-agent 差得多。
SWE-agent 包含研究團隊在智慧體- 電腦介面設計過程中發現的非常有用的功能,包括:
1.新增一個在發出編輯命令時運行的linter,如果程式碼語法不正確,則不會讓編輯命令通過。
2. 為智能體提供一個專門建置的檔案檢視器。研究團隊發現此文件檢視器在每輪僅顯示 100 行時效果最佳,且該文件編輯器具有上下滾動以及在文件中執行搜尋的命令。
3. 為智能體提供專門建置的全目錄字串搜尋指令。研究團隊發現該工具簡潔地列出匹配項非常重要 —— 只需列出至少有一個匹配項的每個文件。該研究表明,向模型顯示有關每個匹配的更多上下文對於模型來說太混亂了。
4. 當指令的輸出為空時,傳回一則訊息:「您的指令已成功執行,但未產生任何輸出」。
未來發布的論文將詳述更多資訊。
安裝與使用
要使用SWE-agent,首先要設定如下條件:
1. 安裝Docker ,並在本地啟動Docker;
2. 安裝Miniconda,並使用conda env create -fenvironment.yml 創建swe-agent 環境;
3. 使用 conda activate swe-agent 啟動;
#4. 運行./setup.sh 建立swe-agent docker 映像;
- # 5. 在此儲存庫的根目錄下建立一個keys.cfg 檔案並填入下列內容:
-
OPENAI_API_KEY: 'OpenAI API Key Here if using OpenAI Model (optional)'ANTHROPIC_API_KEY: 'Anthropic API Key Here if using Anthropic Model (optional)'GITHUB_TOKEN: 'GitHub Token Here (required)'
- SWE-agent pipeline 包含兩個步驟:
第一步:SWE-agent 接收輸入的GitHub 問題,並傳回嘗試修復它的拉取請求(pull request);
如果想在整個 SWE-bench 上執行和評估,最簡單的方法是使用 x86 機器。
python run.py --model_name gpt4 \--data_path https://github.com/pvlib/pvlib-python/issues/1603 --config_file config/default_from_url.yaml
python run.py --model_name gpt4 \--per_instance_cost_limit 2.00 \--config_file ./config/default.yaml如果想要執行SWE-bench 中的單一問題,可以使用--instance_filter:
python run.py --model_name gpt4 \--instance_filter marshmallow-code__marshmallow-1359###想了解更多AIGC的內容,請造訪:#########51CTO AI.x社群######https://www.51cto.com/ aigc/#########
以上是開源版AI程式設計師來了:GPT-4加持,能力比肩Devin,一天1.4k Star的詳細內容。更多資訊請關注PHP中文網其他相關文章!

介紹 恭喜!您經營一家成功的業務。通過您的網頁,社交媒體活動,網絡研討會,會議,免費資源和其他來源,您每天收集5000個電子郵件ID。下一個明顯的步驟是

介紹 在當今快節奏的軟件開發環境中,確保最佳應用程序性能至關重要。監視實時指標,例如響應時間,錯誤率和資源利用率可以幫助MAIN

“您有幾個用戶?”他扮演。 阿爾特曼回答說:“我認為我們上次說的是每週5億個活躍者,而且它正在迅速增長。” “你告訴我,就像在短短幾週內翻了一番,”安德森繼續說道。 “我說那個私人

介紹 Mistral發布了其第一個多模式模型,即Pixtral-12b-2409。該模型建立在Mistral的120億參數Nemo 12B之上。是什麼設置了該模型?現在可以拍攝圖像和Tex

想像一下,擁有一個由AI驅動的助手,不僅可以響應您的查詢,還可以自主收集信息,執行任務甚至處理多種類型的數據(TEXT,圖像和代碼)。聽起來有未來派?在這個a


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

Atom編輯器mac版下載
最受歡迎的的開源編輯器

SAP NetWeaver Server Adapter for Eclipse
將Eclipse與SAP NetWeaver應用伺服器整合。

PhpStorm Mac 版本
最新(2018.2.1 )專業的PHP整合開發工具

Dreamweaver CS6
視覺化網頁開發工具

mPDF
mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),