오픈 소스 AI 프로그래머가 여기 있습니다: GPT-4 축복, Devin에 필적하는 능력, 하루 1.4k 별-일체 포함-php.cn

집

기술 주변기기

일체 포함

오픈 소스 AI 프로그래머가 여기 있습니다: GPT-4 축복, Devin에 필적하는 능력, 하루 1.4k 별

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 03, 2024 pm 03:01 PM

pythondockerai기차

AIGC에 대해 자세히 알아보려면 다음을 방문하세요.

51CTO AI.x 커뮤니티

https://www.51cto.com/aigc/

최근 많은 사람들이 자신의 AI 작업을 교체하고 걱정하고 있습니다.

지난달 AI계에서 큰 인기를 끌었던 '최초의 AI 프로그래머' 데빈은 대형 모델 역량을 활용해 풀스택 기술을 마스터했으며, 자연어만 있으면 복잡한 코드 작업을 자동으로 완료할 수 있다. 인간으로부터의 지시.

Devin이 보여준 도구 기능은 매우 놀랍습니다. 특히 비공개 소스 경로를 택하는 이 스타트업 회사의 경우 더욱 그렇습니다. 현재 이 비공개 베타 할당량을 사용할 수 있는 사람은 소수입니다.

화요일, 프린스턴 대학교 NLP 그룹의 연구원들은 오픈 소스 AI 프로그래머인 SWE-agent를 출시했습니다. SWE-agent는 하루도 안 되어 수천 개의 GitHub 스타를 받았습니다. 이 SWE 에이전트는 딥러닝 기술을 기반으로 하며 효율적이고 안정적인 코드를 자동으로 작성할 수 있습니다. 그의 출시는 광범위한 관심을 끌었으며 많은 개발자들이 그의 기술과 성능에 대해 높은 평가를 표명했습니다. 이러한 성과는 NLP 분야의 AI 연구 발전을 입증하기도 합니다.

开源版AI程序员来了：GPT-4加持，能力比肩Devin，一天1.4k Star

SWE-agent는 GitHub 리포지토리의 문제를 자율적으로 해결하기 위한 새로운 시스템입니다. 평균 93초가 소요되어 SWE 벤치에서 Devin과 유사한 정확도를 달성했습니다.

开源版AI程序员来了：GPT-4加持，能力比肩Devin，一天1.4k Star

프로젝트 웹사이트: https://swe-agent.com/
GitHub: https://github.com/princeton-nlp/SWE-agent

The 프로젝트 저자인 John Yang은 관련 논문의 사전 인쇄 버전도 4월 10일에 업로드될 것이라고 말했습니다.

원칙적으로 SWE 에이전트는 대규모 모델(예: GPT-4)을 소프트웨어 엔지니어링 에이전트로 전환하여 실제 GitHub 리포지토리의 버그와 문제를 수정할 수 있습니다.

전체 SWE-벤치 테스트 세트에서 SWE-agent는 문제의 12.29%를 해결하여 SOTA 성능을 달성했습니다.

开源版AI程序员来了：GPT-4加持，能力比肩Devin，一天1.4k Star

개발 프로세스에 자동화를 제공하기 위해 SWE-agent는 파일 내용 열기, 검색, 자동 구문 검사 사용, 특정 줄 편집, 테스트 작성 및 실행이 가능한 전용 터미널과 상호 작용하여 작동합니다. .

이 프로젝트의 개발자는 UI 인터페이스를 신중하게 디자인하여 GitHub에 소개했습니다.

에이전트-컴퓨터 인터페이스(ACI)

연구팀은 대형 모델이 더 쉽게 저장소를 찾아보고, 보고, 편집하고 실행할 수 있도록 간단한 LM(대형 모델) 중심 명령 및 피드백 형식을 설계했습니다. 코드 파일을 ACI(에이전트-컴퓨터 인터페이스)라고 합니다. 또한 연구팀은 리포지토리 수준 코딩 에이전트의 ACI 설계를 쉽게 반복할 수 있도록 SWE 에이전트 리포지토리를 구축했습니다.

언어 모델에 신속한 엔지니어링이 필요한 것처럼, 좋은 ACI 디자인은 에이전트를 사용할 때 더 나은 결과로 이어집니다. 잘 조정된 ACI가 없는 기본 에이전트는 SWE 에이전트보다 성능이 훨씬 떨어집니다.

SWE-agent에는 다음을 포함하여 연구팀이 에이전트-컴퓨터 인터페이스 설계 중에 매우 유용하다고 판단한 기능이 포함되어 있습니다.

1 코드 구문이 있는 경우 편집 명령이 실행될 때 실행되는 린터를 추가합니다. 올바르지 않으면 편집 명령이 전달되지 않습니다.

2. 에이전트를 위해 특별히 제작된 파일 뷰어를 제공합니다. 연구팀은 이 파일 뷰어가 라운드당 100줄만 표시할 때 가장 잘 작동한다는 사실을 발견했으며, 파일 편집기에는 파일 내에서 위아래로 스크롤하고 검색을 수행하는 명령이 있다는 사실을 발견했습니다.

3. 에이전트를 위해 특별히 제작된 디렉터리 전체 문자열 검색 명령을 제공합니다. 연구팀은 도구 목록이 간결하게 일치하는 것이 중요하다는 사실을 발견했습니다. 최소한 하나의 일치 항목이 있는 모든 파일을 나열하면 됩니다. 연구에 따르면 각 경기에 대한 더 많은 맥락을 모델에 표시하는 것은 모델에 너무 혼란스러울 수 있다는 것이 밝혀졌습니다.

4. 명령 출력이 비어 있으면 "명령이 성공적으로 실행되었지만 출력이 생성되지 않았습니다."라는 메시지가 반환됩니다.

향후 출판되는 논문에서 더 많은 정보를 자세히 설명할 것입니다.

설치 및 사용

SWE-agent를 사용하려면 먼저 다음 조건을 설정해야 합니다.

1. Docker를 로컬로 설치하고

2. fenvironment.yml은

3. conda activate swe-agent를 사용하여

4.swe-agent 도커 이미지를 생성합니다. 5. 이 저장소의 루트 디렉터리에keys.cfg 파일을 생성하고 다음 콘텐츠를 입력합니다.

OPENAI_API_KEY: 'OpenAI API Key Here if using OpenAI Model (optional)'ANTHROPIC_API_KEY: 'Anthropic API Key Here if using Anthropic Model (optional)'GITHUB_TOKEN: 'GitHub Token Here (required)'

SWE-agent 파이프라인은 두 단계로 구성됩니다.

1단계: SWE-agent 수신 GitHub 문제를 입력하고 풀 요청을 반환하여 수정을 시도합니다.

2단계: 풀 요청을 평가하여 실제로 문제가 해결되는지 확인합니다(현재 SWE-bench 벤치마크의 문제에만 사용 가능).
전체 SWE 벤치에서 실행하고 평가하려는 경우 가장 쉬운 방법은 x86 머신을 사용하는 것입니다.

python run.py --model_name gpt4 \--data_path https://github.com/pvlib/pvlib-python/issues/1603 --config_file config/default_from_url.yaml

python run.py --model_name gpt4 \--per_instance_cost_limit 2.00 \--config_file ./config/default.yaml

SWE-bench에서 단일 질문을 실행하려면 --instance_filter를 사용할 수 있습니다.

python run.py --model_name gpt4 \--instance_filter marshmallow-code__marshmallow-1359

AIGC에 대해 자세히 알아보려면 다음을 방문하세요.

51CTO AI .x 커뮤니티

https://www.51cto.com/aigc/

위 내용은 오픈 소스 AI 프로그래머가 여기 있습니다: GPT-4 축복, Devin에 필적하는 능력, 하루 1.4k 별의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

이 기사는 51CTO.COM에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제

관련 기사

10 생성 AI 코드의 생성 AI 코딩 확장 대 코드를 탐색해야합니다.Apr 13, 2025 am 01:14 AM

이봐, 코딩 닌자! 하루 동안 어떤 코딩 관련 작업을 계획 했습니까? 이 블로그에 더 자세히 살펴보기 전에, 나는 당신이 당신의 모든 코딩 관련 문제에 대해 생각하기를 원합니다. 완료? - ’

요리 혁신 요리 : 인공 지능이 식품 서비스를 변화시키는 방법Apr 12, 2025 pm 12:09 PM

AI 식품 준비 여전히 초기 사용 중이지만 AI 시스템은 음식 준비에 점점 더 많이 사용되고 있습니다. AI 구동 로봇은 부엌에서 햄버거를 뒤집기, 피자 만들기 또는 SA 조립과 같은 음식 준비 작업을 자동화하는 데 사용됩니다

파이썬 네임 스페이스 및 가변 범위에 대한 포괄적 인 안내서Apr 12, 2025 pm 12:00 PM

소개 파이썬 기능에서 변수의 네임 스페이스, 범위 및 동작을 이해하는 것은 효율적으로 작성하고 런타임 오류 또는 예외를 피하는 데 중요합니다. 이 기사에서는 다양한 ASP를 탐구 할 것입니다

비전 언어 모델 (VLMS)에 대한 포괄적 인 안내서Apr 12, 2025 am 11:58 AM

소개 생생한 그림과 조각으로 둘러싸인 아트 갤러리를 걷는 것을 상상해보십시오. 이제 각 작품에 질문을하고 의미있는 대답을 얻을 수 있다면 어떨까요? “어떤 이야기를하고 있습니까?

Mediatek은 Kompanio Ultra 및 Dimensity 9400으로 프리미엄 라인업을 향상시킵니다.Apr 12, 2025 am 11:52 AM

제품 케이던스를 계속하면서 이번 달 Mediatek은 새로운 Kompanio Ultra and Dimensity 9400을 포함한 일련의 발표를했습니다. 이 제품은 스마트 폰 용 칩을 포함하여 Mediatek 비즈니스의 전통적인 부분을 채우고 있습니다.

이번 주 AI : Walmart는 패션 트렌드를 설정하기 전에 패션 트렌드를 설정합니다.Apr 12, 2025 am 11:51 AM

#1 Google은 Agent2agent를 시작했습니다 이야기 : 월요일 아침입니다. AI 기반 채용 담당자로서 당신은 더 똑똑하지 않고 더 똑똑하지 않습니다. 휴대 전화에서 회사의 대시 보드에 로그인합니다. 세 가지 중요한 역할이 공급되고, 검증되며, 예정된 FO가 있음을 알려줍니다.

생성 AI는 사이코브블을 만난다Apr 12, 2025 am 11:50 AM

나는 당신이되어야한다고 생각합니다. 우리 모두는 Psychobabble이 다양한 심리적 용어를 혼합하고 종종 이해할 수 없거나 완전히 무의미한 모듬 채터로 구성되어 있다는 것을 알고 있습니다. 당신이 fo를 뿌리기 위해해야 할 일

프로토 타입 : 과학자들은 종이를 플라스틱으로 바꿉니다Apr 12, 2025 am 11:49 AM

이번 주 발표 된 새로운 연구에 따르면 2022 년에 제조 된 플라스틱의 9.5%만이 재활용 재료로 만들어졌습니다. 한편, 플라스틱은 계속해서 매립지와 생태계에 전 세계에 쌓이고 있습니다. 그러나 도움이 진행 중입니다. 엥인 팀

See all articles

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

맨티스BT

Mantis는 제품 결함 추적을 돕기 위해 설계된 배포하기 쉬운 웹 기반 결함 추적 도구입니다. PHP, MySQL 및 웹 서버가 필요합니다. 데모 및 호스팅 서비스를 확인해 보세요.

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

MinGW - Windows용 미니멀리스트 GNU

이 프로젝트는 osdn.net/projects/mingw로 마이그레이션되는 중입니다. 계속해서 그곳에서 우리를 팔로우할 수 있습니다. MinGW: GCC(GNU Compiler Collection)의 기본 Windows 포트로, 기본 Windows 애플리케이션을 구축하기 위한 무료 배포 가능 가져오기 라이브러리 및 헤더 파일로 C99 기능을 지원하는 MSVC 런타임에 대한 확장이 포함되어 있습니다. 모든 MinGW 소프트웨어는 64비트 Windows 플랫폼에서 실행될 수 있습니다.