찾다
기술 주변기기일체 포함ChatGPT 버그 수정은 78%의 정확도로 현장을 휩쓸었습니다! 네티즌: 프로그래머는 행복해야 한다

​ChatGPT는 버그 수정에 얼마나 좋은가요?

마지막으로 누군가가 이 문제에 대해 진지한 연구를 하고 있습니다.

독일과 영국의 연구원들은 ChatGPT의 이 기능을 테스트하기 위해 특별히 "챌린지"를 준비했습니다.

ChatGPT 버그 수정은 78%의 정확도로 현장을 휩쓸었습니다! 네티즌: 프로그래머는 행복해야 한다

연구원들은 ChatGPT 외에도 버그를 수정하는 다른 'AI 영웅' 3명을 찾아 각각 40개의 오류 코드를 수정하도록 요청했습니다.

결과는 정말 놀랍습니다.

ChatGPT는 버그 중 31개를 정확하게 수정해 2위(21개)를 크게 앞지르며 'AI 버그 수정 세계'에서 SOTA 점수를 직접 획득했습니다!

ChatGPT 버그 수정은 78%의 정확도로 현장을 휩쓸었습니다! 네티즌: 프로그래머는 행복해야 한다

그 이후로 이 연구는 많은 네티즌들이 보고 토론하도록 유도했습니다. Reddit의 이 게시물 제목에는 "주의"와 "주의"라는 단어도 사용되었습니다. 프로그래머를 위험에 빠뜨리나요?

먼저 이 연구를 살펴보겠습니다. ChatGPT 버그 수정은 78%의 정확도로 현장을 휩쓸었습니다! 네티즌: 프로그래머는 행복해야 한다

ChatGPT는 버그 수정에 능숙합니다

ChatGPT는 버그 수정을 위해 특별히 설계된 것은 아니지만 등장 이후 많은 네티즌들이 이 기능을 발견했습니다.

그래서 ChatGPT가 버그를 어느 정도 수정할 수 있는지 알아보기 위해 연구원들은 평가를 위해 표준 오류 복구 벤치마크 세트인 QuixBugs를 도입했습니다.

그리고 이에 경쟁하는 AI 플레이어는 각각 CodeX, CoCoNut 및 Standard APR입니다.

연구원들은 QuixBugs에서 40개의 이슈를 선정하고 각각의 버그를 수정하도록 요청했습니다.

ChatGPT가 버그를 수정하도록 하는 방법은 대화 상자에서 물어보는 것입니다.

이 코드에 오류가 있습니까?

1차 경연 결과는 다음과 같습니다.

1차 전투 결과로 보면 ChatGPT는 19개 항목 수정, CodeX는 21개 항목 수정, CoCoNut은 19개 항목 수정, Standard는 APR은 7명이었습니다.

또한 연구원들은 ChatGPT의 답변이 CodeX와 가장 유사하다는 사실을 발견했습니다. 이는 동일한 언어 모델 계열에 속하기 때문입니다. ChatGPT 버그 수정은 78%의 정확도로 현장을 휩쓸었습니다! 네티즌: 프로그래머는 행복해야 한다

이때 몇몇 친구들은 "ChatGPT는 CodeX만큼 강력하지 않나요?"라고 묻습니다.

걱정하지 마세요. ChatGPT의 특징 중 하나는 더 많이 질문할수록 더 나은 결과를 얻을 수 있다는 것입니다.

예를 들어, 이 벤치마크 세트에는 bitcount라는 질문이 있습니다. ChatGPT는 첫 번째 복구 프로세스에서 잘못된 답변을 제공했습니다.

원래 ChatGPT는 7행에 n ^ = n - 1이 있어야 합니다. n & = n - 1로.

그러나 첫 번째 라운드에서는 다음과 같이 대답했습니다. ChatGPT 버그 수정은 78%의 정확도로 현장을 휩쓸었습니다! 네티즌: 프로그래머는 행복해야 한다

예상되는 동작과 문제를 일으킨 입력에 대한 추가 정보가 없으면 프로그램에 버그가 있는지 알 수 없습니다.

그래서 ChatGPT는 더 많은 정보를 제공한 후 질문에 올바르게 답변했습니다.

유추하자면, 첫 번째 라운드에서 올바르게 답변되지 않은 질문에 대해 더 많은 정보 프롬프트를 제공한 후 ChatGPT의 버그 수정 기능이 크게 향상되었습니다.

결국 ChatGPT는 QuixBugs의 40개 질문 중 31개에 답변했습니다. 정확하게는.

네티즌들은 엇갈린 감정과 기쁨을 가지고 있습니다ChatGPT 버그 수정은 78%의 정확도로 현장을 휩쓸었습니다! 네티즌: 프로그래머는 행복해야 한다

이러한 실험 결과에 대해 네티즌들은 ChatGPT의 버그 수정과 SOTA 우승에 대해 서로 다른 태도를 가지고 있습니다.

일부 네티즌들은 이 문제가 프로그래머들에게 위기감을 느끼게 하는 것이 아니라 행복감을 느끼게 해야 한다고 믿습니다.

그러한 유용한 도구가 있으면 프로그래머가 절반의 노력으로 두 배의 결과를 얻을 수 있다는 의미입니다.

그러나 이에 대해 일부 사람들은 다른 견해를 가지고 있습니다.

ChatGPT 버그 수정은 78%의 정확도로 현장을 휩쓸었습니다! 네티즌: 프로그래머는 행복해야 한다작업이 단순해진다는 것은 인력이 덜 필요하다는 것을 의미하지 않습니까?

ChatGPT 버그 수정은 78%의 정확도로 현장을 휩쓸었습니다! 네티즌: 프로그래머는 행복해야 한다

그러나 일부 네티즌들은 작업이 결코 끝나지 않는다고 느낍니다.

AI가 개발 시간을 몇 배나 단축할 수 있다고 해도 프로그래머가 다음 작업을 더 빨리 처리한다는 의미일 뿐입니다.

ChatGPT 버그 수정은 78%의 정확도로 현장을 휩쓸었습니다! 네티즌: 프로그래머는 행복해야 한다

전반적으로 ChatGPT는 버그 수정에 능숙하며 프로그래머에게 치명적인 해를 끼치 지 않습니다.

하지만 OpenAI의 다른 행동에 집중한다면 어떨까요?

코드 작성을 위한 ChatGPT 글로벌 아웃소싱 교육

이전에 OpenAI는 ChatGPT의 중요한 용도 중 하나가 프로그래머의 코드 확인을 돕는 것이라고 밝혔습니다.

즉, 사용 가능한 보조 도구로 포지셔닝됩니다.

"ChatGPT가 위협적이다"라는 견해에 비해 ChatGPT의 기능이 완전히 진화하면 프로그래머는 더 이상 버그 작성을 두려워할 필요가 없습니다.

OpenAI가 배치한 체스판에는 버그를 수정하고 타워 프로그래머 위치를 훔치는 것 이상의 기능이 있습니다.

더 크고 강력하게 만들기 위해 OpenAI는 라틴 아메리카와 동유럽에서 1,000개의 아웃소싱 포지션을 제공하도록 노출되었습니다.

아웃소싱 직원의 주요 업무는 데이터에 라벨을 지정하고 ChatGPT가 코드를 작성하도록 교육하는 것입니다.

이 1,000명 중 40%는 소프트웨어 엔지니어링 작업을 배우기 위해 OpenAI 모델용 데이터를 생성합니다.

오랫동안 OpenAI의 훈련 데이터는 GitHub에서 가져왔습니다.

초보 아웃소싱 프로그래머가 생성하는 데이터 세트에는 이제 코드 줄뿐만 아니라 코드 줄 뒤에 있는 인간 사고의 논리적 단계도 포함됩니다.

남미의 한 소프트웨어 개발자가 OpenAI에 대한 5시간 무료 코딩 테스트를 완료했다는 소식을 전했습니다.

전체 과정에서 그의 작업은 두 부분으로 나뉩니다.

  • 코딩 문제를 처리하는 방법을 영어로 설명합니다.
  • 해결책을 제공합니다.

버그가 발견되면 OpenAI에서 버그의 구체적인 상황과 해결 방법을 자세히 물어볼 것입니다.

프로그래머는 문제에 대해 생각하는 각 단계를 보여줘야 하며 OpenAI가 아마도 ChatGPT에 매우 구체적인 교육 데이터를 제공하기를 원할 것이라고 추측합니다.

Tesla의 전 AI 디렉터인 Andrej Karpathy는 Twitter에서 다음과 같이 놀렸습니다.

최신 인기 프로그래밍 언어는 영어입니다.

ChatGPT 버그 수정은 78%의 정확도로 현장을 휩쓸었습니다! 네티즌: 프로그래머는 행복해야 한다

그래도 ChatGPT가 강력한 버그 수정 기능을 가지고 있다는 것은 좋은 일이고, 실제로 코드의 암기적인 부분을 완성할 수 있을 정도로 발전할 수 있다면 좋은 일입니다.

결국 OpenAI가 창립 당시 밝힌 목적은 “일반 인공지능이 모든 인류에게 혜택을 줄 수 있도록 보장”하는 것이었습니다.

언뜻 보기에 이 회사가 수년에 걸쳐 해온 일은 더 많은 사람들을 실업자로 만들기 위해 일부 사람들의 노력을 이용하는 것처럼 보입니다.

Dota2 경기장에서 인간을 짓밟는 것부터 GPT-3, DALL-E2, ChatGPT의 눈부신 성능까지, 그것이 가져오는 신제품에는 항상 "xxx가 곧 직업을 잃을 것"이라는 논의가 동반됩니다.

하지만 무슨 일이 있어도 사업은 항상 그것을 선호해 왔습니다.

현재 OpenAI의 주요 비즈니스 모델은 API 수수료, 토큰 수수료 및 소프트웨어 라이선스입니다.

OpenAI는 최근 ChatGPT의 유료 버전인 ChatGPT Pro도 출시했는데, 가격은 월 US$42(약 RMB 285)입니다.

ChatGPT 버그 수정은 78%의 정확도로 현장을 휩쓸었습니다! 네티즌: 프로그래머는 행복해야 한다

비온 뒤 버섯처럼 로봇 대화 스타트업이 생겨나고 있지만, 시장이 OpenAI에 대해 계속 낙관하고 있다는 징후가 많이 있습니다.

Microsoft는 방금 OpenAI에 수십억 달러를 투자하고 OpenAI의 모델을 Microsoft Bing과 같은 소비자 및 기업 제품에 통합할 것이라고 발표했습니다.

이 문제에 정통한 사람들에 따르면 추가 투자 금액은 약 100억 달러입니다.

동시에 WSJ는 1월 초 억만장자 Peter Thiel이 설립한 벤처 캐피탈 펀드인 Founders Fund가 OpenAI에 투자하기 위해 협상 중이라고 공개했습니다.

펀딩 금액이 최소 3억달러에 달할 것으로 알려졌습니다.

한 가지 더

첫 번째 실험에서 ChatGPT는 QuixBugs 데이터 세트의 비트 수 문제를 해결하지 못했습니다.

그러나 지금 이 질문을 다시 묻는다면 ChatGPT가 "모든 것을 다시 통과"할 수 있다는 것을 알게 될 것입니다.

ChatGPT 버그 수정은 78%의 정확도로 현장을 휩쓸었습니다! 네티즌: 프로그래머는 행복해야 한다

이것은 ChatGPT가 이 연구 과정에서 이 문제를 해결하는 방법을 배웠다는 의미입니까?

참조 링크:

[1] ​​https://www.php.cn/link/5f5d472067f77b5c88f69f1bcfda1e08​​​
[2] ​​​https://www.php.cn/link/8a47481ae534860850adf59f145e6b40​ ​​
[3] ​​​https://www.php.cn/link/7806689d934e610d660caf5536fea0b2​​​
[4] ​​​https://www.php.cn/link/4271846620d203fd0511c422d483cdbd​

위 내용은 ChatGPT 버그 수정은 78%의 정확도로 현장을 휩쓸었습니다! 네티즌: 프로그래머는 행복해야 한다의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명
이 기사는 51CTO.COM에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제
가장 많이 사용되는 10 개의 Power BI 차트 -Axaltics Vidhya가장 많이 사용되는 10 개의 Power BI 차트 -Axaltics VidhyaApr 16, 2025 pm 12:05 PM

Microsoft Power BI 차트로 데이터 시각화의 힘을 활용 오늘날의 데이터 중심 세계에서는 복잡한 정보를 비 기술적 인 청중에게 효과적으로 전달하는 것이 중요합니다. 데이터 시각화는이 차이를 연결하여 원시 데이터를 변환합니다. i

AI의 전문가 시스템AI의 전문가 시스템Apr 16, 2025 pm 12:00 PM

전문가 시스템 : AI의 의사 결정 능력에 대한 깊은 다이빙 의료 진단에서 재무 계획에 이르기까지 모든 것에 대한 전문가의 조언에 접근 할 수 있다고 상상해보십시오. 그것이 인공 지능 분야의 전문가 시스템의 힘입니다. 이 시스템은 프로를 모방합니다

최고의 바이브 코더 3 명이 코드 에서이 AI 혁명을 분해합니다.최고의 바이브 코더 3 명이 코드 에서이 AI 혁명을 분해합니다.Apr 16, 2025 am 11:58 AM

우선, 이것이 빠르게 일어나고 있음이 분명합니다. 다양한 회사들이 현재 AI가 작성한 코드의 비율에 대해 이야기하고 있으며 빠른 클립에서 증가하고 있습니다. 이미 주변에 많은 작업 변위가 있습니다

활주로 AI의 GEN-4 : AI Montage는 어떻게 부조리를 넘어갈 수 있습니까?활주로 AI의 GEN-4 : AI Montage는 어떻게 부조리를 넘어갈 수 있습니까?Apr 16, 2025 am 11:45 AM

디지털 마케팅에서 소셜 미디어에 이르기까지 모든 창의적 부문과 함께 영화 산업은 기술 교차로에 있습니다. 인공 지능이 시각적 스토리 텔링의 모든 측면을 재구성하고 엔터테인먼트의 풍경을 바꾸기 시작함에 따라

ISRO AI 무료 코스 5 일 동안 등록하는 방법은 무엇입니까? - 분석 VidhyaISRO AI 무료 코스 5 일 동안 등록하는 방법은 무엇입니까? - 분석 VidhyaApr 16, 2025 am 11:43 AM

ISRO의 무료 AI/ML 온라인 코스 : 지리 공간 기술 혁신의 관문 IIRS (Indian Institute of Remote Sensing)를 통해 Indian Space Research Organization (ISRO)은 학생과 전문가에게 환상적인 기회를 제공하고 있습니다.

AI의 로컬 검색 알고리즘AI의 로컬 검색 알고리즘Apr 16, 2025 am 11:40 AM

로컬 검색 알고리즘 : 포괄적 인 가이드 대규모 이벤트를 계획하려면 효율적인 작업량 배포가 필요합니다. 전통적인 접근 방식이 실패하면 로컬 검색 알고리즘은 강력한 솔루션을 제공합니다. 이 기사는 언덕 등반과 Simul을 탐구합니다

Openai는 GPT-4.1로 초점을 이동하고 코딩 및 비용 효율성을 우선시합니다.Openai는 GPT-4.1로 초점을 이동하고 코딩 및 비용 효율성을 우선시합니다.Apr 16, 2025 am 11:37 AM

릴리스에는 GPT-4.1, GPT-4.1 MINI 및 GPT-4.1 NANO의 세 가지 모델이 포함되어 있으며, 대형 언어 모델 환경 내에서 작업 별 최적화로 이동합니다. 이 모델은 사용자를 향한 인터페이스를 즉시 대체하지 않습니다

프롬프트 : Chatgpt는 가짜 여권을 생성합니다프롬프트 : Chatgpt는 가짜 여권을 생성합니다Apr 16, 2025 am 11:35 AM

Chip Giant Nvidia는 월요일에 AI SuperComputers를 제조하기 시작할 것이라고 말했다. 이 발표는 트럼프 SI 대통령 이후에 나온다

See all articles

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

인기 기사

R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
1 몇 달 전By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 최고의 그래픽 설정
1 몇 달 전By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 아무도들을 수없는 경우 오디오를 수정하는 방법
1 몇 달 전By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 채팅 명령 및 사용 방법
1 몇 달 전By尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

PhpStorm 맥 버전

PhpStorm 맥 버전

최신(2018.2.1) 전문 PHP 통합 개발 도구

안전한 시험 브라우저

안전한 시험 브라우저

안전한 시험 브라우저는 온라인 시험을 안전하게 치르기 위한 보안 브라우저 환경입니다. 이 소프트웨어는 모든 컴퓨터를 안전한 워크스테이션으로 바꿔줍니다. 이는 모든 유틸리티에 대한 액세스를 제어하고 학생들이 승인되지 않은 리소스를 사용하는 것을 방지합니다.

SublimeText3 Linux 새 버전

SublimeText3 Linux 새 버전

SublimeText3 Linux 최신 버전

MinGW - Windows용 미니멀리스트 GNU

MinGW - Windows용 미니멀리스트 GNU

이 프로젝트는 osdn.net/projects/mingw로 마이그레이션되는 중입니다. 계속해서 그곳에서 우리를 팔로우할 수 있습니다. MinGW: GCC(GNU Compiler Collection)의 기본 Windows 포트로, 기본 Windows 애플리케이션을 구축하기 위한 무료 배포 가능 가져오기 라이브러리 및 헤더 파일로 C99 기능을 지원하는 MSVC 런타임에 대한 확장이 포함되어 있습니다. 모든 MinGW 소프트웨어는 64비트 Windows 플랫폼에서 실행될 수 있습니다.