찾다
기술 주변기기일체 포함GPT-4는 수락을 거부하고 Bard에 의해 추월되었습니다. 최신 모델이 시장에 출시되었습니다.

"대형 모델 예선 대회" 챗봇 아레나의 권위 있는 목록이 새로워졌습니다.

Google Bard가 GPT-4를 제치고 GPT-4 Turbo에 이어 2위에 올랐습니다.

GPT-4는 수락을 거부하고 Bard에 의해 추월되었습니다. 최신 모델이 시장에 출시되었습니다.

그러나 이에 대해 많은 네티즌들은 “불만”, “부당하다”는 의견을 표명했습니다.

Google AI 수장인 제프 딘(Jeff Dean)이 바드(Bard)에 대형 모델인 제미니 프로 스케일(Gemini Pro-scale)의 새 버전을 탑재해 성능이 크게 향상됐다고 밝힌 것으로 밝혀졌습니다.

GPT-4는 수락을 거부하고 Bard에 의해 추월되었습니다. 최신 모델이 시장에 출시되었습니다.

이는 "랭킹 매치"에서 플레이하는 Bard가 인터넷에 연결할 수 있다는 의미이기도 합니다.

GPT-4는 수락을 거부하고 Bard에 의해 추월되었습니다. 최신 모델이 시장에 출시되었습니다.

네티즌들의 의구심은 바로 이 점을 중심으로 맴돌고 있습니다.

동일 순위표에서 온라인과 오프라인 대형 모델을 섞어서 오해를 불러일으키기 매우 쉽습니다.

GPT-4는 수락을 거부하고 Bard에 의해 추월되었습니다. 최신 모델이 시장에 출시되었습니다.

Hugging Face의 "최고 알파카 책임자"인 Omar Sanseviero도 다음과 같이 말했습니다.

그 경우...검색 기능이 있는 Mixtral도 lmsys에 제출할 수 있나요?

GPT-4는 수락을 거부하고 Bard에 의해 추월되었습니다. 최신 모델이 시장에 출시되었습니다.

임시스는 다음과 같이 공식적으로 답변했습니다.

  • 아레나 순위는 실시간으로 제공됩니다. 궁금한 점이 있으면 아레나에서 직접 모델을 비교하고 투표할 수 있습니다.
  • 데이터에 투표하세요. 개방적이고 투명하며 사용자 프롬프트의 다양성과 투표 품질에 대한 연구와 해당 데이터 세트가 곧 공개될 예정입니다.

네티즌들이 가장 우려하는 문제와 관련하여 Bard를 능가하는 GPT-4가 있습니다. 임시스는 오프라인 버전에서 "실시간 데이터에 대한 접근이 사용자 경험을 향상시킬 수 있다면 순위에 이를 반영할 것"이라고 말했다.

그리고 @OpenAI와 Bing은 물론 Microsoft 임원 Mikhail Parakhin도 직접 GPT-4 온라인 버전이나 Bing Copilot을 경기장에 추가하겠다는 의지를 표명했습니다.

최신 소식은 OpenAI의 최신 모델인 gpt-4-0125-preview가 현재 경기장에 입장하여 사용자들의 투표 참여를 기다리고 있다는 것입니다.

GPT-4는 수락을 거부하고 Bard에 의해 추월되었습니다. 최신 모델이 시장에 출시되었습니다.

Bard는 어떻게 GPT-4를 능가했나요?

Chatbot Arena는 UC Berkeley 연구진이 이끄는 Imsys(Large Model Systems Organization) 조직에서 만든 권위 있는 대형 모델 목록입니다.

이 순위는 익명의 1V1 전투 투표 규칙을 사용하며 Elo 등급 시스템을 기반으로 순위가 매겨집니다.

구체적으로 투표 페이지는 다음과 같습니다. 모델 A와 B는 모두 익명입니다. 사용자는 여러 가지 질문을 한 후 모델의 답변을 평가합니다. A가 더 좋음, B가 더 좋음, A와 B. A와 B는 모두 동일합니다.

GPT-4는 수락을 거부하고 Bard에 의해 추월되었습니다. 최신 모델이 시장에 출시되었습니다.

질의응답 과정에서 모델의 신상이 유출될 경우 투표가 무효가 된다는 점 참고해주세요.

GPT-4는 수락을 거부하고 Bard에 의해 추월되었습니다. 최신 모델이 시장에 출시되었습니다.

현재 목록에 따르면 경기장에는 56개의 대형 모델이 있습니다.

GPT-4는 수락을 거부하고 Bard에 의해 추월되었습니다. 최신 모델이 시장에 출시되었습니다.

이전에는 GPT-4가 "아주 앞선" 점수로 오랫동안 목록을 장악했습니다. 새로운 버전의 Bard, GPT를 직접 능가했습니다- 4의 두 가지 버전이 2위로 돌진하며 1위 GPT-4 Turbo와 불과 34점 뒤진 상태입니다. 무승부 A 대 B 매치업, 모델 A의 승리 비율은 다음과 같습니다.

GPT-4는 수락을 거부하고 Bard에 의해 추월되었습니다. 최신 모델이 시장에 출시되었습니다. 및 각 모델 조합 쌍의 헤즈업 매치 수

(무승부)

:

GPT-4는 수락을 거부하고 Bard에 의해 추월되었습니다. 최신 모델이 시장에 출시되었습니다.

또한 Chatbot Arena 리더보드는 부트스트래핑을 사용하여 Elo 점수 추정치를 1,000회 무작위로 샘플링하여 신뢰 구간 등을 평가합니다.

GPT-4는 수락을 거부하고 Bard에 의해 추월되었습니다. 최신 모델이 시장에 출시되었습니다.

다른 모든 모델 대비 단일 모델의 평균 승률은 다음과 같습니다.

GPT-4는 수락을 거부하고 Bard에 의해 추월되었습니다. 최신 모델이 시장에 출시되었습니다.

다만, 아레나 순위는 실시간이며, 현재 Bard가 2위를 차지하고 있지만, 총 투표수는 3,000표가 넘습니다.

이에 비해 GPT-4 Turbo의 투표 수는 30,000+에 도달했으며, 이를 능가한 두 버전의 투표도 Bard의 몇 배에 이릅니다.

GPT-4는 수락을 거부하고 Bard에 의해 추월되었습니다. 최신 모델이 시장에 출시되었습니다.

이제 최신 버전의 GPT-4가 시장에 출시되었으니(아직 순위는 업데이트되지 않았지만) 후속 결과를 기다려야 합니다~

참조 링크: https:// twitter.com/lmsysorg /status/1752035632489300239.

위 내용은 GPT-4는 수락을 거부하고 Bard에 의해 추월되었습니다. 최신 모델이 시장에 출시되었습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명
이 기사는 51CTO.COM에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제
외삽에 대한 포괄적 인 가이드외삽에 대한 포괄적 인 가이드Apr 15, 2025 am 11:38 AM

소개 매일 몇 주 만에 작물의 진행 상황을 관찰하는 농부가 있다고 가정합니다. 그는 성장률을보고 몇 주 안에 식물이 얼마나 키가 커질 수 있는지에 대해 숙고하기 시작합니다. Th

소프트 AI의 부상과 오늘날 비즈니스의 의미소프트 AI의 부상과 오늘날 비즈니스의 의미Apr 15, 2025 am 11:36 AM

Soft AI-대략적인 추론, 패턴 인식 및 유연한 의사 결정을 사용하여 구체적이고 좁은 작업을 수행하도록 설계된 AI 시스템으로 정의 된 것은 모호성을 수용하여 인간과 같은 사고를 모방하려고합니다. 그러나 이것이 바이러스의 의미는 무엇입니까?

AI 국경을위한 진화 보안 프레임 워크AI 국경을위한 진화 보안 프레임 워크Apr 15, 2025 am 11:34 AM

클라우드 컴퓨팅이 클라우드 네이티브 보안 도구로의 전환이 필요했기 때문에 AI는 AI의 고유 한 요구를 위해 특별히 설계된 새로운 유형의 보안 솔루션을 요구합니다. 클라우드 컴퓨팅 및 보안 수업의 상승이 배웠습니다 th

3 가지 방법 생성 AI 기업가를 증폭시킵니다 : 평균을 조심하십시오!3 가지 방법 생성 AI 기업가를 증폭시킵니다 : 평균을 조심하십시오!Apr 15, 2025 am 11:33 AM

기업가와 AI 및 생성 AI를 사용하여 비즈니스를 개선합니다. 동시에, 모든 기술과 마찬가지로 생성 AI를 기억하는 것이 중요합니다. 앰프는 앰프입니다. 엄격한 2024 연구 o

Andrew Ng의 모델 임베딩에 대한 새로운 단기 과정Andrew Ng의 모델 임베딩에 대한 새로운 단기 과정Apr 15, 2025 am 11:32 AM

임베딩 모델의 힘 잠금 해제 : Andrew Ng의 새로운 코스에 대한 깊은 다이빙 기계가 완벽한 정확도로 질문을 이해하고 응답하는 미래를 상상해보십시오. 이것은 공상 과학이 아닙니다. AI의 발전 덕분에 R이되었습니다

대형 언어 모델 (LLMS)에서 환각이 불가피합니까?대형 언어 모델 (LLMS)에서 환각이 불가피합니까?Apr 15, 2025 am 11:31 AM

대형 언어 모델 (LLM) 및 환각의 피할 수없는 문제 Chatgpt, Claude 및 Gemini와 같은 AI 모델을 사용했을 것입니다. 이들은 대규모 텍스트 데이터 세트에 대해 교육을받은 강력한 AI 시스템의 대형 언어 모델 (LLM)의 예입니다.

60% 문제 - AI 검색이 트래픽을 배출하는 방법60% 문제 - AI 검색이 트래픽을 배출하는 방법Apr 15, 2025 am 11:28 AM

최근의 연구에 따르면 AI 개요는 산업 및 검색 유형에 따라 유기 트래픽이 15-64% 감소 할 수 있습니다. 이러한 급격한 변화로 인해 마케팅 담당자는 디지털 가시성에 관한 전체 전략을 재고하게합니다. 새로운

AI R & D의 중심에 인간 번성을하는 MIT Media LabAI R & D의 중심에 인간 번성을하는 MIT Media LabApr 15, 2025 am 11:26 AM

Elon University의 Digital Future Center를 상상 한 최근 보고서는 거의 300 명의 글로벌 기술 전문가를 조사했습니다. 결과적인 보고서 인‘2035 년에 인간이되는 것’은 대부분 AI 시스템의 심화가 T에 대한 우려가 있다고 결론지었습니다.

See all articles

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

인기 기사

R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
4 몇 주 전By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 최고의 그래픽 설정
4 몇 주 전By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 아무도들을 수없는 경우 오디오를 수정하는 방법
4 몇 주 전By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25 : Myrise에서 모든 것을 잠금 해제하는 방법
1 몇 달 전By尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

PhpStorm 맥 버전

PhpStorm 맥 버전

최신(2018.2.1) 전문 PHP 통합 개발 도구

WebStorm Mac 버전

WebStorm Mac 버전

유용한 JavaScript 개발 도구

Atom Editor Mac 버전 다운로드

Atom Editor Mac 버전 다운로드

가장 인기 있는 오픈 소스 편집기

Dreamweaver Mac版

Dreamweaver Mac版

시각적 웹 개발 도구