방금 노출된 Claude3는 OpenAI의 가장 큰 약점을 직접 공격합니다.-IT산업-php.cn

집

기술 주변기기

IT산업

방금 노출된 Claude3는 OpenAI의 가장 큰 약점을 직접 공격합니다.

PHPz

Mar 10, 2024 am 08:07 AM

일체 포함openai

엔터프라이즈급 SOTA 대형 모델, 앤트로픽의 클로드3는 어떤 신호를 내놓는가?

저자 | Wanchen

편집자 | Jingyu

OpenAI GPT3 R&D 책임자의 창업 프로젝트로 Anthropic은 OpenAI와 가장 잘 경쟁할 수 있는 스타트업으로 평가됩니다.

Anthropic은 월요일 현지 시간에 대규모 Claude 3 시리즈 모델 세트를 출시했으며, 자사의 가장 강력한 모델이 다양한 벤치마크 테스트에서 OpenAI의 GPT-4 및 Google의 Gemini 1.0 Ultra를 능가했다고 주장했습니다.

그러나 더 복잡한 추론 작업을 처리하고, 더 똑똑하고, 더 빠르게 반응하는 능력, 대형 모델에서 3위 안에 드는 이러한 포괄적인 능력은 클로드3의 기본 능력일 뿐입니다.

앤트로픽은 기업고객을 위한 최고의 파트너가 되기 위해 최선을 다하고 있습니다.

이는 Haiku, Sonnet 및 Opus 모델 세트인 Claude3에 처음 반영되어 기업 고객이 자신의 시나리오에 따라 성능과 비용이 다른 버전을 선택할 수 있습니다.

둘째, Anthropic은 자체 모델이 가장 안전하다고 강조합니다. 앤트로픽(Anthropic)의 다니엘라 아모데이(Daniela Amodei) 사장은 클로드3의 훈련에 '헌법적 인공지능(Constitutional Artificial Intelligence)'이라는 기술이 도입돼 안전성과 신뢰성, 신뢰도를 높였다고 소개했다. 에든버러 대학의 대형 모델 및 추론 박사 과정 학생인 Fu Yao는 Claude3의 기술 보고서를 읽은 후 Claude3가 특히 금융 및 의료 분야의 복잡한 추론에 대한 벤치마크 테스트에서 좋은 성적을 거두었다고 지적했습니다. ToB 회사로서 Anthropic은 가장 수익성이 높은 영역을 최적화하는 데 집중하기로 결정했습니다.

이제 Anthropic은 Claude3 시리즈의 두 가지 모델(Haiku와 Sonnet)을 159개국에서 사용할 수 있도록 오픈되었으며, 가장 강력한 버전인 Opus도 출시를 앞두고 있습니다. 동시에

Anthropic은 Amazon과 Google의 클라우드 플랫폼을 통해 서비스도 제공합니다. Google은 Anthropic에 각각 40억 달러와 20억 달러를 투자했습니다

공동 창업자인 다리오 아모데이(Dario Amodei)와 다니엘라 아모데이(Dario Amodei)는 클로드 3의 출시를 통해 "앤트로픽은 소비자 기업이라기보다 기업 기업에 가깝다"는 점을 다시 한번 입증했다고 말했다.|이미지 출처 : Anthropic

01 ,

더 스마트하고 반응성이 뛰어남 Claude3 제품군: Opus, Sonnet 및 HaikuAnthropic 공식 웹사이트에 따르면 Claude3는 Claude 3 Haiku, Claude 3 Sonnet 및 Claude의 세 가지 가장 진보된 모델을 포함한 일련의 모델입니다. 3 Opus를 사용하면 사용자가 특정 애플리케이션에 대한 지능, 속도 및 비용의 최상의 균형을 선택할 수 있습니다.

모델의 일반적인 기능 측면에서 Anthropic은 Claude 3 시리즈가 분석 및 예측, 세부 콘텐츠 생성, 코드 생성 및 비언어적 측면에서 "광범위한 인지 작업에 대한 새로운 산업 벤치마크를 설정"한다고 말했습니다. 스페인어, 일본어, 프랑스어 등의 언어에서는 영어 대화의 경우 더 강력한 능력과 작업에 대한 적시 대응을 보여줍니다.

그 중에서 Claude 3 Opus는 특히 매우 복잡한 작업을 처리할 때 이 모델 그룹에서 가장 지능적인 모델입니다. Opus는 학부 수준의 전문 지식(MMLU), 대학원 수준의 전문가 추론(GPQA), 기본 수학(GSM8K) 등을 포함한 가장 일반적인 벤치마크에서 동종 제품보다 뛰어난 성능을 발휘합니다. 이는 복잡한 작업에 대해 거의 인간 수준의 이해와 유창함을 보여주며, 현재 Anthropic의 일반 지능에 대한 가장 최첨단 탐구로서 "생성 인공 지능의 외부 한계를 보여줍니다."

Claude3 모델 제품군|이미지 출처: Anthropic

Claude 3 Sonnet은 특히 기업 시나리오 작업에서 지능 수준과 반응성 사이의 이상적인 균형을 달성합니다.

유사 제품보다 저렴한 비용으로 강력한 성능을 제공하며 대규모 AI 배포에서 높은 내구성을 발휘하도록 설계되었습니다

. 대부분의 워크로드에서 Sonnet은 Claude 2 및 Claude 2.1보다 2배 더 빠르고 지능적입니다. 지식 검색이나 영업 자동화 등 빠른 응답이 필요한 작업에 탁월합니다. Claude 3 Haiku는 가장 컴팩트한 모델이자 가장 비용 효율적인 모델입니다. 또한 응답 속도도 매우 빠르며, arXiv에 있는 차트, 그래프, 데이터 집약적인 연구 논문(약 10,000개 토큰)이 포함된 정보를 3초 이내에 읽을 수 있습니다.

02,

기업 고객의 반복을 목표로 공동 창업자인 Daniela Amodei는 일반 지능의 발전 외에도 기업 고객이 생성 AI를 비즈니스에 통합할 때 기업 고객이 직면하는 많은 과제에 대해 특히 우려하고 있다고 말했습니다. . 기업 고객을 대상으로 하는 Claude3 제품군은 향상된 시각적 기능, 정확성, 긴 텍스트 입력 및 보안을 제공합니다.

많은 기업 고객의 지식 기반이 PDF, 순서도, 프레젠테이션 슬라이드 등 다양한 형식으로 제공됩니다. Claude 3 시리즈 모델은 이제 사진, 차트, 그래프, 기술 다이어그램을 포함한 다양한 시각적 형식의 콘텐츠를 처리할 수 있습니다.

Claude3는 긴 텍스트 창의 정확성과 기능을 위해 최적화되었습니다.

정확성 측면에서 Anthropic은 다수의 복잡한 사실 질문을 사용하여 현재 모델의 알려진 약점을 표적으로 삼고 답변을 정답, 오답(또는 환각)으로 분류하고 불확실성을 인정합니다. 따라서 Claude3 모델은 잘못된 정보를 제공하기보다는 답을 모른다는 것을 나타냅니다. 그 중 가장 강력한 버전인 Claude 3 Opus는 도전적인 개방형 질문에 대한 정확도(또는 정답)를 Claude 2.1보다 두 배로 높이는 동시에 오답 수준을 줄였습니다.

Claude2.1 버전에 비해 Claude3 시리즈는 응답 정확도가 전반적으로 향상되었습니다. ｜이미지 출처 : Anthropic

동시에 상황 이해 능력이 향상되어 Claude3 제품군은 이전 버전에 비해 사용자 작업에 대한 거부 반응이 줄어들었습니다.

보다 정확한 응답 외에도 Anthropic에서는 "Quote" 기능을 통해 클로드 3에게 을 제공할 예정이며, 이를 통해 참고 자료의 정확한 문장을 가리켜 답변을 확인할 수 있습니다.

현재 Claude 3 시리즈 모델은 200K 토큰의 컨텍스트 창을 제공합니다. 이후 세 가지 모델 모두 100만 개 이상의 토큰 입력을 수용할 수 있게 되며, 이 기능은 향상된 처리 기능이 필요한 선별된 고객에게 제공될 것입니다. Anthropic은 기술 보고서에서 더 긴 상황별 단서 단어를 효과적으로 처리하는 능력과 회상 기능을 포함하여 Claude3의 상단 텍스트 창 기능에 대해 간략하게 설명했습니다.

03, "헌법적 인공지능", "부정확한 과학"에 대처

클로드3는 멀티모달 모델로서 이미지 입력은 가능하지만, 이미지 콘텐츠 출력은 불가능하다는 점에 주목할 필요가 있습니다. 공동 창립자인 Daniela Amodei는 "기업에서 이미지에 대한 필요성이 훨씬 적다는 사실을 발견했기 때문"이라고 말했습니다.

Google Gemini가 생성한 이미지로 인한 논란 이후 Claude3가 출시되었습니다. 기업 고객을 대상으로 하는 Claude도 AI로 인한 가치 편향 등의 문제를 통제하고 균형을 유지할 수 밖에 없습니다.

이와 관련하여 다리오 아모데이는 인공지능 모델을 제어하는 것의 어려움을 "부정확한 과학"이라고 강조했습니다. 그는 회사가 모델로 인해 발생하는 다양한 위험을 평가하고 완화하는 전담 팀을 보유하고 있다고 말했습니다.

또 다른 공동 창립자인 다니엘라 아모데이(Daniela Amodei)도 현재 방법으로는 완전히 편견이 없는 인공 지능이 불가능할 수도 있음을 인정했습니다. "완전히 중립적인 생성 AI 도구를 만드는 것은 기술적으로뿐만 아니라 모든 사람이 중립성이 무엇인지에 동의하지 않기 때문에 거의 불가능합니다."그녀가 말했습니다.

앞서 Anthropic은 대형 모델을 정렬하는 데 사용되는 "헌법 인공 지능"을 발표했습니다 |이미지 출처 : Anthropic

그럼에도 불구하고 Anthropic은 모델을 최대한 매끄럽게 만들기 위해 "헌법 인공 지능"이라는 방법을 사용합니다. 광범위한 인간 가치를 바탕으로 모델은 "헌법"에 정의된 원칙에 따라 조정되고 최적화됩니다.

OpenAI의 전 핵심 인간 개발자였던 Amodei 형제 자매의 이탈은 OpenAI가 더 이상 비영리 조직이 아니며 더 이상 인류에게 이익이 되는 원래 사명을 따르지 않는다고 믿고 OpenAI에 대한 Musk의 불만과 비슷합니다. 한 기자가 Amodei에게 Anthropic이 해외 사업을 시작하려는 비전에 부합하는지 물었습니다.

Amodei는 "인공지능 개발의 선두에 서는 것이 인공지능의 개발 궤적을 안내하여 사회에 긍정적인 결과를 가져올 수 있는 가장 효과적인 방법입니다."라고 말했습니다.

이 기사는 WeChat 공개 계정인 Geek Park에서 가져온 것입니다. ID: geekpark), 작성자: Wan Chen

위 내용은 방금 노출된 Claude3는 OpenAI의 가장 큰 약점을 직접 공격합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

이 기사는 IT之家에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제

관련 기사

GO와 함께 네트워크 취약성 스캐너 구축Apr 01, 2025 am 08:27 AM

이 GO 기반 네트워크 취약점 스캐너는 잠재적 보안 약점을 효율적으로 식별합니다. 속도를 위해 Go의 동시성 기능을 활용하고 서비스 감지 및 취약성 일치를 포함합니다. 그 능력과 윤리를 탐색합시다

2025 년 최고의 무료 백 링크 체커 도구Mar 21, 2025 am 08:28 AM

웹 사이트 구성은 첫 번째 단계입니다 : SEO 및 백 링크의 중요성 웹 사이트 구축은 웹 사이트를 귀중한 마케팅 자산으로 전환하는 첫 번째 단계 일뿐입니다. 검색 엔진에서 웹 사이트의 가시성을 향상시키고 잠재 고객을 유치하려면 SEO 최적화를 수행해야합니다. 백 링크는 웹 사이트 순위를 향상시키는 열쇠이며 Google 및 기타 검색 엔진에 웹 사이트의 권한 및 신뢰성을 보여줍니다. 모든 백 링크가 유리한 것은 아닙니다. 유해한 링크를 식별하고 피하십시오. 모든 백 링크가 유익한 것은 아닙니다. 유해한 링크는 순위에 해를 끼칠 수 있습니다. 우수한 무료 백 링크 확인 도구는 웹 사이트 링크 소스를 모니터링하고 유해한 링크를 상기시킵니다. 또한 경쟁 업체의 링크 전략을 분석하고 배울 수도 있습니다. 무료 백 링크 점검 도구 : SEO 인텔리전스 책임자

Baidu의 다른 국가 제품은 Deepseek과 연결되어 있습니까?Mar 12, 2025 pm 01:48 PM

DeepSeek-R1은 Baidu Library 및 NetDisk에 권한을 부여합니다. 심도있는 사고와 행동의 완벽한 통합은 단 한 달 만에 많은 플랫폼에 빠르게 통합되었습니다. 대담한 전략적 레이아웃을 통해 Baidu는 DeepSeek을 타사 모델 파트너로 통합하여이를 생태계에 통합하여 "큰 모델 검색"생태 전략의 주요 진전을 나타냅니다. Baidu Search 및 Wenxin Intelligent Intelligent 플랫폼은 DeepSeek 및 Wenxin Big Model의 깊은 검색 기능에 처음으로 연결하여 사용자에게 무료 AI 검색 경험을 제공합니다. 동시에 "Baidu로 갈 때 알게 될 것입니다"라는 클래식 슬로건과 새로운 버전의 Baidu 앱은 Wenxin의 큰 모델과 DeepSeek의 기능을 통합하여 "AI Search"및 "Wide Network Information Refinement"를 시작합니다.

Deepseek에 대한 첫 번째 안드로이드 액세스 뒤에 : 여성의 힘보기Mar 12, 2025 pm 12:27 PM

AI 분야에서 중국 여성 기술력의 부상 : 기술 분야에 대한 Deepseek 여성의 기여와의 명예의 협력에 대한 이야기는 점점 더 중요 해지고 있습니다. 중국 과학 기술부의 데이터에 따르면 여성 과학 기술 노동자의 수는 거대하며 AI 알고리즘 개발에서 독특한 사회적 가치 민감도를 보여줍니다. 이 기사는 명예 휴대폰에 중점을두고 DeepSeek Big Model에 처음 연결 한 여성 팀의 강점을 탐구하여 기술 발전을 촉진하고 기술 개발의 가치 좌표 시스템을 재구성 할 수있는 방법을 보여줍니다. 2024 년 2 월 8 일, Honor는 공식적으로 DeepSeek-R1 전혈 버전 Big Model을 출시하여 Android 캠프에서 최초의 제조업체가되어 DeepSeek에 연결하여 사용자의 열정적 인 응답을 불러 일으켰습니다. 이 성공 뒤에 여성 팀원은 제품 결정, 기술 혁신 및 사용자를 만들고 있습니다.

DeepSeek의 '놀라운'이익 : 이론적 이익 마진은 545%정도입니다!Mar 12, 2025 pm 12:21 PM

DeepSeek은 Zhihu에 대한 기술 기사를 발표하여 DeepSeek-V3/R1 추론 시스템을 자세히 소개하고 처음으로 주요 재무 데이터를 공개하여 업계의 관심을 끌었습니다. 이 기사는 시스템의 일일 비용 이익 마진이 545%로 높아 글로벌 AI Big Model 이익이 새로운 것으로 나타났습니다. DeepSeek의 저렴한 전략은 시장 경쟁에서 이점을 제공합니다. 모델 교육 비용은 유사한 제품의 1% -5%에 불과하며 V3 모델 교육 비용은 경쟁 업체의 비용보다 훨씬 낮으며 V3 모델 교육 비용은 5 억 5,760 만 달러에 불과합니다. 한편, R1의 API 가격은 Openaio3-Mini의 1/7에서 1/2에 불과합니다. 이 데이터는 DeepSeek 기술 경로의 상업적 타당성을 입증하고 AI 모델의 효율적인 수익성을 확립합니다.

Midea는 첫 번째 Deepseek 에어컨을 시작합니다. AI 음성 상호 작용은 40 만 명령을 달성 할 수 있습니다!Mar 12, 2025 pm 12:18 PM

MIDEA는 곧 Deepseek Big Model -Midea Fresh and Clean Air Machine T6을 갖춘 최초의 에어컨을 출시 할 예정입니다. 이 에어컨에는 고급 공기 지능형 주행 시스템이 장착되어있어 환경에 따라 온도, 습도 및 풍속과 같은 매개 변수를 지능적으로 조정할 수 있습니다. 더 중요한 것은 DeepSeek Big 모델을 통합하고 400,000 개 이상의 AI 음성 명령을 지원합니다. Midea의 움직임은 업계에서 격렬한 토론을 일으켰으며 특히 백색 제품과 대형 모델을 결합하는 중요성에 대해 우려하고 있습니다. 전통적인 에어컨의 간단한 온도 설정과 달리 MIDEA Fresh and Clean Air Machine T6은 가정 환경에 따라보다 복잡하고 모호한 지침을 이해하고 습도를 지능적으로 조정하여 사용자 경험을 크게 향상시킬 수 있습니다.

See all articles