OpenAI에 도전하는 새로운 모델이 이제 무료로 제공되며 컴퓨팅 성능과 성능이 GPT-4에 근접합니다.-일체 포함-php.cn

집

기술 주변기기

일체 포함

OpenAI에 도전하는 새로운 모델이 이제 무료로 제공되며 컴퓨팅 성능과 성능이 GPT-4에 근접합니다.

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Mar 08, 2024 pm 03:46 PM

ai모델

목요일 미국 AI 스타트업 Inflection AI가 차세대 대형 언어 모델 Inflection-2.5를 공식 출시했습니다.

보고서에 따르면 Inflection-2.5는 강력한 LLM 기술과 Inflection의 고유한 "공감 미세 조정" 기능을 결합하여 높은 EQ와 높은 IQ의 특성을 통합합니다. 인터넷을 통해 사실적인 정보를 얻을 수 있고 성능도 GPT-4, 제미니 등 대표적인 대형 모델과 맞먹는다.

Inflection-2.5는 이제 모든 Pi 사용자가 PC, iOS 및 Android 앱에서 무료로 사용할 수 있습니다. Heart of the Machine의 간단한 테스트 결과 GPT-4와 비교하면 여전히 어느 정도 격차가 있지만 시도해 볼 가치가 있음을 발견했습니다. 관심 있는 사용자가 직접 체험해 볼 수 있습니다.

OpenAI에 도전하는 새로운 모델이 이제 무료로 제공되며 컴퓨팅 성능과 성능이 GPT-4에 근접합니다.

링크: https://pi.ai/talk

Inflection-2.5는 GPT-4에 가까운 성능을 달성하는 반면 훈련 프로세스는 GPT-4 40% 컴퓨팅만 사용한다는 점은 주목할 가치가 있습니다. 힘.

Inflection AI는 차세대 대규모 모델이 지능형 코딩, 수학 등의 분야에서 상당한 진전을 이뤘음을 지적합니다. 이러한 발전은 주요 산업 벤치마크에 대한 구체적인 개선으로 이어져 Pi가 기술의 최전선에 머물도록 보장할 것입니다. 또한 Pi는 세계 최고 수준의 실시간 웹 검색 기능을 통합하여 사용자가 고품질 속보와 최신 정보에 액세스할 수 있도록 보장합니다.

Inflection-2.5 vs GPT-4

Inflection-1 훈련에 사용되는 FLOP는 GPT-4의 약 4%이며 다양한 "IQ 중심" 작업의 평균 성능은 약 GPT-4 72입니다. % 레벨. 이제 Inflection-2.5는 훈련에 GPT-4 FLOP의 40%만 사용함에도 불구하고 GPT-4의 94%가 넘는 평균 성능을 달성합니다. 아래 그림에서 볼 수 있듯이 Inflection-2.5의 성능은 STEM 도메인 지식이 가장 크게 향상되면서 전반적으로 상당한 개선을 달성했습니다. 두 가지 STEM 시험인 헝가리 수학 시험과 물리학 대학원 기록 시험(GRE)에 대한

OpenAI에 도전하는 새로운 모델이 이제 무료로 제공되며 컴퓨팅 성능과 성능이 GPT-4에 근접합니다.

Inflection-2.5의 결과는 다음과 같습니다.

OpenAI에 도전하는 새로운 모델이 이제 무료로 제공되며 컴퓨팅 성능과 성능이 GPT-4에 근접합니다.

아래 표에 표시된 것처럼 연구 Inflection-2.5는 MMLU 벤치마크 및 GPQA Diamond 벤치마크에서도 평가됩니다. MMLU 벤치마크는 STEM, 인문학, 사회과학 등의 57개 분야를 다루며 LLM의 포괄적인 지식 역량을 효과적으로 테스트하는 반면, GPQA Diamond 벤치마크는 매우 어려운 전문가 수준 벤치마크입니다.

OpenAI에 도전하는 새로운 모델이 이제 무료로 제공되며 컴퓨팅 성능과 성능이 GPT-4에 근접합니다.

BIG-Bench-Hard 벤치마크에서 Inflection-2.5는 Inflection-1에 비해 성능이 10% 이상 향상되었으며 GPT-4와 비슷합니다. BIG-Bench-Hard 벤치마크는 주로 대규모 언어 모델로 해결하기 어려운 문제를 다룹니다.

OpenAI에 도전하는 새로운 모델이 이제 무료로 제공되며 컴퓨팅 성능과 성능이 GPT-4에 근접합니다.

이 연구는 MT-Bench 벤치마크에서도 평가되었습니다. 그러나 연구팀은 벤치마크에 잘못된 참조 솔루션이나 결함이 있는 전제가 있는 추론, 수학 및 코딩 범주의 샘플 사례 중 상당 부분(거의 25%)이 있다는 것을 깨달았습니다. 따라서 본 연구에서는 이러한 예시를 수정하고 다시 평가 실험을 진행하였고, 그 결과는 아래 표와 같습니다.

OpenAI에 도전하는 새로운 모델이 이제 무료로 제공되며 컴퓨팅 성능과 성능이 GPT-4에 근접합니다.

GSM8k 및 MATH 벤치마크 평가 결과를 보면 Inflection-2.5가 Inflection보다 측면에서 더 나은 것으로 나타났습니다. -1의 수학 및 코딩 능력이 크게 향상되었습니다.

OpenAI에 도전하는 새로운 모델이 이제 무료로 제공되며 컴퓨팅 성능과 성능이 GPT-4에 근접합니다.

Inflection-2.5의 코딩 능력을 추가로 테스트하기 위해 연구에서는 두 가지 코딩 벤치마크인 MBPP+와 HumanEval+에 대한 평가 실험을 수행했으며 그 결과를 보여줍니다. 다음 표에서:

OpenAI에 도전하는 새로운 모델이 이제 무료로 제공되며 컴퓨팅 성능과 성능이 GPT-4에 근접합니다.

연구팀은 HellaSwag 및 ARC-C에 대한 Inflection-2.5는 물론 상식과 과학적 벤치마크에 대한 다양한 모델을 평가했습니다. 아래 결과로 볼 때 Inflection-2.5는 이러한 벤치마크에서 강력한 성능을 달성했습니다.

OpenAI에 도전하는 새로운 모델이 이제 무료로 제공되며 컴퓨팅 성능과 성능이 GPT-4에 근접합니다.

또한 위의 모든 평가는 현재 Pi 지원 모델을 사용하여 수행되었습니다. 그러나 네트워크 검색(위의 벤치마크에서는 네트워크 검색을 사용하지 않음), 몇 번의 프롬프트 구조 및 기타 제작 측면으로 인해 사용자 경험이 약간 다를 수 있다는 점에 유의하는 것도 중요합니다.

일반적으로 Inflection-2.5는 Pi의 "마음 중심" 기능과 매우 높은 보안 표준을 유지하여 더욱 포괄적이고 유용한 모델이 됩니다.

최근 대규모 언어 모델을 위한 기술 경쟁이 치열한 단계에 접어들었습니다. 많은 기술 회사 중에서 Mistral AI(Mistral Large)와 Anthropic(Claude 3)이 있습니다. 눈에 띄게 제안된 신기술은 GPT-4 및 Gemini Ultra에 가까운 기능을 달성합니다. 어제 등장한 Inflection-2.5가 첫 번째 단계에 합류하는 것 같습니다.

실리콘 밸리의 스타 스타트업인 Inflection AI는 2022년에 설립된 오랜 역사를 가지고 있습니다. 공동 창업자는 전 DeepMind 공동 창업자 Mustafa Suleyman, Linkedln 공동 창업자 Reid Hoffman, 전 DeepMind 최고 책임자입니다. 수석 과학자 Karen Simonyan.

OpenAI에 도전하는 새로운 모델이 이제 무료로 제공되며 컴퓨팅 성능과 성능이 GPT-4에 근접합니다.

지난해 6월 인플렉션 AI는 마이크로소프트, 엔비디아, 레이드 호프만, 빌 게이츠, 전 구글 CEO 에릭 슈미트가 주도하는 13억 달러의 자금 조달을 받았다고 발표했다. 현재 Inflection AI는 세계에서 4번째로 큰 생성 AI 스타트업이 되었습니다.

위 내용은 OpenAI에 도전하는 새로운 모델이 이제 무료로 제공되며 컴퓨팅 성능과 성능이 GPT-4에 근접합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

이 기사는 51CTO.COM에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제

관련 기사

모두가 AI 사용에 더 나아지고 있습니다 : Vibe 코딩에 대한 생각Apr 19, 2025 am 11:17 AM

컨퍼런스와 전시회에서 무슨 일이 일어나고 있는지 볼 수 있습니다. 엔지니어에게 자신이하고있는 일을 물어 보거나 CEO와 상담 할 수 있습니다. 당신이 보는 곳마다, 상황은 졸린 속도로 변화하고 있습니다. 엔지니어 및 비 엔지니어 차이점은 무엇입니까?

Rocketpy -Analytics Vidhya를 사용한 로켓 런칭 시뮬레이션 및 분석Apr 19, 2025 am 11:12 AM

Rocketpy : 포괄적 인 가이드로 로켓 발사 시뮬레이션 이 기사는 강력한 파이썬 라이브러리 인 Rocketpy를 사용하여 고출력 로켓 런칭을 시뮬레이션하는 것을 안내합니다. 로켓 구성 요소 정의에서 Simula 분석에 이르기까지 모든 것을 다룰 것입니다.

5 무료 데이터 분석 과정 - 분석 VidhyaApr 19, 2025 am 11:11 AM

은행을 깨지 않고 데이터 중심의 경력 여행을 시작하십시오! 이 기사는 5 개의 탁월한 무료 데이터 분석 과정을 강조하며, 스킬 셋을 확장하려는 노련한 전문가 모두에게 적합하고 T를 탐구하고 싶어하는 호기심 많은 신입생에게 적합합니다.

Openagi를 사용하여 자율 AI 에이전트를 구축하는 방법은 무엇입니까? - 분석 VidhyaApr 19, 2025 am 11:10 AM

Openagi로 AI 요원의 힘을 활용하십시오 : 포괄적 인 가이드 지칠 줄 모르는 조수를 상상해보십시오. 항상 작업을 간소화하고 통찰력있는 권장 사항을 제공 할 수 있습니다. 그것이 AI 요원의 약속이며 Openagi

GPT-4O MINI : OpenAi의 최신 모델이 어떻게 쌓이는가?Apr 19, 2025 am 11:09 AM

OpenAi의 최신 제품인 GPT-4O Mini는 저렴하고 접근 가능한 고급 AI를 향한 중요한 단계입니다. 이 작은 언어 모델 (SLM)은 Llama 3 및 Gemma 2와 같은 경쟁자에게 직접 도전하여 낮은 대기 시간, 비용 효율성 및

기술 혁신가에서 건강 관리 파이오니어까지 : Geetha Manjunath 박사 ' S AI StoryApr 19, 2025 am 11:02 AM

"Deading with Data"의이 에피소드에는 Niramai Analytix의 창립자이자 CEO 인 Geetha Manjunath 박사가 있습니다. AI와 의료 분야에서 25 년 이상의 경험을 가진 Manjunath 박사는 인도 과학 연구소에서 박사 학위를 취득하고 MBA FRO

Ollama -Analytics Vidhya와의 로컬 LLM 배치 단순화Apr 19, 2025 am 11:01 AM

Ollama와 함께 현지에서 오픈 소스 LLM의 힘을 활용하십시오 : 포괄적 인 가이드 LLM (Lange Language Models)을 실행하면 비교할 수없는 제어 및 투명성을 제공하지만 환경을 설정하면 어려울 수 있습니다. Ollama는이 과정을 단순화합니다

Monsterapi로 대형 언어 모델을 미세 조정하는 방법Apr 19, 2025 am 10:49 AM

Monsterapi와 함께 미세 조정 된 LLM의 힘을 활용 : 포괄적 인 가이드 가상 어시스턴트가 귀하의 요구를 완벽하게 이해하고 기대한다고 상상해보십시오. LLMS (Lange Models)의 발전 덕분에 이것은 현실이되고 있습니다. 그러나 a

See all articles

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

Dreamweaver Mac版

시각적 웹 개발 도구

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

mPDF

mPDF는 UTF-8로 인코딩된 HTML에서 PDF 파일을 생성할 수 있는 PHP 라이브러리입니다. 원저자인 Ian Back은 자신의 웹 사이트에서 "즉시" PDF 파일을 출력하고 다양한 언어를 처리하기 위해 mPDF를 작성했습니다. HTML2FPDF와 같은 원본 스크립트보다 유니코드 글꼴을 사용할 때 속도가 느리고 더 큰 파일을 생성하지만 CSS 스타일 등을 지원하고 많은 개선 사항이 있습니다. RTL(아랍어, 히브리어), CJK(중국어, 일본어, 한국어)를 포함한 거의 모든 언어를 지원합니다. 중첩된 블록 수준 요소(예: P, DIV)를 지원합니다.