프로듀스: 51CTO Technology Stack(WeChat ID: blog51cto)
늦은 밤, OpenAI의 가장 강력한 라이벌인 Anthropic은 Claude 3 Haiku, Claude 3 Sonnet 및 Claude 3 Opus를 포함한 세 가지 새로운 SOTA 제품을 한 번에 출시했습니다. 업계에서는 다음과 같이 외쳤습니다. Claude 3는 일련의 새로운 업계 벤치마크를 제공합니다.
그 중 Opus는 서사적 악장을 의미하고 Sonnet은 소네트를 의미하며 Haiku는 세 줄의 짧은 시인 하이쿠를 의미합니다.
하이쿠는 AI 시장에서 가장 빠르고 비용 효율적인 모델로 보고되고 있다(그림 9). 차트와 그래프가 포함된 arXiv에서 유익하고 데이터 집약적인 연구 논문(~10,000개 토큰)을 3초 이내에 읽을 수 있습니다.
그림 8, 대부분의 워크로드에서 Sonnet은 Claude 2 및 Claude 2.1보다 2배 빠르며 더 높은 수준의 지능을 가지고 있습니다. 지식 검색이나 영업 자동화 등 빠른 응답이 필요한 작업에 탁월합니다. Opus는 Claude 2 및 2.1과 속도가 비슷하지만 지능 수준이 더 높습니다.
Opus는 현재 Anthropic의 가장 지능적인 모델로, 학부 수준의 전문 지식(MMLU), 대학원 수준의 전문가 추론(GPQA), 기초 수학(GSM8K) 등을 포함하여 인공 지능 시스템에 대한 가장 일반적인 평가 벤치마크에서 동종 제품보다 뛰어난 성능을 발휘합니다. 복잡한 작업에 대해 인간 수준에 가까운 이해력과 유창함을 보여주며 일반 지능의 최전선을 선도합니다.
위 세 가지 Claude 3 모델은 모두 스페인어, 일본어, 프랑스어 등 영어가 아닌 언어에 대한 분석 및 예측, 세부 콘텐츠 생성, 코드 생성, 대화에서 더 뛰어난 역량을 보여줍니다.
또한 Claude 3 시리즈는 거의 완벽한 메모리 기능과 매우 긴 텍스트 창을 갖추고 있어 200K 컨텍스트 창을 제공합니다. 그리고 100만 개 이상의 토큰 입력을 수용할 수 있으며 고객 요구에 따라 점진적으로 출시될 예정입니다.
전체적으로 Claude3에는 세 가지 충격적인 기능이 있습니다.
1. 도메인 전문가의 벤치마크. 금융/의학/철학의 세 가지 전문 분야가 테스트 벤치마크로 선정되었습니다. NVIDIA 연구 관리자인 Jim Fan은 "다양한 다운스트림 애플리케이션이 어떤 일이 일어날지 알 수 있도록 모든 LLM이 이를 따르는 것이 좋습니다"라고 말했습니다.
2. 거부율 분석. LLM은 많은 "순진한 질문"에 대해 지나치게 신중한 답변으로 전염병이되었습니다. Claude는 안전한 AI 연구에 전념하고 이 분야에 노력해 왔습니다.
3. 다른 주요 모델과 비교할 수 없는 정교한 시각적 기능. 사진, 다이어그램, 그래프, 기술 다이어그램, PDF, 순서도 또는 프리젠테이션 슬라이드를 포함한 다양한 시각적 형식으로 작동합니다.
실제 평가는 어떤가요?
한 네티즌은 GPT4와 Claude3에게 각각 로그인 인터페이스 코드를 작성해 달라고 요청했습니다. 실제 실행 테스트 결과(그림 13)는 앱 인터페이스 디자인에서 후자가 더 나은 것으로 나타났습니다. ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
위 내용은 Claude3는 GPT4에게 교훈을 가르쳤습니다! 오픈AI의 최강 상대는 심야폭탄, 풀영상 분석까지!의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

截至3月20日的数据显示,自微软2月7日推出其人工智能版本以来,必应搜索引擎的页面访问量增加了15.8%,而Alphabet旗下的谷歌搜索引擎则下降了近1%。 3月23日消息,外媒报道称,分析公司Similarweb的数据显示,在整合了OpenAI的技术后,微软旗下的必应在页面访问量方面实现了更多的增长。截至3月20日的数据显示,自微软2月7日推出其人工智能版本以来,必应搜索引擎的页面访问量增加了15.8%,而Alphabet旗下的谷歌搜索引擎则下降了近1%。这些数据是微软在与谷歌争夺生

Reddit和Twitter上的用户从3月20日开始报告了ChatGPT的一个漏洞,并发布了一些屏幕截图,显示他们的ChatGPT网页历史记录中包含他们不熟悉的对话标题。虽然以这种方式似乎无法访问共享聊天内容,但OpenAI公司在关闭该漏洞时完全删除了聊天历史记录。根据行业媒体的报道,ChatGPT在当天还出现了重大中断,那些可以访问的用户注意到提供了不一致的服务。OpenAI公司在其状态页面上记录了中断情况,并在最初报告的几个小时内恢复了服务。OpenAI公司的首席执行官 Sam Altman

前几天,谷歌差点遭遇一场公关危机,Bert一作、已跳槽OpenAI的前员工Jacob Devlin曝出,Bard竟是用ChatGPT的数据训练的。随后,谷歌火速否认。而这场争议,也牵出了一场大讨论:为什么越来越多Google顶尖研究员跳槽OpenAI?这场LLM战役它还能打赢吗?知友回复莱斯大学博士、知友「一堆废纸」表示,其实谷歌和OpenAI的差距,是数据的差距。「OpenAI对LLM有强大的执念,这是Google这类公司完全比不上的。当然人的差距只是一个方面,数据的差距以及对待数据的态度才

据报道,美国新闻行业正将AI聊天机器人视为一种新的生存威胁。他们担心人们会认为聊天机器人提供的文章摘要已经足够好,从而不再访问他们的网站,致使读者和广告商流失。然而,也有媒体高管认为,尽管存在潜在的威胁,但也有机会。他们正试图在行业变革中领先一步,以适应读者获取信息方式的演变。以下是翻译内容当你向微软Bing聊天机器人询问美国前总统唐纳德·特朗普(Donald Trump)是否被起诉时,它的回答会让传媒高管们感到害怕。机器人给出的三句摘要似乎很有用,它不仅提供了CNN、华盛顿邮报等新闻媒体的链

Vince Kellen是美国加州大学圣地亚哥分校(UCSD)的首席信息官,他深知ChatGPT、DALL-E和其他生成式AI技术有据可查的局限性:生成的答案可能并不真实,生成的图像也可能缺乏完整性,输出可能存在偏差。但无论如何他都在向前推进,他表示,员工们已经在使用ChatGPT来编写代码和工作内容描述了。OpenAI的文本生成技术ChatGPT以及图像生成技术DALL-E在一系列吸引了公众想象力的大型语言模型(也称为生成语言模型或者生成式AI)中是最突出的,这些模型响应书面请求以生成从文本文

本次分享题目为 ChatGPT 技术、国产化尝试和开源模型。分享包含三大部分的内容,第一部分总体介绍 ChatGPT 相关的技术:ChatGPT 技术的演进、目前存在什么样的问题、ChatGPT 技术学习的三个阶段、数据组织和效果评估;第二部分分享我们在 ChatGPT 技术国产化方面进行的尝试,包含实验过程中我们遇到的问题、进行的思考以及模型的效果和应用;第三部分介绍我们已经发布的中文开源大模型,使用自有数据训练出本地模型如何进行操作,在实验过程中可能遇到的问题,和开源的先进模型相比存在的差距

ChatGPT可以联网后,OpenAI还火速介绍了一款代码生成器,在这个插件的加持下,ChatGPT甚至可以自己生成机器学习模型了。 上周五,OpenAI刚刚宣布了惊爆的消息,ChatGPT可以联网,接入第三方插件了!而除了第三方插件,OpenAI也介绍了一款自家的插件「代码解释器」,并给出了几个特别的用例:解决定量和定性的数学问题;进行数据分析和可视化;快速转换文件格式。此外,Greg Brockman演示了ChatGPT还可以对上传视频文件进行处理。而一位叫Andrew Mayne的畅销作

将文心一言发布时间定在3月16日的百度,没能预料到会遭到来自OpenAI、谷歌、微软的轮番轰炸:先是3月15日凌晨,OpenAI发布大型多模态Transformer模型GPT-4;紧接着,宣布开放大规模语言模型PaLM的API接口,并推出面向开发者的工具MakerSuite;文心一言发布之后,巨头们也并没有歇着,3月16日晚间,微软更是发布由AI驱动的办公神器Microsoft 365 Copilot,号称让Word、PPT、Excel、OutLook、协同办公软件的生产力都飙增。文心一言对标C


핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

맨티스BT
Mantis는 제품 결함 추적을 돕기 위해 설계된 배포하기 쉬운 웹 기반 결함 추적 도구입니다. PHP, MySQL 및 웹 서버가 필요합니다. 데모 및 호스팅 서비스를 확인해 보세요.

드림위버 CS6
시각적 웹 개발 도구

DVWA
DVWA(Damn Vulnerable Web App)는 매우 취약한 PHP/MySQL 웹 애플리케이션입니다. 주요 목표는 보안 전문가가 법적 환경에서 자신의 기술과 도구를 테스트하고, 웹 개발자가 웹 응용 프로그램 보안 프로세스를 더 잘 이해할 수 있도록 돕고, 교사/학생이 교실 환경 웹 응용 프로그램에서 가르치고 배울 수 있도록 돕는 것입니다. 보안. DVWA의 목표는 다양한 난이도의 간단하고 간단한 인터페이스를 통해 가장 일반적인 웹 취약점 중 일부를 연습하는 것입니다. 이 소프트웨어는
