首页  >  文章  >  科技周边  >  力压GPT-4o!新王Claude 3.5 Sonnet来了,直接免费可用

力压GPT-4o!新王Claude 3.5 Sonnet来了,直接免费可用

2024-06-22 01:08:30837浏览

前脚 OpenAI 发布 GPT4o,硬控全场,后脚就被最大的竞争对手 Anthropic 超越了。

力压GPT-4o!新王Claude 3.5 Sonnet来了,直接免费可用

刚刚,Anthropic 发布了全新大模型 Claude 3.5 Sonnet,号称是迄今为止最智能的模型

力压GPT-4o!新王Claude 3.5 Sonnet来了,直接免费可用

据介绍,Claude 3.5 Sonnet 是 Anthropic 即将推出的 Claude 3.5 系列的首个版本。该模型提高了整个领域的智能水平,在绝大多数基准评估中都超越了竞品大模型和自家前代最强 Claude 3 Opus。与此同时,运行速度、成本与自家前代 Claude 3 Sonnet 相当。
力压GPT-4o!新王Claude 3.5 Sonnet来了,直接免费可用

目前,Claude 3.5 Sonnet 已经在 Claude.ai 和 Claude iOS 应用程序上免费提供,而 Claude Pro 和 Team 计划订户能够以更高的速率访问它。

此外,Claude 3.5 Sonnet 已经可以直接通过 Anthropic API、亚马逊云科技 Bedrock 等渠道使用。每百万个输入 token 的价格为 3 美元,每百万个输出 token 的价格为 15 美元,上下文窗口为 200k token

力压GPT-4o!新王Claude 3.5 Sonnet来了,直接免费可用

力压GPT-4o!新王Claude 3.5 Sonnet来了,直接免费可用


Anthropic 称其目标是每隔几个月大幅度改进性能、速度和成本之间的权衡曲线。今年晚些时候将发布 Claude 3.5 Haiku 和 Claude 3.5 Opus。

除了开发下一代大模型之外,Anthropic 正在开发新的模式和功能,以支持更多企业用例,包括与企业应用程序的集成。团队还在探索诸如 Memory 之类的功能,使得模型能够记住用户的偏好和指定的交互历史,从而实现更加个性化和高效的体验。

比GPT-4o 更智能
比Claude 3 Opus 快两倍

Claude 3.5 Sonnet 为研究生水平推理(GPQA)、本科生水平知识(MMLU) 和编码能力(HumanEval) 设定了新的行业基准。它在理解细微差别、幽默和复杂指令方面表现出显着的进步,并且擅长以自然、亲切的语气撰写高质量的内容。 力压GPT-4o!新王Claude 3.5 Sonnet来了,直接免费可用
Claude 3.5 Sonnet 的运行速度是 Claude 3 Opus 的两倍。这种性能的提升加上实惠的价格,使 Claude 3.5 Sonnet 成为复杂任务的理想选择。

在内部代理编码评估中,Claude 3.5 Sonnet 解决了 64% 的问题,优于 Claude 3 Opus(解决了 38%)。 Anthropic  评估测试了 Claude 3.5 Sonnet 根据自然语言描述的需求,修复错误或增加功能到开源代码库中的能力。

在获得指导和相关工具后,Claude 3.5 Sonnet 可以独立编写、编辑和执行代码,并具有复杂的推理和故障排除功能。 Claude 3.5 Sonnet 可以轻松处理代码转换,这对于更新旧版应用程序和迁移代码库特别有效。

下表为 Claude 3.5 Sonnet 与其他模型的比较,评估基准包括推理、阅读理解、数学、科学和编码。在所有这些基准测试中,Claude 3.5 Sonnet 的表现均优于之前的前沿模型 Claude 3 Opus。

我们也可以看到表中 Claude3.5 与 GPT-4o 的对比数据,除了数学方面,得分都比 GPT-4o 高或者逼近

力压GPT-4o!新王Claude 3.5 Sonnet来了,直接免费可用


Anthropic 表示,Claude 3.5 Sonnet 是其最强的视觉模型,在所有标准视觉基准测试中都超越了前代 Claude 3 Opus


下图为 Claude 3.5 Sonnet 与 Claude 3 Opus、GPT-4o、Gemini 1.5 Pro 在视觉数学推理、科学图表、视觉问答、图表 QA、文件视觉 QA 任务中的性能比较。

力压GPT-4o!新王Claude 3.5 Sonnet来了,直接免费可用

Artifacts – New ways to use Claude

Anthropic also launched Artifacts on Claude.ai, a new feature that expands how users interact with Claude. When users ask Claude to generate something like a code snippet, text document, or website design, these artifacts appear in a dedicated window next to their conversation. This creates a dynamic workspace where they can view, edit and build on Claude’s creations in real time, seamlessly integrating AI-generated content into their projects and workflows.

The Artifacts preview feature marks Claude’s evolution from conversational AI to a collaborative work environment, and will soon be expanded to support team collaboration. In the near future, teams will be able to securely centralize their knowledge, documentation, and work-in-progress in a shared space, with Claude acting as a teammate on demand.

Finally, Anthropic says they rigorously test the model and are committed to reducing its potential for abuse.

The Anthropic security team conducted a series of assessments on Claude 3.5 Sonnet in the areas of chemical, biological, radiological and nuclear (CBRN) risks, cybersecurity and autonomous capabilities, and finally classified Claude 3.5 Sonnet as AI Security Level 2 ( ASL-2) model, indicating that it does not pose a risk of catastrophic injury.

Additionally, as part of its commitment to security and transparency, Anthropic is working with external experts to test and refine the security mechanisms in this latest model.

Official blog address: https://www.anthropic.com/news/claude-3-5-sonnet

以上是力压GPT-4o!新王Claude 3.5 Sonnet来了,直接免费可用的详细内容。更多信息请关注PHP中文网其他相关文章!
