中国通过其AI模型再次做到了这一点,这次打击更大,更好! Baidu - 一家中国人工智能公司,最近发布了两种大型语言模型(LLMS) - Ernie 4.5和X1。这些模型声称要比Openai的最新和最出色的模型更好,这些模型比DeepSeek-R1更具成本效益!这些型号似乎太好了,无法实现 - 以价格的一小部分提供高质量。在此博客中,我们将探索Ernie 4.5和X1模型,评估其基准结果,并查看它们在现实世界应用程序中的表现。所以,让我们开始。
目录
- 什么是Ernie 4.5和X1?
- Ernie 4.5
- Ernie X1
- 如何访问Ernie 4.5和X1?
- Ernie 4.5和X1性能检查
- 任务1:推理图像分析
- 任务2:文档分析摘要
- 任务3:音频分析
- 任务4:创造力图像生成
- 百度的Ernie 4.5和X1:价格
- Ernie 4.5和X1:标准基准结果
- 未来的影响
- 结论
- 常见问题
什么是Ernie 4.5和X1?
Ernie 4.5和X1是由领先的中国科技公司百度开发的两个最新的多模式LLM,专门从事互联网服务,人工智能和自动驾驶。它以其在中国的主要搜索引擎以及AI驱动创新的进步而闻名。百度(Baidu)于2021年12月推出了其第一个LLM Ernie 3.0 Titan。此后,它发布了更多型号,同时同时工作以构建更强大的LLMS。所有研究和持续努力的结果是Ernie 4.5和X1。
Ernie 4.5
Ernie 4.5是一种能够理解和集成各种数据类型的多模式基础模型,包括文本,图像,音频和视频。这种多样化的建模方法增强了其理解和生成各种内容的能力。
以下是Ernie 4.5的一些关键特征:
- Ernie 4.5在其前身Ernie 4.0上显示出对理解,产生,推理和记忆的全面改进。
- 它在预防幻觉,逻辑推理和编码方面表现出很大的能力,使其擅长以更高的精度处理复杂的任务。
- 该模型甚至比OpenAI的GPT-4.5在多个基准测试中的表现更好,而使用GPT-4.5的成本仅为1%!
Ernie X1
Ernie X1被设计为具有多模式功能的深刻思维推理模型。这是百度发行的同类深思熟虑模型。以下是其主要特征:
- Ernie X1在理解环境,计划其思维过程,反思其反应并随着时间的流逝而发展。
- 它能够自主利用各种工具来进行高级搜索,图像理解和复杂计算等任务。
- 该模型与DeepSeek-R1的表现相同,但价格为一半,为寻求高级AI功能的企业提供了一种成本效益的解决方案。
如何访问Ernie 4.5和X1?
您可以通过AI聊天机器人或通过API访问Ernie 4.5和X1。
通过机器人访问:
- 前往https://yiyan.baidu.com 。
- 通过添加您的详细信息并开始创建您的帐户。
Baidu的Ernie Bot平台上的个别用户都可以自由访问这两种型号。但是,目前,Ernie Bot的注册仅限于中国国民。
通过API访问:
- 前往Baidu AI Cloud的Maas平台Qianfan
- 在平台上创建您的帐户以入门。
当前,该平台无法由所有用户访问。另外,仅通过API提供Ernie 4.5,而Ernie X1很快将在平台上提供。
Ernie 4.5和X1性能检查
在本节中,我们将找出这些模型在涉及多媒体,推理,文档分析等任务中的执行方式。由于模型接口仅支持中文,并且帐户创建仅限于中国国民,因此我们将研究一些人们如何使用这两种模型以及他们收到的输出的示例。我们将介绍我们在网上找到的Ernie 4.5和X1的一些最常见的用例,包括:
- 图像分析推理
- 文档分析和摘要
- 音频分析
- 创造力和形象产生
任务1:推理图像分析
在此任务中,要求该模型解决以图像形式给出的数学问题。
使用的模型: Ernie 4.5
输出:
就像大多数其他多模式LLM一样,Ernie 4.5快速分析视频并解决图像中的问题。它将图像中的所有问题一个一个一个接一个地总结了所有问题。其性能的速度和准确性使其成为需要快速准确解决问题的学生,教育者,研究人员和专业人士的有用工具。
任务2:文档分析摘要
在这里,该模型得到了一个文档,它必须总结该文档中有关特定主题的信息。
使用的模型: Ernie 4.5
输出:
该模型允许您一次上传各种类型的多个文件。它能够处理不同类型的文件,包括文档,PDF,PPT,Excel表等。从上传的文件中,您可以选择要查询聊天机器人的一个(或更多),并迅速总结了主题。它快速处理多个文件对于研究分析,法律文档审查,财务数据提取和公司报告等任务非常有用。
任务3:音频分析
为此,该模型必须分析给定的音频并找到其源。
使用的模型: Ernie 4.5
输出:
音频分析是一项功能,即流行的AI聊天机器人都没有在其界面中合并,这使Ernie 4.5(第一个同类)成为了Ernie 4.5。该模型快速分析剪辑,确定其源,甚至继续描述剪辑的重要性。它的快速分析和详细描述,使其成为跨越媒体,客户服务,教育和执法部门的实时转录,基于语音的搜索,深层捕获和情感分析等任务的宝贵工具。
任务4:创造力图像生成
对于此任务,该模型必须分析一个房间,并提出可能增强其整体吸引力的可能装饰。然后,它必须生成房间的更新图像。
使用的模型: Ernie X1
输出:
该模型快速处理图像。然后,它暗示了房间装饰的可能改进,以增强整体吸引力。最后,它通过所有建议的增强功能生成房间的图像。此功能是室内设计,家庭装修计划,房地产舞台和虚拟装饰可视化等任务的绝佳补充。
注意:我们以X上的这篇文章为例。
百度的Ernie 4.5和X1:价格
与OpenAI,DeepSeek,Grok,Claude等的顶级模型相比,Ernie 4.5和X1都具有所有功能,甚至更多的功能。这是这两个模型的定价分解:
模型 | 输入价格(每百万个令牌) | 输出价格(每百万个令牌) | 可用性 |
Ernie 4.5 | $ 0.55 | $ 2.20 | 可用的 |
Ernie X1 | $ 0.28 | $ 1.10 | 尚未可用 |
与其他顶级型号相比,Ernie 4.5和X1的价格明显便宜,使其成为生成AI的发展中的宝贵资产。
Ernie 4.5和X1:标准基准结果
我们已经看到了最新的Ernie模型的功能,功能和定价。现在,让我们看一下这些模型的一些性能数字,例如GPT-4.5,GPT-4O,DeepSeek-R1等最高模型。
下图比较了测试多模式AI性能的多个基准测试的Ernie 4.5和GPT-4O。
该图显示:
- 在大多数多模式任务中,Ernie 4.5优于GPT-4O。
- Ernie 4.5的平均得分为77.77,高于GPT-4O的73.92。
- Ernie 4.5在Mathvista和DocVQA方面具有显着优势,显示了更好的数学推理和基于文件的问题的技能。
- 这两种模型在OCRBENCH和MMMU中的性能类似,但是Ernie 4.5仍然具有略有优势。
下一张图比较了Ernie 4.5,DeepSeek V3 - CHAT,GPT-4O和GPT-4.5在多个基准测试中,用于基于文本的推理和解决问题。
这是图表中的一些关键要点:
- Ernie 4.5的平均得分为79.6,超过DeepSeek V3 - 聊天率79.14。
- 它在一般知识,推理和编程基准(例如MMLU-PRO,GSM8K和HUMANEVAL)等基准方面表现良好。
- GPT-4O和DeepSeek V3也表现出强劲的结果,DeepSeek V3在CMMLU等中国基准测试中竞争性能。
- Ernie 4.5在GSM8K(数学)和C-eval(一般推理)中表现出色,尽管DeepSeek V3的性能非常接近。
未来的影响
成为LLM顶级LLM的比赛正在加热,Baidu的Ernie 4.5&X1为Openai,DeepSeek,Anthropic和Meta引发了激烈的竞争。随着中国人工智能实验室提供的模型可与成本的一小部分竞争或超过西部AI,公司将被迫更快地创新并降低其成本以保持竞争力。
所有这些进步最终将导致:
- 所有主要AI研究中心的AI进步更快。
- 为企业和开发人员提供更多负担得起的AI。
- 多模式AI应用程序的新时代,扩展了传统的基于文本的AI。
结论
百度的Ernie 4.5和X1型号不仅是另一组AI模型,而且是行业破坏者。它们出色的多模式和推理能力,低价以及与中国数字生态系统的深入整合,这表明全球AI市场的权力转移。
如果这种趋势继续下去,我们将在各个行业看到大规模的AI民主化和推广。这也将促使许多西方公司发布更便宜的车型。这不仅会增加市场上的竞争力,而且还可以确保用户获得最大的价值。
常见问题
Q1。什么是Ernie 4.5和X1?A. Ernie 4.5和X1是Baidu开发的最新大型语言模型(LLMS),旨在与OpenAI的GPT-4.5和DeepSeek-R1(例如Openai的GPT-4.5和DeepSeek-R1)相媲美。 Ernie 4.5是一种多模式的基础模型,而Ernie X1是具有高级功能的深刻思维推理模型。
Q2。 Baidu的Ernie 4.5与Ernie X1有何不同?A. Ernie 4.5经过优化,可用于多模式理解,能够以很高的精度处理文本,图像,音频和视频。另一方面,Ernie X1旨在深入思考的推理,通过自我反思来解决情境理解,计划和解决问题。
Q3。 Ernie 4.5和X1与OpenAI的GPT-4.5相比如何?A. baidu Ernie 4.5在多个基准测试中胜过GPT-4.5,尤其是在推理,多模式理解和预防幻觉中,同时仅占GPT-4.5价格的1%。 Ernie X1以一半的成本提供DeepSeek-R1水平的性能,使其具有竞争激烈的AI解决方案。
Q4。 Ernie 4.5和X1的定价细节是什么? A. Ernie 4.5:输入成本$ 0.55每100万代币,输出成本为每100万代币2.20美元。
Ernie X1:输入的价格为每100万代币0.28美元,输出成本为每100万代币1.10美元。
Ernie X1模型尚未通过API可用,但很快就会出现。
答:您可以通过以下方式访问这些模型:
1。ernie bot(AI chatbot)atyyan.baidu.com(仅适用于中国用户)。
2。BaiduAI Cloud的MAAS平台Qianfan,用于API访问(目前只有Ernie 4.5可用)。
以上是Baidu' eernie 4.5&x1是否会替换GPT-4.5和DeepSeek-R1?的详细内容。更多信息请关注PHP中文网其他相关文章!

Meta携手Nvidia、IBM和Dell等合作伙伴,拓展了Llama Stack的企业级部署整合。在安全方面,Meta推出了Llama Guard 4、LlamaFirewall和CyberSecEval 4等新工具,并启动了Llama Defenders计划,以增强AI安全性。此外,Meta还向10个全球机构(包括致力于改善公共服务、医疗保健和教育的初创企业)发放了总额150万美元的Llama Impact Grants。 由Llama 4驱动的全新Meta AI应用,被设想为Meta AI

公司开创性的人类互动公司Joi AI介绍了“ AI-Iatsionship”一词来描述这些不断发展的关系。 Joi AI的关系治疗师Jaime Bronstein澄清说,这并不是要取代人类C

在线欺诈和机器人攻击对企业构成了重大挑战。 零售商与机器人ho积产品,银行战斗帐户收购和社交媒体平台与模仿者的斗争。 AI的兴起加剧了这个问题,Rende

AI代理人有望彻底改变营销,并可能超过以前技术转变的影响。 这些代理代表了生成AI的重大进步,不仅是处理诸如chatgpt之类的处理信息,而且还采取了Actio

人工智能对关键NBA游戏4决策的影响 两场关键游戏4 NBA对决展示了AI在主持仪式中改变游戏规则的角色。 首先,丹佛的尼古拉·乔基奇(Nikola Jokic)错过了三分球,导致亚伦·戈登(Aaron Gordon)的最后一秒钟。 索尼的鹰

传统上,扩大重生医学专业知识在全球范围内要求广泛的旅行,动手培训和多年指导。 现在,AI正在改变这一景观,克服地理局限性并通过EN加速进步

英特尔正努力使其制造工艺重回领先地位,同时努力吸引无晶圆厂半导体客户在其晶圆厂制造芯片。为此,英特尔必须在业界建立更多信任,不仅要证明其工艺的竞争力,还要证明合作伙伴能够以熟悉且成熟的工作流程、一致且高可靠性地制造芯片。今天我听到的一切都让我相信英特尔正在朝着这个目标前进。 新任首席执行官谭立柏的主题演讲拉开了当天的序幕。谭立柏直率而简洁。他概述了英特尔代工服务的若干挑战,以及公司为应对这些挑战、为英特尔代工服务的未来规划成功路线而采取的措施。谭立柏谈到了英特尔代工服务正在实施的流程,以更以客

全球专业再保险公司Chaucer Group和Armilla AI解决了围绕AI风险的日益严重的问题,已联手引入了新型的第三方责任(TPL)保险产品。 该政策保护业务不利


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

Atom编辑器mac版下载
最流行的的开源编辑器

VSCode Windows 64位 下载
微软推出的免费、功能强大的一款IDE编辑器

WebStorm Mac版
好用的JavaScript开发工具

螳螂BT
Mantis是一个易于部署的基于Web的缺陷跟踪工具,用于帮助产品缺陷跟踪。它需要PHP、MySQL和一个Web服务器。请查看我们的演示和托管服务。

禅工作室 13.0.1
功能强大的PHP集成开发环境