Openai的最新产品GPT-4O Mini标志着朝着负担得起且可访问的高级AI迈出的重要一步。这个小型语言模型(SLM)直接挑战诸如Llama 3和Gemma 2之类的竞争对手,具有低潜伏期,成本效益和大量128K令牌上下文窗口。本文深入研究了对GPT-4O Mini的全面评估,将其性能与其前任GPT-3.5 Turbo和GPT-4O进行了一系列任务。
关键功能
- 具有成本效益和快速的: GPT-4O MINI优先考虑效率,以比较大型号低得多的成本提供接近实时的响应。
- 多模式潜力:当前支持文本和图像输入时,未来的计划包括音频和视频集成。
- 出色的基准性能: GPT-4O MINI在推理,数学和编码基准测试中表现出卓越的性能,超过了其前任和竞争对手。
- 广泛的可用性:可通过OpenAI的API(助手,聊天完成和批处理API)访问,使开发人员很容易获得高级AI功能。
目录
- 探索GPT-4O MINI的功能
- 性能基准和比较
- 定价和可用性
- 比较任务分析
- 设置和代码示例
- 任务1:零射门分类
- 任务2:很少分类
- 任务3:Python编码
- 任务4:SQL编码
- 任务5:信息提取
- 任务6:封闭域问题回答
- 任务7:开放域问题回答
- 任务8:文档摘要
- 任务9:内容转换
- 任务10:语言翻译
- 结论
探索GPT-4O MINI的功能
Openai对负担能力的关注在GPT-4O Mini的设计中很明显。其低成本和延迟有助于生成AI应用的快速发展。 “大上下文”窗口可以处理广泛的文本数据,从而快速响应和API调用的有效并行化。
像GPT-4O一样,GPT-4O MINI是多模式的,目前正在处理文本和图像,并提供了对音频和视频的未来支持。截至2023年10月,经过培训,它拥有128K令牌输入上下文窗口和每个请求的16K令牌输出限制。与GPT-4O共享同样的令牌,它为非英语提示提供了改进的性能。
性能基准和比较
对各种LLM的严格测试,包括双子座,克劳德,GPT-3.5 Turbo和GPT-4O,揭示了GPT-4O Mini的出色性能。
关键基准测试结果突出了GPT-4O Mini的优势:
- 推理: MMLU的得分为82.0%,超过双子座闪光灯(77.9%)和Claude Haiku(73.8%)。
- 数学:在MGSM上获得87.0%的成绩,超过双子座闪光灯(75.5%)和Claude Haiku(71.7%)。
- 编码:人类事件的分数为87.2%,优于Gemini Flash(71.5%)和Claude Haiku(75.9%)。
- 多模式推理: MMMU的出色表现,得分为59.4%,而Gemini Flash的得分为56.1%,Claude Haiku为50.2%。
通过人工分析的独立分析进一步验证了GPT-4O MINI的速度和成本优势。
GPT-4O MINI在功能和工具调用方面也很出色,使其适合复杂的AI代理开发。它提高了长篇下说的性能和提取结构化数据并产生高质量电子邮件响应的能力是显着的优势。
定价和可用性
GPT-4O Mini可以通过OpenAI的助手,聊天完成和批处理API来获得。定价具有很高的竞争力:\ $ 0.15每100万输入令牌和每100万输出令牌\ $ 0.60。预计还可以通过ChatGpt(免费,加上和团队计划)访问。
(剩余的响应将继续对每个任务进行详细分析,反映了原始输入的结构和内容,但是通过略有释义和句子进行了重组,以达到所需的释义水平。这些图像将保持不变并且以其原始形式。)。
以上是GPT-4O MINI:OpenAI的最新模型如何堆叠?的详细内容。更多信息请关注PHP中文网其他相关文章!

自2008年以来,我一直倡导这辆共享乘车面包车,即后来被称为“ Robotjitney”,后来是“ Vansit”,这是城市运输的未来。 我预见这些车辆是21世纪的下一代过境解决方案Surpas

革新结帐体验 Sam's Club的创新性“ Just Go”系统建立在其现有的AI驱动“扫描和GO”技术的基础上,使会员可以在购物旅行期间通过Sam's Club应用程序进行扫描。

NVIDIA在GTC 2025上的增强可预测性和新产品阵容 NVIDIA是AI基础架构的关键参与者,正在专注于提高其客户的可预测性。 这涉及一致的产品交付,达到绩效期望以及

Google的Gemma 2:强大,高效的语言模型 Google的Gemma语言模型家族以效率和性能而庆祝,随着Gemma 2的到来而扩展。此最新版本包括两种模型:270亿个参数VER

这一领先的数据剧集以数据科学家,天体物理学家和TEDX演讲者Kirk Borne博士为特色。 Borne博士是大数据,AI和机器学习的著名专家,为当前状态和未来的Traje提供了宝贵的见解

这次演讲中出现了一些非常有见地的观点——关于工程学的背景信息,这些信息向我们展示了为什么人工智能如此擅长支持人们的体育锻炼。 我将从每位贡献者的观点中概括出一个核心思想,以展示三个设计方面,这些方面是我们探索人工智能在体育运动中应用的重要组成部分。 边缘设备和原始个人数据 关于人工智能的这个想法实际上包含两个组成部分——一个与我们放置大型语言模型的位置有关,另一个与我们人类语言和我们的生命体征在实时测量时“表达”的语言之间的差异有关。 Alexander Amini 对跑步和网球都很了解,但他还

卡特彼勒(Caterpillar)的首席信息官兼高级副总裁杰米·恩格斯特(Jamie Engstrom)领导了一支由28个国家 /地区的2200多名IT专业人员组成的全球团队。 在卡特彼勒(Caterpillar)工作了26年,其中包括她目前的四年半,Engst

Google Photos的新Ultra HDR工具:快速指南 使用Google Photos的新型Ultra HDR工具增强照片,将标准图像转换为充满活力的高动态范围杰作。对于社交媒体而言,此工具可提高任何照片的影响,


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

SublimeText3 英文版
推荐:为Win版本,支持代码提示!

mPDF
mPDF是一个PHP库,可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件,并处理不同的语言。与原始脚本如HTML2FPDF相比,它的速度较慢,并且在使用Unicode字体时生成的文件较大,但支持CSS样式等,并进行了大量增强。支持几乎所有语言,包括RTL(阿拉伯语和希伯来语)和CJK(中日韩)。支持嵌套的块级元素(如P、DIV),

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

MinGW - 适用于 Windows 的极简 GNU
这个项目正在迁移到osdn.net/projects/mingw的过程中,你可以继续在那里关注我们。MinGW:GNU编译器集合(GCC)的本地Windows移植版本,可自由分发的导入库和用于构建本地Windows应用程序的头文件;包括对MSVC运行时的扩展,以支持C99功能。MinGW的所有软件都可以在64位Windows平台上运行。

Atom编辑器mac版下载
最流行的的开源编辑器