Openai的O1:为期12天的礼物狂欢始于他们迄今为止最强大的模型
12月的到来带来了全球放缓,世界某些地区的雪花放缓,但Openai才刚刚开始。山姆·奥特曼(Sam Altman)和他的团队正在推出12天的礼物盛会,第一届礼物是主要礼物:Openai O1,迄今为止最先进的车型。几个月以来,GPT-4一直在统治最高,但O1在这里挑战其统治地位。该博客将O1与GPT-4O在多个任务中对抗GPT-4O,以确定高级模型。
目录
Openai O1:关键改进
OpenAI的O1在2024年9月的O1-preview型号的基础上为复杂的任务提供了提高的精度和速度。与其前身相比:
访问O1
O1可通过Chatgpt Plus和Chatgpt Pro订阅(不是免费计划)获得。 Chatgpt Pro提供无限的O1访问,而Plus提供有限数量的交互。访问:
O1与GPT-4O:正面比较
虽然O1-preview印象深刻,但GPT-4O(2024年5月推出)仍然是其准确性,速度和多功能性在处理文本,图像和音频的最佳选择。它的MMLU基准评分为88.7%,为多模式AI设定了高标准。 O1现在旨在超越GPT-4O,尤其是在数学,编码和复杂的问题解决方面。五个挑战将揭示胜利者:
挑战1:情感分析的流程图设计
提示:设计流程图并解释情感分析系统所需的工具,该系统获取股票新闻(新闻API),分析情感,并向客户提供140个字符的摘要和情感。
结果: O1产生了一个清晰,无错误的流程图,并提供了详细的解释和其他工具的建议。 GPT-4O提供了概念描述和缺陷图。
判决: O1获胜。
挑战2:科学图像分析
提示:计算此电路图的输出。 (提供的电路图图像)
结果: O1正确识别的组件,从图形中读取值,描述的电路操作和计算的参数。 GPT-4O确定了一些组件,但需要其他输入值。
判决: O1获胜。
挑战3:数学图像分析
提示:确定此游戏中每个团队的胜利概率。 (提供的板球记分牌的图像)
结果: O1准确地分析了图像,确定了游戏格式,并以理由进行了计算的胜利概率。 GPT-4O部分理解了游戏,但未能提供概率。
判决: O1获胜。
挑战4:Sudoku解决方案
提示:解决此Sudoku难题并提供解决方案作为图像。 (提供的Sudoku拼图的图像)
结果:这两个模型都无法提供正确的解决方案。
判决:领带(都失败)。
挑战5:图像生成
提示:创建在海边附近跑步的狗的图像。
结果: GPT-4O生成了请求的图像; O1目前缺乏图像生成功能。
判决: GPT-4O获胜。
结果摘要:O1与GPT-4O
挑战 | GPT-4O结果 | O1结果 | 判决 |
---|---|---|---|
流程图设计 | 概念,不清楚的错误 | 清晰,详细,无错误 | O1 |
科学图像分析 | 部分组件识别,不完整 | 完整的分析,准确的计算 | O1 |
数学图像分析 | 部分理解,没有给出的概率 | 准确的分析,计算的概率 | O1 |
Sudoku解决方案 | 不正确 | 不正确 | 领带 |
图像生成 | 正确生成的图像 | 无法生成图像 | GPT-4O |
结论
O1在许多领域都明显胜过GPT-4O,表明推理和精度较高。它的速度和简洁性也是对O1审视的值得注意的改进。但是,它并非完美无瑕,可能需要迭代精致。 O1是需要先进解决问题能力的研究人员,科学家和专业人员的强大工具。
常见问题
以上是O1 vs GPT-4O:OpenAI的新型号比GPT-4O好吗?的详细内容。更多信息请关注PHP中文网其他相关文章!