vivo将发布自研AI大模型矩阵 C-Eval、CMMLU双榜排名第一-人工智能-PHP中文网

首页

科技周边

人工智能

vivo将发布自研AI大模型矩阵 C-Eval、CMMLU双榜排名第一

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Oct 16, 2023 am 11:41 AM

10月16日，C-Eval大模型评测榜单更新，榜单显示，vivo自研大模型在C-Eval全球中文榜单中排名第一。此前，vivo自研大模型已取得了C-Eval百亿内大模型榜单第一，CMMLU全球中文榜单第一以及其百亿内大模型榜单第一的好成绩。vivo相关负责人透露，vivo自研AI大模型将会在即将发布的OriginOS 4系统中被首次应用，其中包括十亿、百亿、千亿三个不同参数量级的5款自研大模型，全面覆盖核心应用场景。

C-Eval榜单是由清华大学、上海交通大学和爱丁堡大学合作构建的面向中文语言模型的综合性考试评测集，涵盖52个不同学科，共有13948道多项选择题，是目前较为权威的中文AI大模型评测榜单。CMMLU数据集则是一个综合性的中文评估基准，由MBZUAI、上海交通大学、微软亚洲研究院共同推出，在评估语言模型在中文语境下的知识和推理能力方面极具权威性。

vivo将发布自研AI大模型矩阵 C-Eval、CMMLU双榜排名第一

此次，vivo自研AI大模型同时登顶C-Eval、CMMLU两大榜单，展现出其在中文语言模型领域的绝对领先实力，同时体现出业界对vivo的AI创新能力和发展潜力的肯定。

当下，AI大模型技术快速发展，推动社会生产、生活方式发生颠覆性变革，在手机行业，其也有望成为厂商加速产品迭代、开辟蓝海赛道的关键机遇。本次vivo打造自研AI大模型矩阵并将其应用于新系统，证明其对大模型的探索已从技术研发阶段进阶至应用及产业布局阶段，这不仅会有力推动vivo自身的业务增长和高端化战略落地，对于整个行业而言具有十分积极的带动作用。

vivo将发布自研AI大模型矩阵 C-Eval、CMMLU双榜排名第一

据了解，在11月1日举办的vivo开发者大会(2023 VDC)中将发布全新手机操作系统OriginOS 4，该系统将首发vivo自研A大模型，为消费者带来更加智能、便捷、安全的手机使用体验。本次vivo自研大模型、OriginOS 4带来的全新功能体验，以及vivo在开发者大会上公布的更多技术、服务创新与生态建设成果，值得期待与瞩目。

运营商财经（官方微信公众号yyscjrd）—— 主流财经网站，一家全面覆盖科技、金融、证券、汽车、房产、食品、医药、日化、酒业及其他各种消费品网站。

以上是vivo将发布自研AI大模型矩阵 C-Eval、CMMLU双榜排名第一的详细内容。更多信息请关注PHP中文网其他相关文章！

声明

本文转载于：搜狐。如有侵权，请联系admin@php.cn删除

您必须在无知的面纱后面建立工作场所Apr 29, 2025 am 11:15 AM

在约翰·罗尔斯1971年具有开创性的著作《正义论》中，他提出了一种思想实验，我们应该将其作为当今人工智能设计和使用决策的核心：无知的面纱。这一理念为理解公平提供了一个简单的工具，也为领导者如何利用这种理解来公平地设计和实施人工智能提供了一个蓝图。设想一下，您正在为一个新的社会制定规则。但有一个前提：您事先不知道自己在这个社会中将扮演什么角色。您最终可能富有或贫穷，健康或残疾，属于多数派或边缘少数群体。在这种“无知的面纱”下运作，可以防止规则制定者做出有利于自身的决策。相反，人们会更有动力制定公

决策，决策……实用应用AI的下一步Apr 29, 2025 am 11:14 AM

许多公司专门从事机器人流程自动化（RPA），提供机器人以使重复性任务自动化 - UIPATH，在任何地方自动化，蓝色棱镜等。同时，过程采矿，编排和智能文档处理专业

AI的未来超越了简单的单词预测和对话模拟。 AI代理人正在出现，能够独立行动和任务完成。这种转变已经在诸如Anthropic的Claude之类的工具中很明显。 AI代理：研究

为什么同情在AI驱动的未来中对领导者更重要Apr 29, 2025 am 11:12 AM

快速的技术进步需要对工作未来的前瞻性观点。当AI超越生产力并开始塑造我们的社会结构时，会发生什么？ Topher McDougal即将出版的书Gaia Wakes：

用于产品分类的AI：机器可以总税法吗？Apr 29, 2025 am 11:11 AM

产品分类通常涉及复杂的代码，例如诸如统一系统（HS）等系统的“ HS 8471.30”，对于国际贸易和国内销售至关重要。这些代码确保正确的税收申请，影响每个INV

数据中心的需求会引发气候技术反弹吗？Apr 29, 2025 am 11:10 AM

数据中心能源消耗与气候科技投资的未来本文探讨了人工智能驱动的数据中心能源消耗激增及其对气候变化的影响，并分析了应对这一挑战的创新解决方案和政策建议。能源需求的挑战：大型超大规模数据中心耗电量巨大，堪比数十万个普通北美家庭的总和，而新兴的AI超大规模中心耗电量更是数十倍于此。2024年前八个月，微软、Meta、谷歌和亚马逊在AI数据中心建设和运营方面的投资已达约1250亿美元（摩根大通，2024）（表1）。不断增长的能源需求既是挑战也是机遇。据Canary Media报道，迫在眉睫的电

AI和好莱坞的下一个黄金时代Apr 29, 2025 am 11:09 AM

生成式AI正在彻底改变影视制作。Luma的Ray 2模型，以及Runway的Gen-4、OpenAI的Sora、Google的Veo等众多新模型，正在以前所未有的速度提升生成视频的质量。这些模型能够轻松制作出复杂的特效和逼真的场景，甚至连短视频剪辑和具有摄像机感知的运动效果也已实现。虽然这些工具的操控性和一致性仍有待提高，但其进步速度令人惊叹。生成式视频正在成为一种独立的媒介形式。一些模型擅长动画制作，另一些则擅长真人影像。值得注意的是，Adobe的Firefly和Moonvalley的Ma

Chatgpt是否会慢慢成为AI最大的Yes-Man？Apr 29, 2025 am 11:08 AM

ChatGPT用户体验下降：是模型退化还是用户期望？近期，大量ChatGPT付费用户抱怨其性能下降，引发广泛关注。用户报告称模型响应速度变慢，答案更简短、缺乏帮助，甚至出现更多幻觉。一些用户在社交媒体上表达了不满，指出ChatGPT变得“过于讨好”，倾向于验证用户观点而非提供批判性反馈。这不仅影响用户体验，也给企业客户带来实际损失，例如生产力下降和计算资源浪费。性能下降的证据许多用户报告了ChatGPT性能的显着退化，尤其是在GPT-4（即将于本月底停止服务）等旧版模型中。这

See all articles