近日,新华社研究院中国企业发展研究中心发布的《人工智能大模型体验报告2.0》(以下简称“报告”)显示,当前中国大模型产品进步显著,360智脑、智谱ChatGLM等表现抢眼。其中360智脑大模型在基础能力等方面稳居大模型第一梯队。报告评价称AI大模型的发展为人类工作和生活的提质增效均带来了正向的积极影响。
据悉,此次测评特邀北京大学文化与传播研究所及其他业界、学界专家全程参与,包括基础能力、智商测试、情商测试、工具提效能力等500道题目,测评在题型数量、题型质量、专家团队等方面均有升级,更加权威客观。
报告引用360智脑对部分题目的回答作为最佳案例展示,如“山西食客倒醋洗碗”等时效性问题,360智脑“展现了大模型强大的实时搜索与回复能力”。
据了解,人工智能大模型目前有两大短板,即实时性和准确性,在企业级场景中是致命缺陷。而搜索引擎可以帮助大模型进行知识更新和知识校正,解决数据滞后和幻觉等问题。360作为国内第二大搜索引擎厂商,拥有天然的大模型技术基因和优势。
报告显示,目前“大模型进程过半,AI走进千家万户成为关注重点”。360集团创始人周鸿祎认为,大模型未来真正的发展机会在企业级市场,大模型有引领新一轮工业革命的潜质,前提是走进千家万户、赋能百业千行。据了解,360已推出企业级AI大模型解决方案,将遵循“安全、向善、可信、可控”四原则打造企业级垂直大模型,目前已经为20个行业提供解决方案。
报告同时提到“安全可靠的大模型产品应用正成为深耕方向”。据了解,大模型目前主要面临网络安全、数据安全、算法安全三大安全问题。360拥有全球规模最大的安全大数据、世界领先的APT捕获能力,并将AI大模型安全这一世界性课题作为攻克方向。日前360发布了国内首个可交付安全行业大模型,将作为“360安全云”的重要平台和工具,为企业运营提供“安全副手”。
360智脑是360集团自研的认知型通用大模型,在中文通用大模型基准评测等多个第三方评测中位列国产大模型能力领先。360集团作为工信部中国电子技术标准化研究院授予的“国家人工智能标准化总体组大模型专题组”组长单位,参与大模型测试国家标准制订。
以上是新華社聯合北大發表AI大模型評測:安全可靠成重點,360智腦表現優異的詳細內容。更多資訊請關注PHP中文網其他相關文章!