首页  >  文章  >  科技周边  >  腾讯大模型App元宝上线,我们用它「单挑」了下GPT-4o

腾讯大模型App元宝上线,我们用它「单挑」了下GPT-4o

王林
王林原创
2024-06-26 14:33:191015浏览
腾讯元宝 VS GPT-4o,究竟谁技高一筹?

最近,腾讯一改往日的慢性子,忽然「卷」起来了:

5 月 14 日,腾讯全面开源混元文生图模型;

5 月 17 日,腾讯发布一站式 AI 智能体创作与分发平台「腾讯元器」;

5 月 30 日,基于混元大模型的 App「腾讯元宝」正式上线,目前应用商店已经可以下载。

腾讯元宝是一个基于混元大模型及搜索引擎驱动的高效信息整合工具,界面设计简洁,可以搜索实时信息,也可以对上传的多格式文档进行总结、翻译,还能语音对话练习口语。

而此次腾讯元宝产品能力升级的背后,是腾讯混元底层模型的持续迭代。

据介绍,自 2023 年 9 月首次亮相以来,腾讯混元大模型的参数规模已从千亿升级至万亿,预训练语料从万亿升级至 7 万亿 tokens,并率先升级为多专家模型结构(MoE),整体性能相比 Dense 版本提升超 50%。

我们第一时间拿到了腾讯元宝的体验资格,今天就拿出来 “遛一遛”。

腾讯元宝「单挑」GPT-4o

相比此前测试阶段的混元小程序版本,面向工作效率场景,腾讯元宝提供了 AI 搜索、AI 总结、AI 写作等核心能力。

没有对比就没有发言权。我们决定让腾讯元宝和大洋彼岸的 GPT-4o 进行较量。

Round 1:AI 搜索

如今,AI 搜索是香饽饽。

无论是「搜索之王」谷歌还是新晋顶流 OpenAI,都在 AI 搜索上做文章,甚至成立不到 2 年的 Perplexity AI 都成了黄仁勋的「心头好」。英伟达创始人黄仁勋曾公开表示,自己最爱用的 AI 工具是 Perplexity。

腾讯元宝自然上线了这一功能。

要知道,微信公众号每天都生成大量优质深度文章,背靠这棵大树,腾讯的 AI 搜索功能有着得天独厚的优势。

我们在「腾讯元宝」下方输入框中输入「现在适合买黄金吗?」

(温馨提示:投资需谨慎)

腾讯元宝的回答:

腾讯大模型App元宝上线,我们用它「单挑」了下GPT-4o

GPT-4o 的回答:

腾讯大模型App元宝上线,我们用它「单挑」了下GPT-4o

首先,从响应速度上来说,二者可以说是不相上下,几秒钟时间,腾讯元宝就参考完 9 篇资料,并给出了回答。

其次,从回答内容上来说,腾讯元宝似乎更胜一筹。GPT-4o 仅仅给出了购买黄金需要考虑的几个因素,而腾讯元宝的答案涵盖黄金价格走势预测、投资风险以及投资策略,而且每条均有引用,这就避免了大模型「满嘴跑火车」的缺点。

此外, 腾讯这次真的把好钢用在了刀刃上。除了推荐了相关公众号文章外,腾讯元宝还在首页上线了快速播报功能,对当前最新、最重要的资讯进行摘要总结,而且每条资讯都会提供腾讯新闻的链接。

这一局,腾讯元宝胜!

Round2:文档总结

该功能旨在帮助用户高效获取和处理文档信息,腾讯元宝能够处理多种格式的文档,例如 PDF、Word、Excel 等。

前几天腾讯正好发布了 2024 年第一季度财报,我们下载了一份。

这份长达 48 页、3.2 万字的财报,不仅数字多,还是繁体字,看得人脑瓜子疼。这时 AI 就派上用场了。

我们将这份财报分别上传到腾讯元宝和 GPT-4o,让他们各自分析一下腾讯开年第一季度的营收情况。

腾讯元宝:

腾讯大模型App元宝上线,我们用它「单挑」了下GPT-4o

GPT-4o:腾讯大模型App元宝上线,我们用它「单挑」了下GPT-4o

总体来看,它们回答得条分缕析。两相比较 GPT-4o 的答案更加丰富,除了财务表现和主要业务表现外,GPT-4o 还提供了运营数据、财务状况等。

财务报表重在准确。我们拿着这堆数据一一校对,果然还是找到了 bug。

腾讯一季度的其他收入应为 20.6 亿元,腾讯元宝却写成 206 亿元,在换算过程中把小数点点错了。

腾讯大模型App元宝上线,我们用它「单挑」了下GPT-4o

而 GPT-4o 的數據全部正確。

這一局,GPT-4o 勝!

Round3:網頁總結

這是一種自動提取網頁關鍵資訊的功能,在用戶瀏覽大量資訊時,它能快速抓住網頁內容的重點,從而節省閱讀時間,提高效率。

上週,本站發布了一篇名為《李飛飛親自撰文:大模型不存在主觀感覺能力,多少億參數都不行》的文章。我們將該文章連結分別丟給騰訊元寶和 GPT-4o,讓他兩人總結連結內容。

騰訊元寶:腾讯大模型App元宝上线,我们用它「单挑」了下GPT-4o

GPT-4o:腾讯大模型App元宝上线,我们用它「单挑」了下GPT-4o

騰訊元寶領到任務後「埋頭總結」,從李飛飛的看法、空間智能與AI、AI 感覺能力的爭議、AI 感覺能力的錯誤推理、AI與人類智能的差異以及未來展望等6 個面向進行了概括。

不得不說,它總結得還挺到位。

不過,GPT-4o 臨時掉鍊子,「我無法直接訪問所提供鏈接的具體內容」,還讓我們提供文章描述或要點,GPT-4o 是懶得明明白白。

這一 part,騰訊元寶完勝!

Round4:AI 作圖

多模態也是重點考察對象。

我們就來看看這兩個 AI 的畫功。

我們輸入同一提示詞:請幫我畫一個可愛的卡通女孩穿著裙子,抱著一隻白色的小貓,全身,黃色背景,Keith Haring 風格的塗鴉,清晰的插圖,大膽的線條和純色,簡單的細節,極簡主義,黃色背景。

GPT-4o「罷工」了,原因是受內容政策的限制,無法產生與 Keith Haring 風格相關的圖像。

腾讯大模型App元宝上线,我们用它「单挑」了下GPT-4o

我們刪除「Keith Haring」關鍵字後,GPT-4o 才開始幹活:

腾讯大模型App元宝上线,我们用它「单挑」了下GPT-4o

騰訊元寶倒訊

的回應當然更討一般使用者的歡心,不過這也可能涉及版權問題。

腾讯大模型App元宝上线,我们用它「单挑」了下GPT-4o

一口氣上線 76 款智能體,主打實用好玩

智能體的風也刮到了騰訊元寶。 在介面頂端的「發現」一欄,騰訊元寶推出了涵蓋工作、娛樂、效率、學習、角色五大類,共 76 款智能體。目測大部分是使用者或開發者自行建立發布的。

其中效率類智能體包括 PPT 達人、工作報告鬼才、logo 設計小咖、宣傳稿產生器、招募大師等,主打一個實用。

而生活娛樂類則聚焦「好玩」,如電影推薦、周公解夢,還有同款熱門遊戲《完蛋!我被美女包圍了》…

此外,面對眼花繚亂的智能體,騰訊元寶還製作了首發精選榜單,創意繪畫、百變AI 頭像、口語陪練、創意貼貼貼、超能翻譯官這5 款智能體入選。

創意貼貼貼

小紅書上有一類小眾賽道火出圈,那就是萌寵貼紙,而「創意貼貼」就瞄準這一需求。 使用者只需輸入文字或上傳圖片,然後選擇風格即可。

我們上傳了一張潦草小狗的圖片,最終生成的貼紙效果如下:

腾讯大模型App元宝上线,我们用它「单挑」了下GPT-4o

也可以輸入提示詞以產生貼畫。提示詞:吃冰淇淋的小女孩,可愛風格。

腾讯大模型App元宝上线,我们用它「单挑」了下GPT-4o

百變 AI 頭像腾讯大模型App元宝上线,我们用它「单挑」了下GPT-4o

此功能可讓使用者利用 AI 技術產生個人化頭像,也可與 QQ 二維碼融合,為使用者的 QQ 帳號增添個人化元素。 該功能還提供芭比、多巴胺、復古繁花、白領精英等 12 種風格,我們選擇「復古港漫」風格,然後上傳一張黴霉的照片。

值得注意的是,上傳圖片要求五官清晰,解析度超過 500,避免畫質模糊、臉部遮擋、頭部過小或多人照片。

生成的效果如下:

腾讯大模型App元宝上线,我们用它「单挑」了下GPT-4o

雖然生成的頭像與黴黴八竿子打不著,不過畫風還蠻好看的。

由於操作簡單,我們玩到停不下來。

這是芭比風格的蘇菲・瑪索:

腾讯大模型App元宝上线,我们用它「单挑」了下GPT-4o

復古繁花風格的小李子:

腾讯大模型App元宝上线,我们用它「单挑」了下GPT-4o

元創造智能體」功能,把製作門檻徹底打下來了。

用戶只要點擊「創建智能體」,然後按照提示輸入名稱、角色設定、簡介、開場白、預置指令,並選擇音色、上傳 logo 即可。

例如我們創建的「朋友圈發瘋文學」生成器,分分鐘搞定。

我們讓它發個「人生歪理,句句在理」的文案,該智能體一股腦吐出來8 句,例如「人生就像打遊戲,不管多努力,總有那麼一關過不去。但是,我們依然熱愛這個遊戲,因為關關難過,關關過,這就是人生。 腾讯大模型App元宝上线,我们用它「单挑」了下GPT-4o

不過,騰訊元寶自訂的智能體還是過於「正經」了,不少句子說得確實在理,但不夠歪,不夠有梗。

如果懶得動手,也可以讓 AI 代勞。例如我們只輸入名稱「古人也 emo」,點擊「AI 生成」魔法棒,幾秒鐘 AI 就把剩下的工作完成了。我們只要在細節上調整一下即可。

以上是腾讯大模型App元宝上线,我们用它「单挑」了下GPT-4o的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn