“百模大战”近来又多了一个参与者,继上月推出了文生文的大语言模型“快意”后,快手方面不久前又上线了“文生图” 领域的自研大模型“可图”(Kolors)。作为短视频平台,快手的“可图”自然要用在自家的App上,依托可图大模型,快手方面也开始在短视频评论区内测“AI玩评”功能,试图解锁AIGC+短视频的新玩法。
据悉,快手的“AI玩评”是业内首次在大型App核心业务场景的评论区应用AIGC能力,该功能旨在提升用户在评论区的互动体验,用户可通过输入创意文字,即可轻松生成大量不同风格的图片,以丰富评论互动。用户只需要短视频的评论区输入6个字及以上的文字评论,点击评论框右下角的“AI”标识,就能一键生成评论配图,还可以点击“换换看”切换更多风格。
根据快手AI团队的说法,通过“AI玩评”功能,用户可以更准确、更有趣地表达自己的观点和情感,并在评论区进行更便捷的趣味互动,无需再寻找合适的图片或表情包,而是可以直接生成一张图片。据了解,AI玩评可以生成从赛博朋克、像素、写实动漫等常见风格,到新海诚、宫崎骏、大友克洋等个人风格浓厚的图片
通过分析用户输入的内容,绘制符合语义的图片已经成为Stable Diffusio、midjourney以及国内市场上各种拥有文生图功能的AI大模型的标配功能。换句话说,快手的AI玩评本质上是一个AI绘画工具,其背后的技术主要基于NLP自然语义处理,而准确识别用户想要表达的内容则是关键要素
AI玩评的效果取决于提示词(Prompt)。根据网友们的使用体验,如果文字评论中包含更多关于人物、景物、空间、动作等描述性内容,生成的图片就更符合实际情况。相反,如果评论中出现像“666”、“我的天!姐姐好厉害!”这样缺乏具体指代对象的模糊描述,AI生成的结果就无法看。因此,这个现实直接导致了AI玩评可能无法得到大多数用户的喜爱
问题来了,现阶段短视频平台的评论区是怎样的呢?实际上,这里是一个充满俏皮话、玩梗、抖机灵等情绪化内容的场景。由于短视频的特点,包括魔性洗脑的背景音乐、强烈刺激的画面和不确定的奖励机制,使得用户放弃思考,沉浸其中。因此,评论区里的评论通常只是简单的一句话,用户会用这句话来明确表达他们的好恶或观点
这一现实的结果,就是短视频评论区里用户输出的内容基本都是情绪化、缺乏定性的内容。试想一下,如果单纯是一堆形容词的堆砌,AI就会面临一个缺乏主体的困惑,也就是说最终AI生成的内容可能会与用户想要表达的差之千里。相信使用过Stable Diffusio、midjourney等工具的朋友都知道,如果Prompt是以形容词为主,那么缺乏名词的结果就是AI会放飞自我。
即便是目前最先进的GPT-4,在体验人类情感上其实也是有缺陷的,事实上,AI的情绪感知能力现阶段还是一个摆在所有AI研究者面前的难题。目前,一众AI大模型面向的领域不是严肃的生产力场景、就是与人类对话,几乎没有AI会涉及情绪化表达。所以这样一来,快手的AI玩评实际上很难做好本职工作,不给用户的评论拖后腿可能就不错了。
那么既然如此,快手又为什么要推出AI玩评呢?当然是为了让自家的文生图大模型“可图”,能有一个能落地的场景。而快手App本身几乎是快手唯一面向消费者的产品,所以“AIGC+短视频”就成为了他们几乎唯一能打出的牌。其实从这里就可以看到,快手作为移动互联网时代崛起的新巨头,在底蕴上相比BAT等传统巨头还是要逊色一些。
不同于几乎已经将自身打造成互联网水煤电的BAT,快手这一批在移动互联网时代成长起来的新巨头,目前几乎都呈现出业务线单一的“强干弱枝”特质,例如快手的核心业务基本上都是依托于快手App的,其他业务则几乎都还叫不上号。在这一轮AI概念爆发之前,一度曾被外界认为落寞的百度,除了搜索引擎之外、还做输入法,所以百度落地AI原生应用就可以被承载在百度输入法上。
可反观快手,现在除了快手App外,“可图”大模型还能用在哪里呢?如果要单独为AI大模型做一款App,快手就可能会失去先机。现在的情况,是国内市场各大AI大模型之间其实并没有在性能上拉开代差,各家的实际使用体验基本都差不多,而用户的选择往往也是有得用就行。即便是对于想要体验AI大模型魅力的用户,许多也都下载了有先发优势的百度文心一言。
事实上,要将AIGC与视频结合,B站可能做了个更好的示范。此前在今年夏季,B站推出了“AI视频小助理”账号,用户只需要在相应视频的评论区@AI视频小助理 ,后者就可以自动生成视频的文字摘要。对于B站的长视频而言,AI视频小助理的归纳和整理能够帮助用户在短时间完成信息提炼,所以自然就会受到许多用户的欢迎。
作为一款娱乐属性更为突出的产品,快手App想要更好地与AIGC结合,自然就要满足用户在娱乐方面的需求。比如根据评论智能生成表情包,可能就要远比在评论区里搞文生图更适合平台的氛围。
以上是快手内测AI玩评:大模型与短视频的碰撞效应如何?的详细内容。更多信息请关注PHP中文网其他相关文章!

科学家已经广泛研究了人类和更简单的神经网络(如秀丽隐杆线虫中的神经网络),以了解其功能。 但是,出现了一个关键问题:我们如何使自己的神经网络与新颖的AI一起有效地工作

Google的双子座高级:新的订阅层即将到来 目前,访问Gemini Advanced需要$ 19.99/月Google One AI高级计划。 但是,Android Authority报告暗示了即将发生的变化。 最新的Google P中的代码

尽管围绕高级AI功能炒作,但企业AI部署中潜伏的巨大挑战:数据处理瓶颈。首席执行官庆祝AI的进步时,工程师努力应对缓慢的查询时间,管道超载,一个

处理文档不再只是在您的AI项目中打开文件,而是将混乱变成清晰度。诸如PDF,PowerPoints和Word之类的文档以各种形状和大小淹没了我们的工作流程。检索结构化

利用Google的代理开发套件(ADK)的力量创建具有现实世界功能的智能代理!该教程通过使用ADK来构建对话代理,并支持Gemini和GPT等各种语言模型。 w

摘要: 小型语言模型 (SLM) 专为效率而设计。在资源匮乏、实时性和隐私敏感的环境中,它们比大型语言模型 (LLM) 更胜一筹。 最适合专注型任务,尤其是在领域特异性、控制性和可解释性比通用知识或创造力更重要的情况下。 SLM 并非 LLMs 的替代品,但在精度、速度和成本效益至关重要时,它们是理想之选。 技术帮助我们用更少的资源取得更多成就。它一直是推动者,而非驱动者。从蒸汽机时代到互联网泡沫时期,技术的威力在于它帮助我们解决问题的程度。人工智能 (AI) 以及最近的生成式 AI 也不例

利用Google双子座的力量用于计算机视觉:综合指南 领先的AI聊天机器人Google Gemini扩展了其功能,超越了对话,以涵盖强大的计算机视觉功能。 本指南详细说明了如何利用

2025年的AI景观正在充满活力,而Google的Gemini 2.0 Flash和Openai的O4-Mini的到来。 这些尖端的车型分开了几周,具有可比的高级功能和令人印象深刻的基准分数。这个深入的比较


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

ZendStudio 13.5.1 Mac
功能强大的PHP集成开发环境

记事本++7.3.1
好用且免费的代码编辑器

DVWA
Damn Vulnerable Web App (DVWA) 是一个PHP/MySQL的Web应用程序,非常容易受到攻击。它的主要目标是成为安全专业人员在合法环境中测试自己的技能和工具的辅助工具,帮助Web开发人员更好地理解保护Web应用程序的过程,并帮助教师/学生在课堂环境中教授/学习Web应用程序安全。DVWA的目标是通过简单直接的界面练习一些最常见的Web漏洞,难度各不相同。请注意,该软件中

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

SublimeText3 英文版
推荐:为Win版本,支持代码提示!