“百模大战”近来又多了一个参与者,继上月推出了文生文的大语言模型“快意”后,快手方面不久前又上线了“文生图” 领域的自研大模型“可图”(Kolors)。作为短视频平台,快手的“可图”自然要用在自家的App上,依托可图大模型,快手方面也开始在短视频评论区内测“AI玩评”功能,试图解锁AIGC+短视频的新玩法。
据悉,快手的“AI玩评”是业内首次在大型App核心业务场景的评论区应用AIGC能力,该功能旨在提升用户在评论区的互动体验,用户可通过输入创意文字,即可轻松生成大量不同风格的图片,以丰富评论互动。用户只需要短视频的评论区输入6个字及以上的文字评论,点击评论框右下角的“AI”标识,就能一键生成评论配图,还可以点击“换换看”切换更多风格。
根据快手AI团队的说法,通过“AI玩评”功能,用户可以更准确、更有趣地表达自己的观点和情感,并在评论区进行更便捷的趣味互动,无需再寻找合适的图片或表情包,而是可以直接生成一张图片。据了解,AI玩评可以生成从赛博朋克、像素、写实动漫等常见风格,到新海诚、宫崎骏、大友克洋等个人风格浓厚的图片
通过分析用户输入的内容,绘制符合语义的图片已经成为Stable Diffusio、midjourney以及国内市场上各种拥有文生图功能的AI大模型的标配功能。换句话说,快手的AI玩评本质上是一个AI绘画工具,其背后的技术主要基于NLP自然语义处理,而准确识别用户想要表达的内容则是关键要素
AI玩评的效果取决于提示词(Prompt)。根据网友们的使用体验,如果文字评论中包含更多关于人物、景物、空间、动作等描述性内容,生成的图片就更符合实际情况。相反,如果评论中出现像“666”、“我的天!姐姐好厉害!”这样缺乏具体指代对象的模糊描述,AI生成的结果就无法看。因此,这个现实直接导致了AI玩评可能无法得到大多数用户的喜爱
问题来了,现阶段短视频平台的评论区是怎样的呢?实际上,这里是一个充满俏皮话、玩梗、抖机灵等情绪化内容的场景。由于短视频的特点,包括魔性洗脑的背景音乐、强烈刺激的画面和不确定的奖励机制,使得用户放弃思考,沉浸其中。因此,评论区里的评论通常只是简单的一句话,用户会用这句话来明确表达他们的好恶或观点
这一现实的结果,就是短视频评论区里用户输出的内容基本都是情绪化、缺乏定性的内容。试想一下,如果单纯是一堆形容词的堆砌,AI就会面临一个缺乏主体的困惑,也就是说最终AI生成的内容可能会与用户想要表达的差之千里。相信使用过Stable Diffusio、midjourney等工具的朋友都知道,如果Prompt是以形容词为主,那么缺乏名词的结果就是AI会放飞自我。
即便是目前最先进的GPT-4,在体验人类情感上其实也是有缺陷的,事实上,AI的情绪感知能力现阶段还是一个摆在所有AI研究者面前的难题。目前,一众AI大模型面向的领域不是严肃的生产力场景、就是与人类对话,几乎没有AI会涉及情绪化表达。所以这样一来,快手的AI玩评实际上很难做好本职工作,不给用户的评论拖后腿可能就不错了。
那么既然如此,快手又为什么要推出AI玩评呢?当然是为了让自家的文生图大模型“可图”,能有一个能落地的场景。而快手App本身几乎是快手唯一面向消费者的产品,所以“AIGC+短视频”就成为了他们几乎唯一能打出的牌。其实从这里就可以看到,快手作为移动互联网时代崛起的新巨头,在底蕴上相比BAT等传统巨头还是要逊色一些。
不同于几乎已经将自身打造成互联网水煤电的BAT,快手这一批在移动互联网时代成长起来的新巨头,目前几乎都呈现出业务线单一的“强干弱枝”特质,例如快手的核心业务基本上都是依托于快手App的,其他业务则几乎都还叫不上号。在这一轮AI概念爆发之前,一度曾被外界认为落寞的百度,除了搜索引擎之外、还做输入法,所以百度落地AI原生应用就可以被承载在百度输入法上。
可反观快手,现在除了快手App外,“可图”大模型还能用在哪里呢?如果要单独为AI大模型做一款App,快手就可能会失去先机。现在的情况,是国内市场各大AI大模型之间其实并没有在性能上拉开代差,各家的实际使用体验基本都差不多,而用户的选择往往也是有得用就行。即便是对于想要体验AI大模型魅力的用户,许多也都下载了有先发优势的百度文心一言。
事实上,要将AIGC与视频结合,B站可能做了个更好的示范。此前在今年夏季,B站推出了“AI视频小助理”账号,用户只需要在相应视频的评论区@AI视频小助理 ,后者就可以自动生成视频的文字摘要。对于B站的长视频而言,AI视频小助理的归纳和整理能够帮助用户在短时间完成信息提炼,所以自然就会受到许多用户的欢迎。
作为一款娱乐属性更为突出的产品,快手App想要更好地与AIGC结合,自然就要满足用户在娱乐方面的需求。比如根据评论智能生成表情包,可能就要远比在评论区里搞文生图更适合平台的氛围。
以上是快手内测AI玩评:大模型与短视频的碰撞效应如何?的详细内容。更多信息请关注PHP中文网其他相关文章!

斯坦福大学以人为本人工智能研究所发布的《2025年人工智能指数报告》对正在进行的人工智能革命进行了很好的概述。让我们用四个简单的概念来解读它:认知(了解正在发生的事情)、欣赏(看到好处)、接纳(面对挑战)和责任(弄清我们的责任)。 认知:人工智能无处不在,并且发展迅速 我们需要敏锐地意识到人工智能发展和传播的速度有多快。人工智能系统正在不断改进,在数学和复杂思维测试中取得了优异的成绩,而就在一年前,它们还在这些测试中惨败。想象一下,人工智能解决复杂的编码问题或研究生水平的科学问题——自2023年

Meta的Llama 3.2:多模式和移动AI的飞跃 Meta最近公布了Llama 3.2,这是AI的重大进步,具有强大的视觉功能和针对移动设备优化的轻量级文本模型。 以成功为基础

本周的AI景观:进步,道德考虑和监管辩论的旋风。 OpenAI,Google,Meta和Microsoft等主要参与者已经释放了一系列更新,从开创性的新车型到LE的关键转变

连接的舒适幻想:我们在与AI的关系中真的在蓬勃发展吗? 这个问题挑战了麻省理工学院媒体实验室“用AI(AHA)”研讨会的乐观语气。事件展示了加油

介绍 想象一下,您是科学家或工程师解决复杂问题 - 微分方程,优化挑战或傅立叶分析。 Python的易用性和图形功能很有吸引力,但是这些任务需要强大的工具

Meta's Llama 3.2:多式联运AI强力 Meta的最新多模式模型Llama 3.2代表了AI的重大进步,具有增强的语言理解力,提高的准确性和出色的文本生成能力。 它的能力t

数据质量保证:与Dagster自动检查和良好期望 保持高数据质量对于数据驱动的业务至关重要。 随着数据量和源的增加,手动质量控制变得效率低下,容易出现错误。

大型机:AI革命的无名英雄 虽然服务器在通用应用程序上表现出色并处理多个客户端,但大型机是专为关键任务任务而建立的。 这些功能强大的系统经常在Heavil中找到


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

SecLists
SecLists是最终安全测试人员的伙伴。它是一个包含各种类型列表的集合,这些列表在安全评估过程中经常使用,都在一个地方。SecLists通过方便地提供安全测试人员可能需要的所有列表,帮助提高安全测试的效率和生产力。列表类型包括用户名、密码、URL、模糊测试有效载荷、敏感数据模式、Web shell等等。测试人员只需将此存储库拉到新的测试机上,他就可以访问到所需的每种类型的列表。

Dreamweaver Mac版
视觉化网页开发工具

MinGW - 适用于 Windows 的极简 GNU
这个项目正在迁移到osdn.net/projects/mingw的过程中,你可以继续在那里关注我们。MinGW:GNU编译器集合(GCC)的本地Windows移植版本,可自由分发的导入库和用于构建本地Windows应用程序的头文件;包括对MSVC运行时的扩展,以支持C99功能。MinGW的所有软件都可以在64位Windows平台上运行。

VSCode Windows 64位 下载
微软推出的免费、功能强大的一款IDE编辑器

EditPlus 中文破解版
体积小,语法高亮,不支持代码提示功能