Maison >Périphériques technologiques >IA >Zhipu AI entre dans la génération vidéo : « Qingying » est en ligne, d'une durée de 6 secondes, gratuit et illimité

Zhipu AI entre dans la génération vidéo : « Qingying » est en ligne, d'une durée de 6 secondes, gratuit et illimité

PHPzoriginal: 2024-07-26 15:35:51972parcourir

L'équipe de grands modèles Zhipu est auto-développée et construite.

Depuis que Kuaishou Keling AI est devenue populaire dans le pays et à l'étranger, la génération vidéo nationale devient de plus en plus populaire, tout comme le modèle de texte en 2023.

Tout à l'heure, le lancement officiel d'un autre grand produit modèle de génération vidéo a été annoncé : Zhipu AI a officiellement publié "Qingying". Tant que vous avez une bonne idée (quelques mots à quelques centaines de mots) et un peu de patience (30 secondes), « Qingying » peut générer une vidéo de haute précision avec une résolution de 1440 x 960.

Zhipu AI entre dans la génération vidéo : « Qingying » est en ligne, dune durée de 6 secondes, gratuit et illimité

À partir de maintenant, Qingying lance l'application Qingyan et tous les utilisateurs peuvent pleinement profiter des fonctions de dialogue, d'images, de vidéos, de codes et de génération d'agents. En plus de couvrir le Web et l'application de Zhipu Qingyan, vous pouvez également utiliser le « AI Dynamic Photo Mini Program » pour obtenir rapidement des effets dynamiques pour les photos sur votre téléphone.

La vidéo générée par Zhipu "Qingying" dure 6 secondes et a une résolution de 1440×960. Tous les utilisateurs peuvent l'utiliser gratuitement.

Lien d'accès PC : https://chatglm.cn/
Lien d'accès mobile : https://chatglm.cn/download?fr=web_home

智Pu AI a déclaré qu'avec le développement continu de la technologie, les capacités de génération de « Qingying » seront bientôt utilisées dans la production de courtes vidéos, la génération de publicités et même le montage de films.

Dans le développement de modèles vidéo d'IA génératifs, Scaling Law continue de jouer un rôle à la fois dans les algorithmes et dans les données. "Nous explorons activement des méthodes de mise à l'échelle plus efficaces au niveau du modèle." Lors de la journée portes ouvertes de Zhipu, Zhang Peng, PDG de Zhipu AI, a déclaré : "Avec l'itération continue des algorithmes et des données, je pense que la loi de mise à l'échelle continuera à jouer un rôle important. rôle fort. , la science-fiction, les sciences humaines, l'histoire et d'autres types de contenu vidéo sont mieux générés

Zhipu AI entre dans la génération vidéo : « Qingying » est en ligne, dune durée de 6 secondes, gratuit et illimité

Les styles vidéo qui sont efficaces pour générer incluent le style de dessin animé, le style de photographie réelle, le style d'animation bidimensionnelle, etc. Effet de présentation du type d'entité Regardez, animaux > plantes > objets > bâtiments > personnes.

Il peut générer des vidéos avec du texte ou des images, et le style généré couvre le style d'animation fantastique.

Mots rapides : poussez vers le haut à un angle faible, levez lentement la tête, un dragon apparaît soudainement sur l'iceberg, puis le dragon vous repère et se précipite vers vous. À la manière d’un film hollywoodien.
Mot rapide : Un mage lance un sort dans les vagues. La gemme rassemble l'eau de mer et ouvre un portail magique.

Mot rapide : Le champignon se transforme en ours.

Scène réelle :

Mots rapides : Dans une forêt, du point de vue humain, les arbres imposants bloquent le soleil et un peu de soleil brille à travers les interstices des feuilles, effet Tyndall.

Mot rapide : Un cochon d'Inde d'eau se tient comme un humain, tenant de la glace dans sa main et la mangeant joyeusement. Zhipu AI entre dans la génération vidéo : « Qingying » est en ligne, dune durée de 6 secondes, gratuit et illimité

图生视频

除了文本生成视频，也可以到清影上玩图片生成视频。图生视频带来了更多的新玩法，包括表情包梗图、广告制作、剧情创作、短视频创作等。同时，基于清影的「老照片动起来」小程序也会同步上线，只需一步上传老照片，AI 就能让凝练在旧时光中的照片灵动起来。

提示词：一条自由移动的七彩鱼。

Zhipu AI entre dans la génération vidéo : « Qingying » est en ligne, dune durée de 6 secondes, gratuit et illimité

提示词：图中男子站起来，风吹着他的头发。

Zhipu AI entre dans la génération vidéo : « Qingying » est en ligne, dune durée de 6 secondes, gratuit et illimité

提示词：小黄鸭玩具漂浮在游泳池的水面，特写。

Zhipu AI entre dans la génération vidéo : « Qingying » est en ligne, dune durée de 6 secondes, gratuit et illimité

再到现代艺术：

提示词：摄像机围绕着一大堆老式电视旋转，这些电视播放着不同的节目 ——20 世纪 50 年代的科幻电影、恐怖电影、新闻、静态、70 年代的情景喜剧等，背景设在纽约博物馆的一个大型画廊里。

Zhipu AI entre dans la génération vidéo : « Qingying » est en ligne, dune durée de 6 secondes, gratuit et illimité

提示词：掏出一个苹果手机拍照。

Zhipu AI entre dans la génération vidéo : « Qingying » est en ligne, dune durée de 6 secondes, gratuit et illimité

无提示词。

Zhipu AI entre dans la génération vidéo : « Qingying » est en ligne, dune durée de 6 secondes, gratuit et illimité

你常用的表情包，智谱 AI 能把它延长成「连续剧」。

提示词：师徒四人伸出手互相击掌，脸上是困惑的表情。

提示词：小猫张大了嘴，脸上是困惑表情，很多问号。

可以看出，清影各类风格都可以拿捏，还有更多的玩法等待人们来发掘。只需要在智谱清言 PC/APP 上，点击「清影智能体」功能，就可以让你的每一个创意在瞬间化为现实。

全自研技术

All in 大模型的智谱 AI，很早就开始部署多模态生成式 AI 模型。从 2021 年开始，智谱 AI 先后发布了 CogView（NeurIPS’21）、 CogView2（NeurIPS’22）、CogVideo（ICLR’23）、Relay Diffusion（ICLR’24）、CogView3 （2024）等多项研究。

据介绍，「清影」依托于智谱 AI 大模型团队自研打造的新一代视频生成大模型 CogVideoX。

去年 11 月，其团队基于文生图模型 CogView2 打造出了文本到视频生成模型 CogVideo，并随后将其开源。

Zhipu AI entre dans la génération vidéo : « Qingying » est en ligne, dune durée de 6 secondes, gratuit et illimité

CogVideo 拥有 94 亿参数，它通过 CogView2 生成一系列初始帧，基于双向注意力模型对图像进行插帧的方法实现视频生成。此外，CogVideo 根据文本描述生成 3D 环境，可直接利用预训练模型，避免了昂贵的训练，它也支持中文的 Prompt 输入。

本次清影底座的视频生成模型是CogVideoX，它能将文本、时间、空间三个维度融合起来，参考了Sora 的算法设计，它也是一个DiT 架构，通过优化，CogVideoX 相比前代（CogVideo）推理速度提升了6 倍。

OpenAI 的 Sora 横空出世，让 AI 在视频生成方面取得了显着进展，但大多数模型在生成具有连贯性和逻辑一致性的视频内容方面仍然存在困难。

为了解决这些问题，智谱AI 自研了一个高效的三维变分自编码器结构（3D VAE），可以将原视频空间极致压缩到2%，使得模型训练成本大幅下降，训练难度也大大降低。

模型结构采用因果三维卷积（Causal 3D convolution）为主要模型组件，并将自编码器中常用的注意力模块移除，使得模型具备不同分辨率迁移使用的能力。

同时，在时间维度上因果卷积使得模型视频编解码具备从前向后的序列独立性，这有助于通过微调将模型扩展到更高帧率和更长时间的场景。

除此以外，视频生成还面临这样一个问题，即视频数据大多缺乏对应的描述性文本或者描述质量低下，为此智谱AI 自研了一个端到端的视频理解模型，用于为海量的视频数据生成详细的、贴合内容的描述，进而构建海量的高质量视频文本对，使得训练出的模型指令遵循度高。

最后值得一提的是，智谱AI 自研了一个将文本、时间、空间融合起来的transformer 架构，该架构没有采用传统cross attention 模块，而是在输入阶段就将文本嵌入和视频嵌入连接起来，以便更充分地进行两种模态的交互。

然而文本和视频特征空间存在很大差异，智谱 AI 通过 expert adaptive layernorm 对两者分别进行处理，使得模型能够高效利用参数来更好地将视觉信息与语义信息对齐。

智谱 AI 表示，通过优化技术，智谱 AI 生成式视频模型的推理速度提升了 6 倍。目前生成 6s 视频，模型花费的理论时间是 30 秒钟。

如今随着「清影」的上线，视频生成赛道又出现了智谱 AI 这位重磅玩家。

除了人人都能尝试的应用之外，清影API 也同步上线大模型开放平台bigmodel.cn，企业和开发者可以通过调用API 的方式，体验和使用文生视频以及图生视频的模型能力。

随着各家公司 AI 视频生成功能的不断上线，今年的生成式 AI 竞赛已经进入白热化阶段。对于大多数用户来说，选择也更多了：现在，无论是完全没有视频制作基础的人，还是专业的内容创作者，都能借助大模型能力实现视频创作。

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

架构堆算法 transformer https prompt

Déclaration：

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Article précédent：Google AI a remporté la médaille d'argent de l'Olympiade mathématique de l'OMI, le modèle de raisonnement mathématique AlphaProof a été lancé et l'apprentissage par renforcement est de retour.Article suivant：Google AI a remporté la médaille d'argent de l'Olympiade mathématique de l'OMI, le modèle de raisonnement mathématique AlphaProof a été lancé et l'apprentissage par renforcement est de retour.

Articles Liés

Voir plus