Stable AI が画像に基づいてビデオを生成する安定したビデオ拡散モデルをリリース-AI-php.cn

ホームページ

テクノロジー周辺機器

Stable AI が画像に基づいてビデオを生成する安定したビデオ拡散モデルをリリース

王林

Nov 22, 2023 pm 08:38 PM

IT House News 11 月 22 日、人工知能 (AI) 製品の開発に注力する新興企業である Stability AI が、最新の AI モデルである Stable Video Diffusion をリリースしました。このモデルは既存の画像からビデオを生成でき、以前にリリースされた Stable Diffusion テキストから画像へのモデルの拡張であり、これまでのところビデオを生成できる市場で数少ない AI モデルの 1 つでもあります。

Stable AI が画像に基づいてビデオを生成する安定したビデオ拡散モデルをリリース

ただし、このモデルは現在誰でも利用できるわけではありません。 Stable Video Diffusion は現在、Stability AI が「リサーチプレビュー」と呼ぶ段階にあります。このモデルを使用したい人は、Stable Video Diffusion の意図された使用例 (「教育またはクリエイティブツール」、「デザインやその他の芸術的プロセス」など) と目的外の使用を指定するいくつかの使用条件に同意する必要があります。場合（「人物または出来事の事実または真実の表現」など）。

安定したビデオの普及は、実際には SVD と SVD-XT の 2 つのモデルで構成されます。 SVD は、静止画像を 14 フレームの 576 × 1024 ピクセルのビデオに変換できます。 SVD-XT は同じ構造を使用しますが、フレーム数が 24 に増加します。どちらも 1 秒あたり 3 ～ 30 フレームのビデオを生成できます

Stability AI が Stable Video Diffusion とともにリリースしたホワイトペーパーによると、SVD と SVD-XT は最初に数百万のビデオを含むデータセットでトレーニングされ、その後より小規模なデータセットでトレーニングされました。「微調整」なしでは、このデータセットのみがトレーニングされました。数十万から約百万のビデオクリップがあります。これらのビデオの出所は完全には明らかではなく、ホワイトペーパーによれば、多くは公開されている研究データセットからのものであるため、著作権の問題があるかどうかを判断することは不可能です。

SVD と SVD-XT はどちらも高品質の 4 秒ビデオを生成でき、Stability AI ブログで厳選されたサンプルから判断すると、その品質は Meta、Google、AI スタートアップの最新ビデオ生成モデルに匹敵します。 Runway、Pika Labs の AI 生成ビデオは

に匹敵します

Stable AI が画像に基づいてビデオを生成する安定したビデオ拡散モデルをリリース

IT House は、安定したビデオの普及にも限界があることに気づきました。スタビリティ AI もこれについて非常に率直で、モデルは動きやカメラのパンが遅い場合はビデオを生成できず、テキストで制御できず、テキストを (少なくとも明確には) レンダリングできず、一貫して「正しく」顔とキャラクターを生成することはできないと述べています。

Stability AI は初期段階ではありますが、これらのモデルは拡張性が高く、オブジェクトの 360 度ビューの生成など、さまざまなユースケースに適応できると述べています。

Stability AI の最終目標は商業化であるようで、Stable Video Diffusion には「広告、教育、エンターテイメント、その他の分野」での応用の可能性があると述べています。

以上がStable AI が画像に基づいてビデオを生成する安定したビデオ拡散モデルをリリースの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は搜狐で複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

LLMSでのツール呼び出しApr 14, 2025 am 11:28 AM

大規模な言語モデル（LLM）は人気が急増しており、ツールコール機能は単純なテキスト生成を超えて機能を劇的に拡大しています。これで、LLMSは動的なUI作成や自律的なaなどの複雑な自動化タスクを処理できます。

ADHDゲーム、ヘルスツール、AIチャットボットがグローバルヘルスを変える方法Apr 14, 2025 am 11:27 AM

ビデオゲームは不安を緩和したり、ADHDの子供を焦点を合わせたり、サポートしたりできますか？ヘルスケアの課題が世界的に急増しているため、特に若者の間では、イノベーターはありそうもないツールであるビデオゲームに目を向けています。現在、世界最大のエンターテイメントインダスの1つです

AIに関する国連入力：勝者、敗者、および機会Apr 14, 2025 am 11:25 AM

「歴史は、技術の進歩が経済成長を促進する一方で、それ自体が公平な所得分布を確保したり、包括的な人間開発を促進したりしないことを示しています」とUNCTADの事務総長であるRebeca Grynspanは前文で書いています。

生成AIを介した交渉スキルを学ぶApr 14, 2025 am 11:23 AM

簡単な、Generative AIを交渉の家庭教師およびスパーリングパートナーとして使用してください。それについて話しましょう。革新的なAIブレークスルーのこの分析は、最新のAIに関する私の進行中のフォーブス列のカバレッジの一部であり、特定と説明を含む

テッドは、Openai、Google、Metaが法廷に向かい、自分自身とセルフィーから明らかにしますApr 14, 2025 am 11:22 AM

バンクーバーで開催されたTED2025会議は、昨日4月11日の第36版を締めくくりました。サム・アルトマン、エリック・シュミット、パーマー・ラッキーを含む60か国以上の80人の講演者が登場しました。テッドのテーマ「人類が再考された」は、仕立てられたものでした

ジョセフ・スティグリッツは、AI独占権の中で迫り来る不平等を警告しているApr 14, 2025 am 11:21 AM

ジョセフ・スティグリッツは、2001年にノーベル経済賞を受賞した経済学者であり、2001年にノーベル経済賞を受賞しています。スティグリッツは、AIが既存の不平等を悪化させ、いくつかの支配的な企業の手に統合した力を悪化させ、最終的に経済を損なうと仮定しています。

グラフデータベースとは何ですか？Apr 14, 2025 am 11:19 AM

グラフデータベース：関係を通じてデータ管理に革命をもたらすデータが拡大し、その特性がさまざまなフィールドで進化するにつれて、グラフデータベースは、相互接続されたデータを管理するための変換ソリューションとして浮上しています。伝統とは異なり

LLMルーティング：戦略、テクニック、およびPythonの実装Apr 14, 2025 am 11:14 AM

大規模な言語モデル（LLM）ルーティング：インテリジェントタスク分布によるパフォーマンスの最適 LLMSの急速に進化する風景は、それぞれが独自の長所と短所を備えた多様なモデルを提供します。創造的なコンテンツGenに優れている人もいます

See all articles

ホットAIツール

ホットツール

ホットトピック

Gmailメールのログイン入り口はどこですか？

7504

CakePHP チュートリアル

1378

Steamのアカウント名の形式は何ですか

Win11 Activation Key Permanent

NYTの接続はヒントと回答です

Stable AI が画像に基づいてビデオを生成する安定したビデオ拡散モデルをリリース

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

人気の記事

ホットツール

AtomエディタMac版ダウンロード

メモ帳++7.3.1

ZendStudio 13.5.1 Mac

VSCode Windows 64 ビットのダウンロード

WebStorm Mac版

ホットトピック