検索
ホームページテクノロジー周辺機器AIStable AI が画像に基づいてビデオを生成する安定したビデオ拡散モデルをリリース

IT House News 11 月 22 日、人工知能 (AI) 製品の開発に注力する新興企業である Stability AI が、最新の AI モデルである Stable Video Diffusion をリリースしました。このモデルは既存の画像からビデオを生成でき、以前にリリースされた Stable Diffusion テキストから画像へのモデルの拡張であり、これまでのところビデオを生成できる市場で数少ない AI モデルの 1 つでもあります。

Stable AI が画像に基づいてビデオを生成する安定したビデオ拡散モデルをリリース

ただし、このモデルは現在誰でも利用できるわけではありません。 Stable Video Diffusion は現在、Stability AI が「リサーチ プレビュー」と呼ぶ段階にあります。このモデルを使用したい人は、Stable Video Diffusion の意図された使用例 (「教育またはクリエイティブ ツール」、「デザインやその他の芸術的プロセス」など) と目的外の使用を指定するいくつかの使用条件に同意する必要があります。場合(「人物または出来事の事実または真実の表現」など)。

安定したビデオの普及は、実際には SVD と SVD-XT の 2 つのモデルで構成されます。 SVD は、静止画像を 14 フレームの 576 × 1024 ピクセルのビデオに変換できます。 SVD-XT は同じ構造を使用しますが、フレーム数が 24 に増加します。どちらも 1 秒あたり 3 ~ 30 フレームのビデオを生成できます

Stability AI が Stable Video Diffusion とともにリリースしたホワイトペーパーによると、SVD と SVD-XT は最初に数百万のビデオを含むデータセットでトレーニングされ、その後より小規模なデータセットでトレーニングされました。「微調整」なしでは、このデータセットのみがトレーニングされました。数十万から約百万のビデオクリップがあります。これらのビデオの出所は完全には明らかではなく、ホワイトペーパーによれば、多くは公開されている研究データセットからのものであるため、著作権の問題があるかどうかを判断することは不可能です。

SVD と SVD-XT はどちらも高品質の 4 秒ビデオを生成でき、Stability AI ブログで厳選されたサンプルから判断すると、その品質は Meta、Google、AI スタートアップの最新ビデオ生成モデルに匹敵します。 Runway、Pika Labs の AI 生成ビデオは

に匹敵します

Stable AI が画像に基づいてビデオを生成する安定したビデオ拡散モデルをリリース

IT House は、安定したビデオの普及にも限界があることに気づきました。スタビリティ AI もこれについて非常に率直で、モデルは動きやカメラのパンが遅い場合はビデオを生成できず、テキストで制御できず、テキストを (少なくとも明確には) レンダリングできず、一貫して「正しく」顔とキャラクターを生成することはできないと述べています。

Stability AI は初期段階ではありますが、これらのモデルは拡張性が高く、オブジェクトの 360 度ビューの生成など、さまざまなユースケースに適応できると述べています。

Stability AI の最終目標は商業化であるようで、Stable Video Diffusion には「広告、教育、エンターテイメント、その他の分野」での応用の可能性があると述べています。

以上がStable AI が画像に基づいてビデオを生成する安定したビデオ拡散モデルをリリースの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事は搜狐で複製されています。侵害がある場合は、admin@php.cn までご連絡ください。
LLMSでのツール呼び出しLLMSでのツール呼び出しApr 14, 2025 am 11:28 AM

大規模な言語モデル(LLM)は人気が急増しており、ツールコール機能は単純なテキスト生成を超えて機能を劇的に拡大しています。 これで、LLMSは動的なUI作成や自律的なaなどの複雑な自動化タスクを処理できます。

ADHDゲーム、ヘルスツール、AIチャットボットがグローバルヘルスを変える方法ADHDゲーム、ヘルスツール、AIチャットボットがグローバルヘルスを変える方法Apr 14, 2025 am 11:27 AM

ビデオゲームは不安を緩和したり、ADHDの子供を焦点を合わせたり、サポートしたりできますか? ヘルスケアの課題が世界的に急増しているため、特に若者の間では、イノベーターはありそうもないツールであるビデオゲームに目を向けています。現在、世界最大のエンターテイメントインダスの1つです

AIに関する国連入力:勝者、敗者、および機会AIに関する国連入力:勝者、敗者、および機会Apr 14, 2025 am 11:25 AM

「歴史は、技術の進歩が経済成長を促進する一方で、それ自体が公平な所得分布を確保したり、包括的な人間開発を促進したりしないことを示しています」とUNCTADの事務総長であるRebeca Grynspanは前文で書いています。

生成AIを介した交渉スキルを学ぶ生成AIを介した交渉スキルを学ぶApr 14, 2025 am 11:23 AM

簡単な、Generative AIを交渉の家庭教師およびスパーリングパートナーとして使用してください。 それについて話しましょう。 革新的なAIブレークスルーのこの分析は、最新のAIに関する私の進行中のフォーブス列のカバレッジの一部であり、特定と説明を含む

テッドは、Openai、Google、Metaが法廷に向かい、自分自身とセルフィーから明らかにしますテッドは、Openai、Google、Metaが法廷に向かい、自分自身とセルフィーから明らかにしますApr 14, 2025 am 11:22 AM

バンクーバーで開催されたTED2025会議は、昨日4月11日の第36版を締めくくりました。サム・アルトマン、エリック・シュミット、パーマー・ラッキーを含む60か国以上の80人の講演者が登場しました。テッドのテーマ「人類が再考された」は、仕立てられたものでした

ジョセフ・スティグリッツは、AI独占権の中で迫り来る不平等を警告しているジョセフ・スティグリッツは、AI独占権の中で迫り来る不平等を警告しているApr 14, 2025 am 11:21 AM

ジョセフ・スティグリッツは、2001年にノーベル経済賞を受賞した経済学者であり、2001年にノーベル経済賞を受賞しています。スティグリッツは、AIが既存の不平等を悪化させ、いくつかの支配的な企業の手に統合した力を悪化させ、最終的に経済を損なうと仮定しています。

グラフデータベースとは何ですか?グラフデータベースとは何ですか?Apr 14, 2025 am 11:19 AM

グラフデータベース:関係を通じてデータ管理に革命をもたらす データが拡大し、その特性がさまざまなフィールドで進化するにつれて、グラフデータベースは、相互接続されたデータを管理するための変換ソリューションとして浮上しています。伝統とは異なり

LLMルーティング:戦略、テクニック、およびPythonの実装LLMルーティング:戦略、テクニック、およびPythonの実装Apr 14, 2025 am 11:14 AM

大規模な言語モデル(LLM)ルーティング:インテリジェントタスク分布によるパフォーマンスの最適 LLMSの急速に進化する風景は、それぞれが独自の長所と短所を備えた多様なモデルを提供します。 創造的なコンテンツGenに優れている人もいます

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

AtomエディタMac版ダウンロード

AtomエディタMac版ダウンロード

最も人気のあるオープンソースエディター

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

強力な PHP 統合開発環境

VSCode Windows 64 ビットのダウンロード

VSCode Windows 64 ビットのダウンロード

Microsoft によって発売された無料で強力な IDE エディター

WebStorm Mac版

WebStorm Mac版

便利なJavaScript開発ツール