検索
ホームページテクノロジー周辺機器AI安定した動画拡散が実現! 3D合成機能が注目、ネチズン:進歩が早すぎる

Stable Video Diffusion が正式にビデオの処理を開始しました -

生成ビデオ モデル Stable Video Diffusion (SVD) をリリースしました。

Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快

Stability AI 公式ブログでは、新しい SVD がテキストからビデオへの生成と画像からビデオへの生成をサポートしていることを示しています:

Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快

また、単一視点から複数視点へのオブジェクトの変換、つまり 3D 合成もサポートします:

Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快

外部評価によると、公式は SVD が Runway や Pika よりも優れていると主張しており、動画生成 AI はユーザーの間でより人気があります。

まだ基本モデルしかリリースされていないが、関係者は「今後も拡張を続け、安定普及と同様のエコシステムを確立していく予定」であることを明らかにした

紙のコードウェイトは現在オンライン。

Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快

最近、ビデオ生成の分野では新しいプレイ方法が登場していますが、今度は安定した拡散が登場する番で、ネチズンは「速い」と嘆いています。 、そのような進歩は早すぎます。

Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快

しかし、デモの効果だけから判断すると、あまり驚かなかったというネチズンの方が多かった。

私は SD が好きで、これらのデモは素晴らしいですが...しかし、いくつかの欠点もあります。照明と影が間違っており、全体的に一貫性がありません(フレーム間でビデオがちらつく)

Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快

全体として、これは始まりです。ネチズンは SVD の 3D 合成機能について非常に楽観的です:

私は、間もなくさらに多くの機能が登場することを保証します。良いものが出てきたら、簡単な説明だけで完全な 3D シーンを表現できます

Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快

SD ビデオの正式版が登場します

これに加えて、はい、公式はさらに多くのデモンストレーションもリリースしています。まず見てみましょう:

Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快

# 宇宙遊泳も手配されています:

Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快

#背景を動かさず、2 羽の鳥だけを動かすこともできます:

Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快

SVD に関する研究論文も発表されています。報告によると、SVD は次のとおりです。 Stable Diffusion 2.1 に基づいており、基本モデルは 6 億サンプルのビデオ データ セットで事前トレーニングされています。

マルチビュー データセットを微調整することによる単一画像からのマルチビュー合成など、さまざまな下流タスクに簡単に適応できます。

微調整の後、2 つの画像からビデオへのモデルが正式に発表されました。これらのモデルは、ユーザーのニーズに応じて 1 秒あたり 3 ~ 30 フレームのカスタム フレーム レートで 14 フレーム (SVD) および 25 フレーム (SVD-XT) ビデオを生成できます。 # #マルチビュー ビデオ生成モデルを微調整した後、SVD-MV

Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快#テスト結果によると、GSO データセットでは SVD-MV のスコアが向上しました。優れた マルチビュー生成モデル Zero123、Zero123XL、SyncDreamer の場合:

Stability AI が、SVD は現在研究に限定されており、実用的または商業的アプリケーションには適していないと述べたことは言及する価値があります。 SVD は現在誰でも利用できるわけではありませんが、ユーザーの待機リスト登録は受け付けられています。

ビデオ生成の爆発的増加

最近、ビデオ生成の分野では「混戦」状態が続いています

以前は ## によって開発された Vincent Video AI がありました。 #PikaLabs:

Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快

その後、いわゆる「史上最も強力な動画生成 AI

Moonvalley」がリリースされました:

Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快

最近、Gen-2 の

「モーション ブラシ」 機能も正式にリリースされ、好きな場所に描画できるようになりました。 # 現在、SVD が再び登場し、3D ビデオ生成の可能性があります。 .

Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快

一部の人々は、データが開発を妨げるボトルネックであると考えています:

Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快一部のネチズンは、問題は次のとおりであると考えています。強化学習の能力が十分に強力ではないということ

Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快この分野の最新の進歩をご存知ですか? コメント エリアで共有することを歓迎します~

紙のリンク: https://static1.squarespace.com/static/6213c340453c3f502425776e /t/655ce779b9d47d342a93c890/1700587395994/stable_video_diffusion.pdf 書き直す必要があるのは次のとおりです:

Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快

以上が安定した動画拡散が実現! 3D合成機能が注目、ネチズン:進歩が早すぎるの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。
LLMSでのツール呼び出しLLMSでのツール呼び出しApr 14, 2025 am 11:28 AM

大規模な言語モデル(LLM)は人気が急増しており、ツールコール機能は単純なテキスト生成を超えて機能を劇的に拡大しています。 これで、LLMSは動的なUI作成や自律的なaなどの複雑な自動化タスクを処理できます。

ADHDゲーム、ヘルスツール、AIチャットボットがグローバルヘルスを変える方法ADHDゲーム、ヘルスツール、AIチャットボットがグローバルヘルスを変える方法Apr 14, 2025 am 11:27 AM

ビデオゲームは不安を緩和したり、ADHDの子供を焦点を合わせたり、サポートしたりできますか? ヘルスケアの課題が世界的に急増しているため、特に若者の間では、イノベーターはありそうもないツールであるビデオゲームに目を向けています。現在、世界最大のエンターテイメントインダスの1つです

AIに関する国連入力:勝者、敗者、および機会AIに関する国連入力:勝者、敗者、および機会Apr 14, 2025 am 11:25 AM

「歴史は、技術の進歩が経済成長を促進する一方で、それ自体が公平な所得分布を確保したり、包括的な人間開発を促進したりしないことを示しています」とUNCTADの事務総長であるRebeca Grynspanは前文で書いています。

生成AIを介した交渉スキルを学ぶ生成AIを介した交渉スキルを学ぶApr 14, 2025 am 11:23 AM

簡単な、Generative AIを交渉の家庭教師およびスパーリングパートナーとして使用してください。 それについて話しましょう。 革新的なAIブレークスルーのこの分析は、最新のAIに関する私の進行中のフォーブス列のカバレッジの一部であり、特定と説明を含む

テッドは、Openai、Google、Metaが法廷に向かい、自分自身とセルフィーから明らかにしますテッドは、Openai、Google、Metaが法廷に向かい、自分自身とセルフィーから明らかにしますApr 14, 2025 am 11:22 AM

バンクーバーで開催されたTED2025会議は、昨日4月11日の第36版を締めくくりました。サム・アルトマン、エリック・シュミット、パーマー・ラッキーを含む60か国以上の80人の講演者が登場しました。テッドのテーマ「人類が再考された」は、仕立てられたものでした

ジョセフ・スティグリッツは、AI独占権の中で迫り来る不平等を警告しているジョセフ・スティグリッツは、AI独占権の中で迫り来る不平等を警告しているApr 14, 2025 am 11:21 AM

ジョセフ・スティグリッツは、2001年にノーベル経済賞を受賞した経済学者であり、2001年にノーベル経済賞を受賞しています。スティグリッツは、AIが既存の不平等を悪化させ、いくつかの支配的な企業の手に統合した力を悪化させ、最終的に経済を損なうと仮定しています。

グラフデータベースとは何ですか?グラフデータベースとは何ですか?Apr 14, 2025 am 11:19 AM

グラフデータベース:関係を通じてデータ管理に革命をもたらす データが拡大し、その特性がさまざまなフィールドで進化するにつれて、グラフデータベースは、相互接続されたデータを管理するための変換ソリューションとして浮上しています。伝統とは異なり

LLMルーティング:戦略、テクニック、およびPythonの実装LLMルーティング:戦略、テクニック、およびPythonの実装Apr 14, 2025 am 11:14 AM

大規模な言語モデル(LLM)ルーティング:インテリジェントタスク分布によるパフォーマンスの最適 LLMSの急速に進化する風景は、それぞれが独自の長所と短所を備えた多様なモデルを提供します。 創造的なコンテンツGenに優れている人もいます

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

MantisBT

MantisBT

Mantis は、製品の欠陥追跡を支援するために設計された、導入が簡単な Web ベースの欠陥追跡ツールです。 PHP、MySQL、Web サーバーが必要です。デモおよびホスティング サービスをチェックしてください。

AtomエディタMac版ダウンロード

AtomエディタMac版ダウンロード

最も人気のあるオープンソースエディター

SublimeText3 Linux 新バージョン

SublimeText3 Linux 新バージョン

SublimeText3 Linux 最新バージョン

DVWA

DVWA

Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、

mPDF

mPDF

mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。