ホームページ > 記事 > テクノロジー周辺機器 > 「映像分野のミッドジャーニー」! AIビデオ生成の新人、第2世代の内部ベータ作業が流出、ネチズンは現実的すぎると批判
Gen-2は、一言で大ヒット作を撮影できると主張するAIビデオ生成ツールで、その正体を現し始めています。
ある Twitter ブロガーが、内部テストの資格を得るために先導者となりました。
これは、彼が「バーでインタビューを受けている、形の良い、または対称的な男性」というプロンプトワードを使用して生成した結果です:
私は、黒いシャツを着た男性が彼をまっすぐに見ているのを見ました相手と話しているとき、その目や表情には真剣さと率直さが表れており、向かいの人も時折同意してうなずきます。
ビデオ全体が非常にまとまっており、画質も非常に鮮明なので、一見すると本物のインタビューのように感じられます。
同じプロンプトワード生成の別のバージョンも悪くありません:
今回はカメラがより近く、背景がより現実的で、キャラクターは依然として表情豊かです。
この一連の作品を読んだ後、一部のネチズンは次のように叫びました。
すごいですね、テキスト プロンプトに頼るだけでこのような結果が得られるなんて!
率直に次のように言う人もいます。
これは、ビデオ分野における Midjourney の登場です。
このブロガーは Nick St. Pierre という名前で、AI で作成した作品を Twitter で共有することを専門としています。
冒頭で見られた写実的なスタイルに加えて、彼は一連の第 2 世代 SF 作品も発表しました。
例: 「宇宙飛行士は宇宙を旅する」:
「武装した兵士が宇宙船の廊下を走り、黒い影が背後の壁を破壊する」彼" :
"人間動物園のマイクロチップを食べるロボットの家族":
"人型ロボットの軍隊が凍った平原に植民地化する":
(ゲーム・オブ・スローンズで万里の長城を攻撃するホワイト・ウォーカー軍のような勢いです...)
「地球最後の男が見ていた」侵略する宇宙船が東京上空に着陸します。」:
……
上記のすべては、言及する必要がなく、ただ 1 つのプロンプトの単語だけで完了できます。他の写真やビデオへ。
この一連の SF の効果は「面接を受けるバーの男」の効果にわずかに劣りますが、魔法のようなものは、AI 画像生成モデルの「混沌とした」風味に匹敵することができるということです。ほぼ同じですね、当時の安定普及などAIの影が見える気がします。
たとえば、Nick St. Pierre 氏は次のように述べています:
Gen-2 はまだ初期段階にあり、将来的には間違いなく改善されます。
また、内部テストの資格を持った他の人によってテストされた結果がインターネット上でいくつか見つかりました:
AIGC 分野の新参者として、その反復速度と品質も非常に速いです:
Gen-1 バージョンは 2 月に誕生したばかりで、編集用のビデオがすでにある場合にのみ使用できます;
Gen-2 では、プロンプト ワードとしてテキストと画像を使用してビデオを直接生成できるようになりました。
公式にはこれを「生成 AI の次のステップ」と呼んでおり、スローガンも非常に横暴です:
言って、見てください。 (あなたがそれを伝えることができる限り、私はあなたにそれを見てもらうことができます)
Gen-2 のアップデートにより、8 つの主要な機能が一度に提供されます:
ベンチャー ビデオ、テキスト リファレンス画像生成 ビデオ、静止画像からビデオへの変換、ビデオ スタイル転送、ストーリーボード (Storyboard)、マスク (歩いている白い犬をダルメシアンに変えるなど)、レンダリングとパーソナライゼーション (首を振る男を数秒でカメに変えるなど) ))。
AI 絵画のようなその外観により、人々は映画やテレビ、ゲーム、マーケティングの分野に隠された大きな変化を知ることができます。
開発会社も注目に値します。それは Runway です。
ランウェイは2018年に設立され、「インスタント・ユニバース」の特殊効果の技術支援や安定拡散(有望株)の開発にも参加してきました。
ヒント: Gen-1 はすでにプレイできます (125 の機会を使い果たした後は、月々の支払いのみ可能です)。Gen-2 はまだ正式にリリースされていません。公共。 。
Gen シリーズに加えて、マイクロソフト アジア研究所は最近、テキストに基づいて超長いビデオを生成できる AI NUWA-XL もリリースしました。
わずか 16 個の簡単な説明で、11 分間のアニメーションを作成できます。
少し前に進め、息子よ、 Gen-2 がリリースされたのと同じ日に、Alibaba Damo Academy も 17 億のパラメーターを備えたテキストからビデオへの AI をオープンソース化しました:
その効果は江おばさんのものです:
画像生成だけでなく、映像分野も活発になることが予想されます。
ああ、では、次の大量 AI カーニバルの波は来るのでしょうか?
参考リンク:
[1] https://www.php.cn/link/4d7e0d72898ae7ea3593eb5ebf20c744
[2] https://www.php.cn/link/e00944d55e6432ccf20f9fda2492b6fd
[3] https://www.php.cn/link/ce653013fadbb2ff27530d3de3790f1b
[4] https://www.php.cn/link/6e3adb1ae0e02c934766182313b6775d
[5] https://www . php.cn/link/b9b72b29352f3764ea4dec130772bd9d
[6] https://www.php.cn/link/79d37fb2893b428f7ea4ed3b07a84096
以上が「映像分野のミッドジャーニー」! AIビデオ生成の新人、第2世代の内部ベータ作業が流出、ネチズンは現実的すぎると批判の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。