検索
ホームページテクノロジー周辺機器AI効果は爆発的! OpenAI初のビデオ生成モデルがリリース、1分でスムーズかつ高解像度、ネチズン:業界全体が安らかに

たった今、ウルトラマンは OpenAI の最初のビデオ生成モデル Sora をリリースしました。

DALL・E 3 の画質とコマンド追従機能を完全に継承し、最長 1 分の高解像度ビデオを生成できます。

効果は爆発的! OpenAI初のビデオ生成モデルがリリース、1分でスムーズかつ高解像度、ネチズン:業界全体が安らかに

#AI は、赤い旗がはためき、大勢の人が集まる辰年の春祭りを想像しました。

多くの子供たちがドラゴンダンスチームを興味深そうに眺め、中には携帯電話を取り出して人々のさまざまな行動を記録する人もいた。

効果は爆発的! OpenAI初のビデオ生成モデルがリリース、1分でスムーズかつ高解像度、ネチズン:業界全体が安らかに

雨上がりの東京の街並み、濡れた地面リフレクションネオンの光と影の効果はRTX ONに匹敵します。 ############################### 走行中の電車の窓が時折遮られ、車内のキャラクターの反射が一瞬表示され、非常に見事です。

効果は爆発的! OpenAI初のビデオ生成モデルがリリース、1分でスムーズかつ高解像度、ネチズン:業界全体が安らかに

ハリウッド大作映画のような映画の予告編もご覧いただけます:

効果は爆発的! OpenAI初のビデオ生成モデルがリリース、1分でスムーズかつ高解像度、ネチズン:業界全体が安らかに

縦型スクリーン超接近-上からの視点 以下、このトカゲには詳細が満載です:

効果は爆発的! OpenAI初のビデオ生成モデルがリリース、1分でスムーズかつ高解像度、ネチズン:業界全体が安らかに

# ネチズンはゲームオーバーを宣告し、職を失いました:

効果は爆発的! OpenAI初のビデオ生成モデルがリリース、1分でスムーズかつ高解像度、ネチズン:業界全体が安らかに

# # 一部の人々は業界全体を「嘆き」始めています:

効果は爆発的! OpenAI初のビデオ生成モデルがリリース、1分でスムーズかつ高解像度、ネチズン:業界全体が安らかに

AI は動いている物理世界を理解します

OpenAI は

であると述べました効果は爆発的! OpenAI初のビデオ生成モデルがリリース、1分でスムーズかつ高解像度、ネチズン:業界全体が安らかに 教育用 AI は、動いている物理世界を理解し、シミュレーションします。

目標は、人々が現実世界のインタラクションを必要とする問題を解決できるようにモデルをトレーニングすることです。

テキスト プロンプトに基づいてビデオを生成します。計画全体のほんの 1 ステップにすぎません。

現在、Sora は

複数のキャラクターと特定の動きを含む複雑なシーンを生成できます

効果は爆発的! OpenAI初のビデオ生成モデルがリリース、1分でスムーズかつ高解像度、ネチズン:業界全体が安らかに. それはユーザーのプロンプトを理解するだけではありません。に示されているように、これらのオブジェクトが物理世界にどのように存在するかについても理解してください。

Sora は、1 つのビデオ内で複数のショットを作成することもでき、言語の深い理解に基づいて手がかりとなる単語を正確に解釈し、キャラクターとビジュアル スタイルを維持します。 美しい雪の東京は人々で賑わっています。カメラはにぎやかな街の通りを移動し、美しい雪の日を楽しんだり、近くの屋台で買い物をしたりする数人の人々を追っています。雪の結晶とともに、華やかな桜の花びらが風になびきます。 OpenAI は、Sora の現在の弱点を恥ずかしがらず、複雑なシーンの物理原理を正確にシミュレートすることが難しく、因果関係を理解できない可能性があることを指摘しています。

たとえば、「5 匹のハイイロオオカミの子が、人里離れた砂利道で遊んだり追いかけたりしていた。」オオカミの数は変化し、何匹かはどこからともなく現れたり消えたりします。

モデルは、

左と右の混同など、

#キューの空間的詳細を難読化することもあり、

特定のカメラの軌跡をたどるなど、時間の経過とともに発生するイベントを正確に記述するのは困難です。 効果は爆発的! OpenAI初のビデオ生成モデルがリリース、1分でスムーズかつ高解像度、ネチズン:業界全体が安らかに

たとえば、「バスケットボールがバスケットを通り抜けて爆発する」というプロンプトの単語では、バスケットボールはバスケットによって正しくブロックされていません。

OpenAI はテクノロジーに関しては、現時点ではあまり公開されていませんが、簡単に紹介すると次のとおりです。

Sora は 拡散モデル で、ノイズから開始してビデオ全体を一度に生成したり、ビデオの長さを延長したりできます。

重要なのはthat 一度に複数のフレームの予測を生成し、画像の被写体が一時的に視野から外れても変更されないようにします。

GPT モデルと同様に、Sora は拡張性の高い Transformer アーキテクチャを使用します。

データの観点から見ると、OpenAI は、GPT のトークンと同様に、ビデオと画像をパッチとして表します。

この 統一データ表現を使用すると、 さまざまな持続時間、解像度をカバーする、以前よりも広範囲の視覚データでモデルをトレーニングできるようになります。アスペクト比Sora は、DALL·E および GPT モデルに関する過去の研究に基づいて構築されています。 DALL・E 3 の再表現プロンプト ワード テクノロジーを使用して、ビジュアル トレーニング データに対して高度に説明的な注釈を生成するため、ユーザーのテキスト指示により忠実に従うことができます。

このモデルは、テキストの指示のみに基づいてビデオを生成できることに加えて、既存の静止画像を取得してそこからビデオを生成し、画像コンテンツを正確にアニメーション化し、細部に注意を払うこともできます。

モデルは、既存のビデオを取得して拡張したり、欠落したフレームを埋めたりすることもできます。詳細については、技術文書を参照してください

(後日リリース予定)

Sora は、現実世界を理解してシミュレーションできるモデルの基盤であり、OpenAI は、この機能が AGI を達成するための重要なマイルストーンになると考えています。

ウルトラマンはオンラインで注文を受け付けています

現在、一部のビジュアル アーティスト、デザイナー、映画製作者

(および OpenAI 従業員)

が Sora にアクセスできるようになりました。 続々と新作が出版されるようになり、ウルトラマンもネットで注文を受け付けるようになった。

プロンプト ワード @sama を入力すると、生成されたビデオ応答を受け取ることができます。

効果は爆発的! OpenAI初のビデオ生成モデルがリリース、1分でスムーズかつ高解像度、ネチズン:業界全体が安らかに


#

以上が効果は爆発的! OpenAI初のビデオ生成モデルがリリース、1分でスムーズかつ高解像度、ネチズン:業界全体が安らかにの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。
革新を調理する:人工知能がフードサービスを変革する方法革新を調理する:人工知能がフードサービスを変革する方法Apr 12, 2025 pm 12:09 PM

食品の準備を強化するAI まだ初期の使用中ですが、AIシステムは食品の準備にますます使用されています。 AI駆動型のロボットは、ハンバーガーの製造、SAの組み立てなど、食品の準備タスクを自動化するためにキッチンで使用されています

Pythonネームスペースと可変スコープに関する包括的なガイドPythonネームスペースと可変スコープに関する包括的なガイドApr 12, 2025 pm 12:00 PM

導入 Python関数における変数の名前空間、スコープ、および動作を理解することは、効率的に記述し、ランタイムエラーや例外を回避するために重要です。この記事では、さまざまなASPを掘り下げます

ビジョン言語モデル(VLM)の包括的なガイドビジョン言語モデル(VLM)の包括的なガイドApr 12, 2025 am 11:58 AM

導入 鮮やかな絵画や彫刻に囲まれたアートギャラリーを歩くことを想像してください。さて、各ピースに質問をして意味のある答えを得ることができたらどうでしょうか?あなたは尋ねるかもしれません、「あなたはどんな話を言っていますか?

MediaTekは、Kompanio UltraとDimenity 9400でプレミアムラインナップをブーストしますMediaTekは、Kompanio UltraとDimenity 9400でプレミアムラインナップをブーストしますApr 12, 2025 am 11:52 AM

製品のケイデンスを継続して、今月MediaTekは、新しいKompanio UltraやDimenity 9400を含む一連の発表を行いました。これらの製品は、スマートフォン用のチップを含むMediaTekのビジネスのより伝統的な部分を埋めます

今週のAIで:Walmartがファッションのトレンドを設定する前に設定します今週のAIで:Walmartがファッションのトレンドを設定する前に設定しますApr 12, 2025 am 11:51 AM

#1 GoogleはAgent2Agentを起動しました 物語:月曜日の朝です。 AI駆動のリクルーターとして、あなたはより賢く、難しくありません。携帯電話の会社のダッシュボードにログインします。それはあなたに3つの重要な役割が調達され、吟味され、予定されていることを伝えます

生成AIは精神障害に会います生成AIは精神障害に会いますApr 12, 2025 am 11:50 AM

私はあなたがそうであるに違いないと思います。 私たちは皆、精神障害がさまざまな心理学の用語を混ぜ合わせ、しばしば理解できないか完全に無意味であることが多い、さまざまなおしゃべりで構成されていることを知っているようです。 FOを吐き出すために必要なことはすべてです

プロトタイプ:科学者は紙をプラスチックに変えますプロトタイプ:科学者は紙をプラスチックに変えますApr 12, 2025 am 11:49 AM

今週公開された新しい研究によると、2022年に製造されたプラスチックの9.5%のみがリサイクル材料から作られていました。一方、プラスチックは埋め立て地や生態系に積み上げられ続けています。 しかし、助けが近づいています。エンジンのチーム

AIアナリストの台頭:これがAI革命で最も重要な仕事になる理由AIアナリストの台頭:これがAI革命で最も重要な仕事になる理由Apr 12, 2025 am 11:41 AM

主要なエンタープライズ分析プラットフォームAlteryxのCEOであるAndy Macmillanとの私の最近の会話は、AI革命におけるこの重要でありながら過小評価されている役割を強調しました。 MacMillanが説明するように、生のビジネスデータとAI-Ready情報のギャップ

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

DVWA

DVWA

Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、

AtomエディタMac版ダウンロード

AtomエディタMac版ダウンロード

最も人気のあるオープンソースエディター

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

SublimeText3 英語版

SublimeText3 英語版

推奨: Win バージョン、コードプロンプトをサポート!

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

強力な PHP 統合開発環境