効果は爆発的！ OpenAI初のビデオ生成モデルがリリース、1分でスムーズかつ高解像度、ネチズン：業界全体が安らかに-AI-php.cn

ホームページ

テクノロジー周辺機器

効果は爆発的！ OpenAI初のビデオ生成モデルがリリース、1分でスムーズかつ高解像度、ネチズン：業界全体が安らかに

PHPz

Feb 19, 2024 am 09:30 AM

モデル電車

たった今、ウルトラマンは OpenAI の最初のビデオ生成モデル Sora をリリースしました。

DALL・E 3 の画質とコマンド追従機能を完全に継承し、最長 1 分の高解像度ビデオを生成できます。

効果は爆発的！ OpenAI初のビデオ生成モデルがリリース、1分でスムーズかつ高解像度、ネチズン：業界全体が安らかに

#AI は、赤い旗がはためき、大勢の人が集まる辰年の春祭りを想像しました。

多くの子供たちがドラゴンダンスチームを興味深そうに眺め、中には携帯電話を取り出して人々のさまざまな行動を記録する人もいた。

効果は爆発的！ OpenAI初のビデオ生成モデルがリリース、1分でスムーズかつ高解像度、ネチズン：業界全体が安らかに

雨上がりの東京の街並み、濡れた地面リフレクションネオンの光と影の効果はRTX ONに匹敵します。＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃走行中の電車の窓が時折遮られ、車内のキャラクターの反射が一瞬表示され、非常に見事です。

効果は爆発的！ OpenAI初のビデオ生成モデルがリリース、1分でスムーズかつ高解像度、ネチズン：業界全体が安らかに

ハリウッド大作映画のような映画の予告編もご覧いただけます:

効果は爆発的！ OpenAI初のビデオ生成モデルがリリース、1分でスムーズかつ高解像度、ネチズン：業界全体が安らかに

縦型スクリーン超接近-上からの視点以下、このトカゲには詳細が満載です:

効果は爆発的！ OpenAI初のビデオ生成モデルがリリース、1分でスムーズかつ高解像度、ネチズン：業界全体が安らかに

# ネチズンはゲームオーバーを宣告し、職を失いました:

効果は爆発的！ OpenAI初のビデオ生成モデルがリリース、1分でスムーズかつ高解像度、ネチズン：業界全体が安らかに

# # 一部の人々は業界全体を「嘆き」始めています:

効果は爆発的！ OpenAI初のビデオ生成モデルがリリース、1分でスムーズかつ高解像度、ネチズン：業界全体が安らかに

AI は動いている物理世界を理解します

OpenAI は

であると述べました効果は爆発的！ OpenAI初のビデオ生成モデルがリリース、1分でスムーズかつ高解像度、ネチズン：業界全体が安らかに教育用 AI は、動いている物理世界を理解し、シミュレーションします。

目標は、人々が現実世界のインタラクションを必要とする問題を解決できるようにモデルをトレーニングすることです。

テキストプロンプトに基づいてビデオを生成します。計画全体のほんの 1 ステップにすぎません。

現在、Sora は

複数のキャラクターと特定の動きを含む複雑なシーンを生成できます

効果は爆発的！ OpenAI初のビデオ生成モデルがリリース、1分でスムーズかつ高解像度、ネチズン：業界全体が安らかに . それはユーザーのプロンプトを理解するだけではありません。に示されているように、これらのオブジェクトが物理世界にどのように存在するかについても理解してください。

Sora は、1 つのビデオ内で複数のショットを作成することもでき、言語の深い理解に基づいて手がかりとなる単語を正確に解釈し、キャラクターとビジュアルスタイルを維持します。美しい雪の東京は人々で賑わっています。カメラはにぎやかな街の通りを移動し、美しい雪の日を楽しんだり、近くの屋台で買い物をしたりする数人の人々を追っています。雪の結晶とともに、華やかな桜の花びらが風になびきます。 OpenAI は、Sora の現在の弱点を恥ずかしがらず、複雑なシーンの物理原理を正確にシミュレートすることが難しく、因果関係を理解できない可能性があることを指摘しています。

。

たとえば、「5 匹のハイイロオオカミの子が、人里離れた砂利道で遊んだり追いかけたりしていた。」オオカミの数は変化し、何匹かはどこからともなく現れたり消えたりします。

モデルは、

左と右の混同など、

#キューの空間的詳細を難読化することもあり、

特定のカメラの軌跡をたどるなど、時間の経過とともに発生するイベントを正確に記述するのは困難です。効果は爆発的！ OpenAI初のビデオ生成モデルがリリース、1分でスムーズかつ高解像度、ネチズン：業界全体が安らかに

たとえば、「バスケットボールがバスケットを通り抜けて爆発する」というプロンプトの単語では、バスケットボールはバスケットによって正しくブロックされていません。

OpenAI はテクノロジーに関しては、現時点ではあまり公開されていませんが、簡単に紹介すると次のとおりです。

Sora は 拡散モデル で、ノイズから開始してビデオ全体を一度に生成したり、ビデオの長さを延長したりできます。

重要なのはthat 一度に複数のフレームの予測を生成し、画像の被写体が一時的に視野から外れても変更されないようにします。

GPT モデルと同様に、Sora は拡張性の高い Transformer アーキテクチャを使用します。

データの観点から見ると、OpenAI は、GPT のトークンと同様に、ビデオと画像をパッチとして表します。

この 統一データ表現を使用すると、 さまざまな持続時間、解像度をカバーする、以前よりも広範囲の視覚データでモデルをトレーニングできるようになります。アスペクト比。 Sora は、DALL·E および GPT モデルに関する過去の研究に基づいて構築されています。 DALL・E 3 の再表現プロンプトワードテクノロジーを使用して、ビジュアルトレーニングデータに対して高度に説明的な注釈を生成するため、ユーザーのテキスト指示により忠実に従うことができます。

このモデルは、テキストの指示のみに基づいてビデオを生成できることに加えて、既存の静止画像を取得してそこからビデオを生成し、画像コンテンツを正確にアニメーション化し、細部に注意を払うこともできます。

モデルは、既存のビデオを取得して拡張したり、欠落したフレームを埋めたりすることもできます。詳細については、技術文書を参照してください

(後日リリース予定)

。 Sora は、現実世界を理解してシミュレーションできるモデルの基盤であり、OpenAI は、この機能が AGI を達成するための重要なマイルストーンになると考えています。

ウルトラマンはオンラインで注文を受け付けています

現在、一部のビジュアルアーティスト、デザイナー、映画製作者

(および OpenAI 従業員)

が Sora にアクセスできるようになりました。続々と新作が出版されるようになり、ウルトラマンもネットで注文を受け付けるようになった。

プロンプトワード @sama を入力すると、生成されたビデオ応答を受け取ることができます。

効果は爆発的！ OpenAI初のビデオ生成モデルがリリース、1分でスムーズかつ高解像度、ネチズン：業界全体が安らかに

以上が効果は爆発的！ OpenAI初のビデオ生成モデルがリリース、1分でスムーズかつ高解像度、ネチズン：業界全体が安らかにの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

AIのスキルギャップは、サプライチェーンのダウンを遅くしていますApr 26, 2025 am 11:13 AM

「AI-Ready労働力」という用語は頻繁に使用されますが、サプライチェーン業界ではどういう意味ですか？サプライチェーン管理協会（ASCM）のCEOであるAbe Eshkenaziによると、批評家ができる専門家を意味します

1つの会社がAIを永遠に変えるために静かに取り組んでいる方法Apr 26, 2025 am 11:12 AM

分散型AI革命は静かに勢いを増しています。今週の金曜日、テキサス州オースティンでは、ビテンサーのエンドゲームサミットは極めて重要な瞬間を示し、理論から実用的な応用に分散したAI（DEAI）を移行します。派手なコマーシャルとは異なり

Nvidiaは、AIエージェント開発を合理化するためにNEMOマイクロサービスをリリースしますApr 26, 2025 am 11:11 AM

エンタープライズAIはデータ統合の課題に直面していますエンタープライズAIの適用は、ビジネスデータを継続的に学習することで正確性と実用性を維持できるシステムを構築する大きな課題に直面しています。 NEMOマイクロサービスは、NVIDIAが「データフライホイール」と呼んでいるものを作成することにより、この問題を解決し、AIシステムがエンタープライズ情報とユーザーインタラクションへの継続的な露出を通じて関連性を維持できるようにします。この新しく発売されたツールキットには、5つの重要なマイクロサービスが含まれています。 NEMOカスタマイザーは、より高いトレーニングスループットを備えた大規模な言語モデルの微調整を処理します。 NEMO評価者は、カスタムベンチマークのAIモデルの簡素化された評価を提供します。 Nemo Guardrailsは、コンプライアンスと適切性を維持するためにセキュリティ管理を実装しています

aiは芸術とデザインの未来のために新しい絵を描きますApr 26, 2025 am 11:10 AM

AI：芸術とデザインの未来人工知能（AI）は、前例のない方法で芸術とデザインの分野を変えており、その影響はもはやアマチュアに限定されませんが、より深く影響を与えています。 AIによって生成されたアートワークとデザインスキームは、広告、ソーシャルメディアの画像生成、Webデザインなど、多くのトランザクションデザインアクティビティで従来の素材画像とデザイナーに迅速に置き換えられています。ただし、プロのアーティストやデザイナーもAIの実用的な価値を見つけています。 AIを補助ツールとして使用して、新しい美的可能性を探求し、さまざまなスタイルをブレンドし、新しい視覚効果を作成します。 AIは、アーティストやデザイナーが繰り返しタスクを自動化し、さまざまなデザイン要素を提案し、創造的な入力を提供するのを支援します。 AIはスタイル転送をサポートします。これは、画像のスタイルを適用することです

エージェントAIとのズームがどのように革命を起こしているか：会議からマイルストーンまでApr 26, 2025 am 11:09 AM

最初はビデオ会議プラットフォームで知られていたZoomは、エージェントAIの革新的な使用で職場革命をリードしています。 ZoomのCTOであるXD Huangとの最近の会話は、同社の野心的なビジョンを明らかにしました。エージェントAIの定義 huang d

大学に対する実存的な脅威Apr 26, 2025 am 11:08 AM

AIは教育に革命をもたらしますか？この質問は、教育者と利害関係者の間で深刻な反省を促しています。 AIの教育への統合は、機会と課題の両方をもたらします。 Tech Edvocate NotesのMatthew Lynch、Universitとして

プロトタイプ：アメリカの科学者は海外の仕事を探していますApr 26, 2025 am 11:07 AM

米国における科学的研究と技術の開発は、おそらく予算削減のために課題に直面する可能性があります。 Natureによると、海外の雇用を申請するアメリカの科学者の数は、2024年の同じ期間と比較して、2025年1月から3月まで32％増加しました。以前の世論調査では、調査した研究者の75％がヨーロッパとカナダでの仕事の検索を検討していることが示されました。 NIHとNSFの助成金は過去数か月で終了し、NIHの新しい助成金は今年約23億ドル減少し、3分の1近く減少しました。リークされた予算の提案は、トランプ政権が科学機関の予算を急激に削減していることを検討しており、最大50％の削減の可能性があることを示しています。基礎研究の分野での混乱は、米国の主要な利点の1つである海外の才能を引き付けることにも影響を与えています。 35