ホームページ >テクノロジー周辺機器 >AI >DALL・Eだけじゃない！ AI ペインターがモデリングしてビデオを作成できるようになりましたが、将来何が起こるか想像することさえできません。

DALL・Eだけじゃない！ AI ペインターがモデリングしてビデオを作成できるようになりましたが、将来何が起こるか想像することさえできません。

PHPz転載: 2023-05-04 13:19:061234ブラウズ

最近、Emad Mostaque が設立し資金提供している会社 Stability.ai は、AI によって作成された芸術作品の一般公開を発表しました。

これは芸術分野における AI の単なる試みだと思うかもしれませんが、実際にはそれをはるかに超えています。理由は 2 つあります。まず、DALL-E 2 とは異なり、Stable Diffusion はオープンソースです。これは、誰でもそのバックボーンを活用して、特定のテキストから画像への作成タスク用のアプリケーションを無料で構築できることを意味します。さらに、Midjourney の開発者は、ユーザーがそれを Stable Diffusion と組み合わせることを可能にする機能を実装し、いくつかの驚くべき結果をもたらしました。

DALL・Eだけじゃない！ AI ペインターがモデリングしてビデオを作成できるようになりましたが、将来何が起こるか想像することさえできません。

今後数か月で何が起こるか想像してみてください。第二に、DALL-E mini や Disco Diffusion とは異なり、Stable Diffusion は驚くほどリアルで芸術的な作品を作成でき、OpenAI や Google のモデルを羨むようなものは何もありません。これが「生成検索エンジン」の新しい SOTA であると主張する人さえいます。 (特に明記されていない限り、この記事のすべての画像は安定拡散を使用して作成されました)。

DALL・Eだけじゃない！ AI ペインターがモデリングしてビデオを作成できるようになりましたが、将来何が起こるか想像することさえできません。

Stable Diffusion は、AI アートの世界の最高の機能を体現しています。これはおそらく、入手可能な最高の AI アートモデルであり、オープンソースです。これは前代未聞のことであり、大きな影響を与えるでしょう。さらに興味深いのは、これらのサービスに関するニュースが、予想外のソースから届く可能性があることです。あなたの両親、子供、パートナー、友人、同僚。これらの人々は、人工知能の分野で何が起こっているかについては部外者であることが多く、この分野の最新トレンドを発見しようとしています。アートは、AI が未来を盲目にした人々の扉を最終的にノックする方法になる可能性があります。これはとても詩的ではありませんか？

DALL・Eだけじゃない！ AI ペインターがモデリングしてビデオを作成できるようになりましたが、将来何が起こるか想像することさえできません。

オープンソース DALL・E 2

Stability.ai は、「潜在能力を実現できるオープン AI ツール」を作成するために生まれました。ほとんどの人が決して手に入れることのない単なる研究モデルではなく、私や皆さんが使用したり探索したりできる、現実世界のアプリケーションを備えたツールです。

これが、最高のシステム (GPT-3 や DALL-E 2) の秘密を熱心に守る OpenAI や、リリースするつもりすらない Google などの他のテクノロジー企業との違いです。独自の (PaLM、LaMDA、Imagen、または Parti) をプライベートベータ版として使用できます。この Stability.ai の公開リリースは、モデルの重みとコードの共有を超えたものです。これは科学技術の健全性にとって重要ではありますが、ほとんどの人が気に留めるものではありません。また、コーディングをしたくない、またはコーディング方法がわからない人のために、コード不要ですぐに使用できる Web サイトも提供します。

DALL・Eだけじゃない！ AI ペインターがモデリングしてビデオを作成できるようになりましたが、将来何が起こるか想像することさえできません。

Web サイトは DreamStudio Lite と呼ばれ、無料で使用でき、最大 200 枚の画像を生成できます。 DALL-E 2 と同様に、有料サブスクリプションモデルがあり、10 ポンドで 1,000 枚の画像を入手できます (OpenAI は毎月 15 クレジットで補充されますが、より多くのクレジットを取得するには、15 ドルで 115 パックを購入する必要があります)。 DALL-E のコストは 1 画像あたり 0.03 米ドルですが、安定拡散のコストは 1 画像あたり 0.01 ポンドです。さらに、Stable Diffusion は API 経由で大規模に使用できます (コストは直線的に増加するため、1000 ポンドで 100,000 世代を取得できます)。画像生成に加えて、Stability.ai は間もなく DreamStudio Pro (オーディオ/ビデオ) と Enterprise (スタジオ) を発表する予定です。 DreamStudio が間もなく実装する可能性のあるもう 1 つの機能は、通常のテキストから画像へのセットアップの代わりに、他の画像から画像を生成する機能です。このような：＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃

Web サイトには、プロンプトエンジニアリングに関するリソースもありますので、この分野に慣れていない場合は、それを使用できるかもしれません。さらに、DALL-E 2 とは異なり、パラメーターを制御して結果に影響を与え、結果に対する主体性を維持できます。 Stability.ai は、モデルへのアクセスを容易にするためにあらゆることを行いました。 OpenAI は最初の企業であり、モデルに内在する潜在的なリスクとバイアスを評価するために時間をかけて行う必要がありましたが、モデルを長期間クローズドベータ版に維持したり、創造性を制限するようなビジネスモデルを構築したりする必要はありませんでした。 Midjourney と Stable Diffusion の両方がこれを証明しています。

DALL・Eだけじゃない！ AI ペインターがモデリングしてビデオを作成できるようになりましたが、将来何が起こるか想像することさえできません。

セキュリティオープンソース > プライバシーと制御

オープンソーステクノロジには独自の制限があります。オープン性はプライバシーや厳格な管理よりも優先されるべきですが、セキュリティよりも優先されるべきではありません。同社が発表文で説明しているように、これはモデルのオープンで責任ある下流での使用に焦点を当てた、「商用および非商用の両方の使用を許可するライセンス」です。また、二次的著作物にも少なくとも同様のユーザーベースの制限を課すことが義務付けられています。

DALL・Eだけじゃない！ AI ペインターがモデリングしてビデオを作成できるようになりましたが、将来何が起こるか想像することさえできません。

オープンソースモデル自体は優れたモデルですが、このテクノロジーが最終的に人々を傷つけたり、インターネットにさらなる傲慢さを加えたりすることを望まない場合は、合理的なガードレールを確立することも同様に重要です。「これらのモデルはインターネットから収集した幅広い画像とテキストのペアでトレーニングされているため、モデルは一部の社会的偏見を再現し、安全でないコンテンツを生成する可能性があります。そのため、これらの偏見に関するオープンな緩和戦略と公開討論により、誰もがこの問題に参加できるようになります。」いずれの場合も、セキュリティ > プライバシーとコントロールを開きます。

世界を変えるオープンソースの力

倫理的価値観とオープン性の強固な基盤により、Stable Diffusion は現実世界への影響において競合他社を上回るパフォーマンスを発揮することを約束します。

これをダウンロードしてコンピュータで実行したい人は、6.9Gb の VRAM が必要であることを知っておく必要があります。これはハイエンドの消費者向け GPU に適しており、DALL よりも小さいです。 E 2 軽量であることですが、それでもほとんどのユーザーには手が届きません。私と同じように、残りの人はすぐに Dream Studio を使い始めることができます。

DALL・Eだけじゃない！ AI ペインターがモデリングしてビデオを作成できるようになりましたが、将来何が起こるか想像することさえできません。

Stable Diffusion は、現在利用可能な最高の AI アートモデルとして広く認められており、無数のアプリケーション、ネットワーク、サービスの基盤となり、私たちがアートを作成し、アートと対話する方法を再定義します。相互の作用。しかし今後は、さまざまなユースケース向けに特別に設計されたアプリが、誰もが使用できるように最初から構築されるようになるでしょう。人々は、子供の絵を強化したり、外側の絵と内側の絵を使ってコラージュを作成したり、雑誌の表紙をデザインしたり、漫画を描いたり、モーフィングビデオやアニメーションビデオを作成したり、画像から画像を生成したりしています。これらのアプリケーションの一部は DALL-E と Midjourney ですでに可能ですが、安定した拡散は現在の創造的な革命を次の段階に押し上げることができます。元テスラ AI ディレクターであり、リーフェイフェイの弟子であるアンドレイカルパシー氏の言葉を借りれば、「芸術作品の創造は、人間の AI 協力による新たな時代に入った。」

DALL・Eだけじゃない！ AI ペインターがモデリングしてビデオを作成できるようになりましたが、将来何が起こるか想像することさえできません。

安定した拡散 AI アートのようにモデルには新しいクラスのツールが含まれており、私たちが住んでいる新しい現実に対する新しい考え方で理解される必要があります。私たちは単に他の時代との類似点や類似点を描いて、未来を正確に説明したり予測したりできると期待することはできません。似ているものもあれば、似ていないものもあります。私たちはこの来たるべき未来を未知の領域として扱わなければなりません。

DALL・Eだけじゃない！ AI ペインターがモデリングしてビデオを作成できるようになりましたが、将来何が起こるか想像することさえできません。

最後に書いてあります

安定拡散の一般公開が、人工知能の分野においてこれまでで最も重要で影響力のあるイベントであることは疑いの余地がありません。アートモデル、そしてこれはほんの始まりにすぎません。

著者の一人であるエマド・モスタク氏はツイッターで、「より速く、より良く、より具体的なモデルをリリースするので、全体的に品質が向上し続けることを期待しています。来月には画像だけでなく音声も追加されます。その後、移行します」と述べた。 3D、ビデオ、言語、コードなどのトレーニングに進みます。

DALL・Eだけじゃない！ AI ペインターがモデリングしてビデオを作成できるようになりましたが、将来何が起こるか想像することさえできません。

私たちは、アートや創造性全般と関わり、結びつき、理解する方法において、数年にわたる革命の瀬戸際にいます。それは哲学的、知的領域だけでなく、今では誰もが共有し経験しているものとしてです。クリエイティブな世界は永遠に変化するので、すべての人にとってより良い未来を築くために、私たちはオープンで敬意を持った会話をする必要があります。オープンソーステクノロジーが責任を持って使用される場合にのみ、私たちが望む変化を生み出すことができます。

以上がDALL・Eだけじゃない！ AI ペインターがモデリングしてビデオを作成できるようになりましたが、将来何が起こるか想像することさえできません。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明：

この記事は51cto.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

前の記事：チューリング賞受賞者 LeCun: ChatGPT には大きな制限があり、自己回帰モデルの寿命は 5 年を超えません。次の記事：チューリング賞受賞者 LeCun: ChatGPT には大きな制限があり、自己回帰モデルの寿命は 5 年を超えません。

関連記事

続きを見る