PS の使い方がわからなくても、AI パズル技術によりすでに偽物を本物のように見せることができます。-AI-php.cn

ホームページ

テクノロジー周辺機器

PS の使い方がわからなくても、AI パズル技術によりすでに偽物を本物のように見せることができます。

王林

Apr 04, 2023 pm 12:15 PM

ai画像

ここ 2 年ほどで「テキスト生成画像の普及モデル」が非常に普及しており、DALL・E 2 と Imagen はどちらもこれに基づいて開発されたアプリケーションです。

この記事はAI New Media Qubit(公開アカウントID:QbitAI)の許可を得て転載しておりますので、転載については出典元にご連絡ください。

これは一見普通の日本のお弁当です。

PS の使い方がわからなくても、AI パズル技術によりすでに偽物を本物のように見せることができます。

しかし、信じられますか、実際、食べ物のすべてのグリッドには P 編集が施されており、元の写真はまだ江おばさんのものです:

PS の使い方がわからなくても、AI パズル技術によりすでに偽物を本物のように見せることができます。

△画像を直接切り取って貼り付けると、一見偽物に見える効果が得られます

背後にいるオペレーターはPSのボスではなく、非常に単純な操作性を備えたAIです名前：コラージュディフュージョン。

小さな写真をいくつか見つけて与えるだけで、AI が独自に写真の内容を理解し、要素を 非常に自然に 配置します。全体像を把握する - 一見したところ、偽りはありません。

その効果は多くのネチズンを驚かせました。

一部の PS 愛好家は直接こう言いました:

これは単なる天の恵みです...Automatic1111 ですぐに利用できるようになることを願っています (Stable Diffusion ユーザーが一般的に使用するネットワーク UI も統合される予定です) PS に挿入すると、のプラグインバージョンで表示されます。

PS の使い方がわからなくても、AI パズル技術によりすでに偽物を本物のように見せることができます。

なぜ効果がこれほど自然なのでしょうか?

実は、このAIが生成した「日本の弁当」にはいくつかのバージョンが生成されており、どれも自然で自然なものばかりです。

PS の使い方がわからなくても、AI パズル技術によりすでに偽物を本物のように見せることができます。

なぜ複数のバージョンがあるのでしょうか?なぜこんなことを聞くかというと、ユーザーがカスタマイズすることもできるので、全体の状況をあまり荒くすることなく、さまざまな細部を微調整することができます。

「日本の弁当」以外にも優れた作品が多数あります。

たとえば、これは AI に与えられた素材です。P 絵の痕跡は明らかです:

PS の使い方がわからなくても、AI パズル技術によりすでに偽物を本物のように見せることができます。

これは AI がまとめた絵です。どのような P ピクチャの痕跡があるか:

PS の使い方がわからなくても、AI パズル技術によりすでに偽物を本物のように見せることができます。

過去 2 年間で、「テキスト生成画像の普及モデル」は、 DALL・E 2 と Imagen は両方ともこの開発されたアプリケーションに基づいています。この拡散モデルの利点は、生成される画像が多様で高品質であることです。

しかし、text は、結局のところ、ターゲット画像に対して、せいぜい 曖昧な規範的な役割しか果たせないため、ユーザーは通常、多くの時間を費やす必要があります。良好な結果を得るには、プロンプトを調整する必要があります。また、追加の制御コンポーネントと組み合わせる必要があります。

上記の日本のお弁当を例に挙げます。

ユーザーが「ご飯、枝豆、生姜、寿司が入ったお弁当」とだけ入力した場合、どのようなお弁当なのかは記述されていません。 . 食べ物がどこに置かれているか、それぞれの食べ物がどのようなものであるかの説明はありません。ただし、それを明確にする必要がある場合は、ユーザーが短いエッセイを書く必要がある場合があります...

これを考慮して、スタンフォード大学のチームは別の角度から始めることにしました。

彼らは、伝統的なアイデアを参照し、パズルを通じて最終イメージを生成することを決定し、新しい普及モデルを開発しました。

興味深いのは、率直に言って、このモデルは古典的な手法を使用して「詳しく説明された」と考えることができることです。

最初の階層化です: レイヤーベースの画像編集 UI を使用して、ソース画像を RGBA レイヤーに分解します (R、G、B はそれぞれ赤、緑、青を表します)。透明性のため)、これらのレイヤーをキャンバス上に配置し、各レイヤーをテキストプロンプトと組み合わせます。

レイヤー化により、画像内のさまざまな要素を変更できます。

これまで、レイヤー化はコンピュータグラフィックスの分野では成熟した技術でしたが、以前はレイヤー化された情報が単一の画像出力結果として使用されるのが一般的でした。

この新しい「パズル拡散モデル」では、階層情報がその後の操作の入力となります。

PS の使い方がわからなくても、AI パズル技術によりすでに偽物を本物のように見せることができます。

レイヤー化に加えて、 は既存の拡散ベースの画像調整テクノロジ とも組み合わせて、画像の視覚的な品質を向上させます。

つまり、このアルゴリズムは、オブジェクトの特定の属性 (視覚的特徴など) の変更を制限するだけでなく、属性 (方向、照明、視点、オクルージョン) の変更も許可します。

——これにより、修復度と自然さの度合いのバランスがとれ、侵害感のない「精神的に似た」写真が生成されます。

操作手順も非常に簡単で、インタラクティブ編集モードでは数分でコラージュを作成できます。

シーン内の空間配置をカスタマイズする (つまり、他の場所から撮影した写真を適切な位置に配置する) だけでなく、画像を生成するさまざまなコンポーネントを調整することもできます。同じソース画像を使用すると、異なる効果が得られます。

PS の使い方がわからなくても、AI パズル技術によりすでに偽物を本物のように見せることができます。

△右端の列は、この AI の出力結果です。

非対話モード (つまり、ユーザーは困惑するのではなく、直接パズルに小さな絵をたくさん入れます) それを AI に投げます)、AI は取得した小さな絵に基づいて、自然な効果を持つ大きな絵を自動的に作成します。

研究チーム

最後に、その背後にある研究チームについて話しましょう. 彼らは、スタンフォード大学のコンピューターサイエンス学部の教師と学生のグループです。

PS の使い方がわからなくても、AI パズル技術によりすでに偽物を本物のように見せることができます。

この論文の筆頭著者であるヴィシュヌサルッカイは現在、スタンフォード大学コンピュータサイエンス学部の大学院生であり、修士号と博士号取得に向けて勉強中です。 .D.

PS の使い方がわからなくても、AI パズル技術によりすでに偽物を本物のように見せることができます。

彼の主な研究方向は、コンピュータグラフィックス、コンピュータビジョン、機械学習です。

さらに、論文の共著者であるリンデン・リー氏もスタンフォード大学コンピューターサイエンス学部の大学院生です。

PS の使い方がわからなくても、AI パズル技術によりすでに偽物を本物のように見せることができます。

学校に通いながら、NVIDIA で 4 か月間インターンし、NVIDIA のディープラーニング研究チームと協力して、1 億個のパラメーターを追加したビジュアルコンバーターモデルのトレーニングに参加しました。

論文アドレス: https://arxiv.org/abs/2303.00262

PS の使い方がわからなくても、AI パズル技術によりすでに偽物を本物のように見せることができます。

以上がPS の使い方がわからなくても、AI パズル技術によりすでに偽物を本物のように見せることができます。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

AIのスキルギャップは、サプライチェーンのダウンを遅くしていますApr 26, 2025 am 11:13 AM

「AI-Ready労働力」という用語は頻繁に使用されますが、サプライチェーン業界ではどういう意味ですか？サプライチェーン管理協会（ASCM）のCEOであるAbe Eshkenaziによると、批評家ができる専門家を意味します

1つの会社がAIを永遠に変えるために静かに取り組んでいる方法Apr 26, 2025 am 11:12 AM

分散型AI革命は静かに勢いを増しています。今週の金曜日、テキサス州オースティンでは、ビテンサーのエンドゲームサミットは極めて重要な瞬間を示し、理論から実用的な応用に分散したAI（DEAI）を移行します。派手なコマーシャルとは異なり

Nvidiaは、AIエージェント開発を合理化するためにNEMOマイクロサービスをリリースしますApr 26, 2025 am 11:11 AM

エンタープライズAIはデータ統合の課題に直面していますエンタープライズAIの適用は、ビジネスデータを継続的に学習することで正確性と実用性を維持できるシステムを構築する大きな課題に直面しています。 NEMOマイクロサービスは、NVIDIAが「データフライホイール」と呼んでいるものを作成することにより、この問題を解決し、AIシステムがエンタープライズ情報とユーザーインタラクションへの継続的な露出を通じて関連性を維持できるようにします。この新しく発売されたツールキットには、5つの重要なマイクロサービスが含まれています。 NEMOカスタマイザーは、より高いトレーニングスループットを備えた大規模な言語モデルの微調整を処理します。 NEMO評価者は、カスタムベンチマークのAIモデルの簡素化された評価を提供します。 Nemo Guardrailsは、コンプライアンスと適切性を維持するためにセキュリティ管理を実装しています

aiは芸術とデザインの未来のために新しい絵を描きますApr 26, 2025 am 11:10 AM

AI：芸術とデザインの未来人工知能（AI）は、前例のない方法で芸術とデザインの分野を変えており、その影響はもはやアマチュアに限定されませんが、より深く影響を与えています。 AIによって生成されたアートワークとデザインスキームは、広告、ソーシャルメディアの画像生成、Webデザインなど、多くのトランザクションデザインアクティビティで従来の素材画像とデザイナーに迅速に置き換えられています。ただし、プロのアーティストやデザイナーもAIの実用的な価値を見つけています。 AIを補助ツールとして使用して、新しい美的可能性を探求し、さまざまなスタイルをブレンドし、新しい視覚効果を作成します。 AIは、アーティストやデザイナーが繰り返しタスクを自動化し、さまざまなデザイン要素を提案し、創造的な入力を提供するのを支援します。 AIはスタイル転送をサポートします。これは、画像のスタイルを適用することです

エージェントAIとのズームがどのように革命を起こしているか：会議からマイルストーンまでApr 26, 2025 am 11:09 AM

最初はビデオ会議プラットフォームで知られていたZoomは、エージェントAIの革新的な使用で職場革命をリードしています。 ZoomのCTOであるXD Huangとの最近の会話は、同社の野心的なビジョンを明らかにしました。エージェントAIの定義 huang d

大学に対する実存的な脅威Apr 26, 2025 am 11:08 AM

AIは教育に革命をもたらしますか？この質問は、教育者と利害関係者の間で深刻な反省を促しています。 AIの教育への統合は、機会と課題の両方をもたらします。 Tech Edvocate NotesのMatthew Lynch、Universitとして

プロトタイプ：アメリカの科学者は海外の仕事を探していますApr 26, 2025 am 11:07 AM

米国における科学的研究と技術の開発は、おそらく予算削減のために課題に直面する可能性があります。 Natureによると、海外の雇用を申請するアメリカの科学者の数は、2024年の同じ期間と比較して、2025年1月から3月まで32％増加しました。以前の世論調査では、調査した研究者の75％がヨーロッパとカナダでの仕事の検索を検討していることが示されました。 NIHとNSFの助成金は過去数か月で終了し、NIHの新しい助成金は今年約23億ドル減少し、3分の1近く減少しました。リークされた予算の提案は、トランプ政権が科学機関の予算を急激に削減していることを検討しており、最大50％の削減の可能性があることを示しています。基礎研究の分野での混乱は、米国の主要な利点の1つである海外の才能を引き付けることにも影響を与えています。 35