ホームページ  >  記事  >  テクノロジー周辺機器  >  現在のプロンプトプロジェクトは占いに似すぎていて、アートAIとのコミュニケーションは言葉遊びのようです

現在のプロンプトプロジェクトは占いに似すぎていて、アートAIとのコミュニケーションは言葉遊びのようです

WBOY
WBOY転載
2023-04-11 20:29:231367ブラウズ

AI ペイント ツールに「パックマン ゲーム インターフェイス、パックマン、ゴースト、インク、ブリンク、クライド、パックメイズ、パックマン、モンドリアン スタイル、モダン アート」と入力しますミッドジャーニー、「モダニズムが開花」した後に得られた写真。

「プロンプトプロジェクト」という入力フレーズは面白くありませんか?

DALL-E や Midtravel などの AI 描画ツールにテキスト プロンプトを入力して画像を生成する場合、またはコードを自動的に生成する AI ツールである Copilot にソフトウェアの作成を依頼する場合その結果は芸術作品と呼ぶことができます。

このプロセスは、正確かつ論理的に聞こえる「エンジニアリング」と呼ぶことができます。しかし、Discord プラットフォームにアクセスして、人々が Midjourney アプリに入力するプロンプトを見ると、次のようなものが表示されます:

銀河は脳、8K、オクタン価のレンダリングから発生します。 、マイクロ詳細 — アップベータ — テスト — クリエイティブ

私の歯は黄色いです、こんにちは世界:: あなたの歯のように白かったらもう少し良くなりますか — s 5000 — q 2 — upbeta — v 3

hg ギーガー ラヴクラフト 怪物が永遠に恐怖を支配する悪夢のような領域

混沌がかつて勇敢だった騎士を堕落させ、姿を変えた彼らは強力な悪人に変身しました。頭からは角が飛び出し、側面からは翼と尾が生え、指と足の指が爪に成長しました。これが虚空のすることです。これが命を失う方法です…。

#reason プロンプトを書くには正しい方法が必要です。現実には、プロンプトを書くと跡形もなく感じられることがよくあります。 魔法の呪文を使用するときに、誤って呪文内の単語を間違った場所に入れてしまうようなものです。物事を台無しにするのは簡単です

面白い言い方をすると、プロンプトを書くということは、人間が「熱心で混乱している駄動物」をなだめて仕事をさせようとしているように見えます。私たちは私たちが何を言っているのか理解していると思っていますが、そのコミュニケーション方法は叫んだり走り回ったりすることです。

この現象の原因は何ですか?

これは、人工知能の歴史において非常に奇妙な瞬間であると言えます。何十年にもわたって、人工知能はチューリング テスト (常にではありませんが、頻繁に) の「影」の中で進歩してきました。チューリング テストでは、「インテリジェントな」 AI は知的な人間とまったく同じように動作し、通信すると考えられます。

チューリングの考えによれば、たとえば、人工生命体が時事問題について話し合うことができれば、それは知的であると考えることができます。近年、私たちは明瞭で正確な自然言語への期待を、Apple Siri や Amazon Alexa と会話したり、天気について尋ねたり、タイマーを設定したりするなど、日常のデバイスに拡張してきました。

しかし、それは芸術作品を生み出す人工知能の「対話」とはまったく異なります。 私たちは、彼らに何かを作成してもらうよう努めます。これは、AI が間違いを犯した場合、その結果ははるかに深刻であることを意味します。オンラインチャットボットがチャット中に突然オフラインになっても誰も気にしません。チャットボットが NBA をライブストリーミングしていなかったとしても、それは大したことではありません。

しかし、AI が満たせる特定のクリエイティブなニーズがある場合はどうなるでしょうか?特定のコンテンツとスタイルでブログ投稿を作成したい場合はどうすればよいでしょうか?確かに、正しく通信できることを確認する必要があります。

これは、AI が何を考えているのか、あるいはどのように考えるのかについて考え始めなければならないことを意味します。私たちは心理学者が機械の「心の理論」と呼ぶものをさらに発展させなければなりません。 「ファンタジーのように聞こえますよね?」OpenAI の共同創設者 Andrej Karpathy が Copilot について話したときに私にこう言いました。 「これは見慣れたものではありません。人間の心の理論のようなものではありません。大規模な最適化プロセスから出現したエイリアンの人工物のようなものです。」

Andrej Karpathy

著者は、これらの人工知能が実際に意識がある、知性があるなどと言っているわけではありません。 これらは、非常に微妙なパターン認識機能とシーケンス補完機能にすぎず、内部的にはむしろ数学の混沌とし​​た海のようなものです。

しかし、私たちは言葉で彼らに命令を与えるため、私たちは奇妙な心理的関係に陥り、心の中で何が起こっているのかを理解しようとします。

著者は、古代ギリシャ人がデルフィの神託とどのように関わっていたかを思い出します。デルフィの神託者は、過去、現在、未来の知識を持っていると信じられていました。本質的には外国人と話しているようなもので、どんな結果が得られるか誰にも分からないので、質問に対する答えは奇妙なものになる可能性があります。

芸術的 AI とのコミュニケーションは言葉遊びのようなものです

芸術的ロボットの内部動作を研究している科学者は、これらのマシンの奇妙な内部状態のいくつかを文書化しました。最近、テキサス大学オースティン校の 2 人の研究者は、DALL-E 2 が、モデル自体内で何らかの一貫した意味を持つように見える、明らかな文字化けしたフレーズを生成したことを発見しました。

彼らは、モデルが「Apoploe vesrreitais」というフレーズを生成していることに気づき、それをプロンプトとして DALL-E 2 にフィードバックすると、鳥が描かれました。同様に、「Contarra ccetnxniams luryca Tanniounons」を受け取ると、昆虫または害虫が引き寄せられます。 「Wa ch zod ahakes rea」を使用して魚介類の写真を作成します。 ############どうしてこれなの?モデルはどのようにしてこの奇妙な新しい内部言語を生成したのでしょうか?科学者たちはこれについて何も知りませんが、DALL-E 2 のテキスト エンコーダの敵対的なアーティファクトであるようです。

同様に、マイケル・テイラーが『プロンプト・エンジニアリング: 言葉から芸術へ』で書いているように、プロンプト・ライティングの専門家は、フレーズを繰り返すことはスキルであると言っています。

リンク: https://www.saxifrage.xyz/post/prompt-engineering

DALL-E 2. Midtravel またはその他の AI アート ツールは、画像を生成するときに重要な特徴を実際にキャプチャする必要があり、ここでは単純な繰り返しが驚くほどうまく機能します。この一連のプロンプトを例として考えてみましょう: 「ホーマー シンプソン、シンプソンズから、ドーナツを食べる、ホーマー シンプソン、ホーマー シンプソン、ホーマー シンプソン」

人工的に催眠術をかける必要があるように感じます。私たちが関心のあるトピックに焦点を当てています。これは、プロンプト作成者が通常使用する多数の説明的な単語からもわかります。 Xe Iaso と安定した拡散を組み合わせて生成した画像を見てください。

#この画像はまだ少し詩的であると言わざるを得ません。芸術的な AI とのコミュニケーションは言葉遊びのように感じられます。シャレードやタブーをプレイするのと同じように、トピックに基づいて会話することで AI をトリガーして適切な結果を生成する必要があります。その先にある目標は、仲介者の祭壇に住む精霊を目覚めさせ、彼らを召喚してあなたの命令に従うための適切な呪文を見つけることです。

Xe 氏は、「なぜプロンプトを『プロジェクト』と呼ぶのかわかりません。私は個人的にはそれを『占い』と呼びたいと思っています。」 プロンプト生成モデルについては、厳密に説明する必要があるかもしれません。完全に非常識な方法でコミュニケーションする必要があるため、チューリングテストの要件を満たしている可能性は低く、知的には私たちと「似ていません」。著者は、いつか芸術的な AI も私たちのようになるだろうと固く信じています。しかし今では、彼らは本当に、本当に奇妙です。

以上が現在のプロンプトプロジェクトは占いに似すぎていて、アートAIとのコミュニケーションは言葉遊びのようですの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事は51cto.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。