搜索
首页科技周边人工智能当前prompt工程太像占卜了,与艺术AI交流就像文字游戏

给 AI 绘画工具 Midjourney 输入「吃豆人游戏界面,吃豆人,鬼魂,墨色,眨眼,克莱德,吃豆迷宫,吃豆,蒙德里安风格,现代艺术,现代主义,绽放」后得到的画面。

难道「prompt 工程」的输入短语不有趣吗?

当你向 AI 绘画工具(如 DALL-E 或 Midtravel)输入文本 prompt 以使其生成图片,或者要求自动生成代码的 AI 工具 ——Copilot 编写一些软件时,它们得到的结果可以称得上是艺术品。

我们可以将这一过程称为「工程」,听起来似乎很精确,也很合乎逻辑。但如果你去 Discord 平台上查看人们在 Midjourney 应用中输入的 prompt,你会看到这样的内容:

galaxy arising from a brain, 8k, octane render, micro detailed — upbeta — test — creative

my teeth are yellow, hello world :: would you like me a little better if they were white like yours — s 5000 — q 2 — upbeta — v 3

hg giger lovecraft nightmarish realm where monsters eternally reign terror

chaos corrupted the once valor knight, transforming them into a powerful villian. Horns bursted from their heads, wing and tails grew from their sides, fingers and toes grew into claws. this is what does the void does. this is how life loses….

讲道理编写 prompt 肯定有一种正确的姿势,现实是往往编写起来感觉又无迹可寻,就像是使用魔法咒语的时候,不小心就会把魔咒里的单词放错了地方,很容易就把事情搞砸了

说得搞笑点,编写 prompt 似乎就像人类试图哄骗「一只急切又困惑的驮运动物」来干活。我们认为它明白我们在说什么,但沟通方式却是大喊大叫,乱跑乱跳。

什么造成了这种现象?

可以说现在是人工智能史上一个非常奇怪的时刻。几十年来,人工智能在图灵测试的「阴影」下不断进步(并非总是如此,但经常如此),图灵测试认为「聪明」人工智能的行为和交流方式与聪明人完全一样。

根据图灵的想法,比如说,如果一个人工生命体能够讨论当前发生的事件,那么它就可以被认为是智能的。近年来,我们将这种清晰、精确、自然的语言期望扩展到日常设备中:与苹果 Siri 和亚马逊 Alexa 交谈,询问天气或设置计时器。

但与产生艺术作品的人工智能「对话」截然不同。我们试图让它们创造一些东西。这意味着,如果人工智能犯了错误,后果要严重得多。没人在乎在线聊天机器人聊天的时候突然掉线。如果聊天机器人不是实时直播 NBA,那就没什么大不了的。

但如果我们有一个特定的创造需求来让人工智能满足呢?如果我们想让它写一篇具有特定内容和风格的博客文章呢?我们当然需要确保我们能够与它正确沟通。

这意味着我们必须开始思考人工智能在想什么,或者更确切地说,它是怎么想的。我们必须进一步发展心理学家所说的机器「心智理论」。「听起来好像天方夜谭,对吧?」正如 OpenAI 联合创始人 Andrej Karpathy 在谈到 Copilot 时告诉笔者的那样。「这不是你过去司空见惯的东西。它不像人类的心智理论。它就像是一个外星人的人工制品,而且是从大规模的优化过程中产生的。」

Andrej Karpathy

笔者并不是说这些人工智能实际上是有意识的、智能的或其他什么。它们只是非常微妙的模式识别器和序列完成器,内在更像是一片混乱的数学海洋

但是,又因为我们是用语言向它们发出命令,这让我们陷入了一种奇怪的心理关系 —— 试图探知里面发生了什么。

笔者想起了古希腊人如何与德尔菲神谕(Delphic oracle)互动。德尔菲神谕被认为能通晓过去、现在和未来。提问后的答案可能很奇怪,因为从本质上讲,这就好像是在和外国人说话一样,谁知道你会得到什么结果?

与艺术 AI 的交流就像一个文字游戏

研究艺术机器人内部工作的科学家们记录了一些这些机器奇怪的内部状态。最近,德克萨斯大学奥斯汀分校的两名研究人员发现,DALL-E 2 生成了明显的乱七八糟的短语,在模型本身中,这些短语似乎具有某种一致的含义。

他们注意到模型生成了短语「Apoploe vesrreitais」,当他们将其作为 prompt 反馈给 DALL-E 2 时,它画出的是鸟类。类似地,接受到「Contarra ccetnxniams luryca tanniounons」后会绘制昆虫或害虫。用「Wa ch zod ahakes rea」会制作出海鲜的图片。

这是为什么呢?模型是如何生成这种奇怪的内部新语言的?科学家们对此一无所知,尽管这看起来像是 DALL-E 2 的文本编码器的对抗性产物。

同样,prompt 编写专家们说,不断重复短语是一种技巧,就像 Michael Taylor 在《Prompt Engineering: From Words to Art》所写的那样。

链接:https://www.saxifrage.xyz/post/prompt-engineering

DALL-E 2、Midtravel 或其他 AI 艺术工具在生成图像时需要真正捕捉到重要特性,此时简单重复的效果出乎意料地好。以这组 prompt 为例:「homer simpson, from the simpsons, eating a donut, homer simpson, homer simpson, homer simpson」

感觉好像是我们需要催眠人工智能,使其专注于我们关心的主题。你也可以在 prompt 编写者通常使用的大量描述性词语中看到这一点。看看 Xe Iaso 结合 stable diffusion 生成的图像:

不得不说画面还是有点诗意的。与艺术 AI 的交流感觉就像一个文字游戏 —— 就像玩 Charades 或 Taboo,你必须通过围绕一个主题进行对话来触发 AI 生成正确的结果。除此之外,我们的目标是找到正确的咒语,唤醒居住在那座由媒介物组成的圣坛中的灵魂,并召唤它们听从你的命令。

正如 Xe 所说的,「我也不太清楚为什么人们会把 prompt 称为『工程』,我个人更愿意把它称为『占卜』。」

也许,我们需要对 prompt 生成模型做一些严谨的澄清。因为它要求我们以一种完全疯狂的方式进行交流,所以它不太像是能满足图灵测试的要求,在智力上并不「像」我们。笔者坚信总有一天艺术 AI 是能像我们的!但现在,它们确实真的很奇怪。

以上是当前prompt工程太像占卜了,与艺术AI交流就像文字游戏的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文转载于:51CTO.COM。如有侵权,请联系admin@php.cn删除
10个生成AI编码扩展,在VS代码中,您必须探索10个生成AI编码扩展,在VS代码中,您必须探索Apr 13, 2025 am 01:14 AM

嘿,编码忍者!您当天计划哪些与编码有关的任务?在您进一步研究此博客之前,我希望您考虑所有与编码相关的困境,这是将其列出的。 完毕? - 让&#8217

烹饪创新:人工智能如何改变食品服务烹饪创新:人工智能如何改变食品服务Apr 12, 2025 pm 12:09 PM

AI增强食物准备 在新生的使用中,AI系统越来越多地用于食品制备中。 AI驱动的机器人在厨房中用于自动化食物准备任务,例如翻转汉堡,制作披萨或组装SA

Python名称空间和可变范围的综合指南Python名称空间和可变范围的综合指南Apr 12, 2025 pm 12:00 PM

介绍 了解Python功能中变量的名称空间,范围和行为对于有效编写和避免运行时错误或异常至关重要。在本文中,我们将研究各种ASP

视觉语言模型(VLMS)的综合指南视觉语言模型(VLMS)的综合指南Apr 12, 2025 am 11:58 AM

介绍 想象一下,穿过​​美术馆,周围是生动的绘画和雕塑。现在,如果您可以向每一部分提出一个问题并获得有意义的答案,该怎么办?您可能会问:“您在讲什么故事?

联发科技与kompanio Ultra和Dimenty 9400增强优质阵容联发科技与kompanio Ultra和Dimenty 9400增强优质阵容Apr 12, 2025 am 11:52 AM

继续使用产品节奏,本月,Mediatek发表了一系列公告,包括新的Kompanio Ultra和Dimenty 9400。这些产品填补了Mediatek业务中更传统的部分,其中包括智能手机的芯片

本周在AI:沃尔玛在时尚趋势之前设定了时尚趋势本周在AI:沃尔玛在时尚趋势之前设定了时尚趋势Apr 12, 2025 am 11:51 AM

#1 Google推出了Agent2Agent 故事:现在是星期一早上。作为AI驱动的招聘人员,您更聪明,而不是更努力。您在手机上登录公司的仪表板。它告诉您三个关键角色已被采购,审查和计划的FO

生成的AI遇到心理摩托车生成的AI遇到心理摩托车Apr 12, 2025 am 11:50 AM

我猜你一定是。 我们似乎都知道,心理障碍包括各种chat不休,这些chat不休,这些chat不休,混合了各种心理术语,并且常常是难以理解的或完全荒谬的。您需要做的一切才能喷出fo

原型:科学家将纸变成塑料原型:科学家将纸变成塑料Apr 12, 2025 am 11:49 AM

根据本周发表的一项新研究,只有在2022年制造的塑料中,只有9.5%的塑料是由回收材料制成的。同时,塑料在垃圾填埋场和生态系统中继续堆积。 但是有帮助。一支恩金团队

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
3 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
3 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您听不到任何人,如何修复音频
3 周前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解锁Myrise中的所有内容
4 周前By尊渡假赌尊渡假赌尊渡假赌

热工具

WebStorm Mac版

WebStorm Mac版

好用的JavaScript开发工具

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

Dreamweaver Mac版

Dreamweaver Mac版

视觉化网页开发工具

mPDF

mPDF

mPDF是一个PHP库,可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件,并处理不同的语言。与原始脚本如HTML2FPDF相比,它的速度较慢,并且在使用Unicode字体时生成的文件较大,但支持CSS样式等,并进行了大量增强。支持几乎所有语言,包括RTL(阿拉伯语和希伯来语)和CJK(中日韩)。支持嵌套的块级元素(如P、DIV),

Atom编辑器mac版下载

Atom编辑器mac版下载

最流行的的开源编辑器