搜索
首页科技周边人工智能尽管是通过AI绘制的,我的画还是获得了奖项

尽管是通过AI绘制的,我的画还是获得了奖项

May 09, 2023 pm 06:13 PM
人工智能艺术

这是一副刚刚获得获得了美国科罗拉多州博览会举办的艺术比赛一等奖的作品《太空歌剧院》。而该画的创作者杰森艾伦自曝该作品是其用AI绘画 App“Midjourney”创作产生的。

我的画拿奖了,但是用AI画的

《太空歌剧院》的出现,让人们再次将目光放在AI与艺术的融合上。伴随着技术和软件能力的提升,“人人都可以画画”的时代已经到来了。百度文心一格相关负责人表示,计算机与艺术创作的融合,具有很大的想象空间,AI将对艺术创新起到正向促进作用。

每个普通人都可以通过文字来描述自己的想法,然后通过机器来实现创作,人工智能在艺术领域的学习与创作能力正以蓬勃之势不断刷新我们的认知,一个新的艺术类别也逐渐兴起。

艺术因为AI消亡?

“我们正在目睹艺术在眼前消亡。”这是诸多网友在得知《太空歌剧院》的创作过程后最直观的看法。他们认为Allen使用AI生成图像完全是在作弊,但Allen自己却不以为然。

他介绍了这幅作品的创作过程耗时一个月,不停地修改输入关键词,给MidJourney提交尽可能精确具体的词语,创作了100多张作品后,挑选出了三张自己认为最满意的,用GipaPixel AI将图片清晰化,又用Photoshop进行多次调整,最后才打印在画布上。

这并不是AI作品第一次在正式的艺术舞台上亮相,2018年10月,艺术品拍卖行佳士得曾以约一万美元的价格成交了一幅由AI生成的油画《Edmond Belamy的肖像》。创作者让AI模型分析了15000幅14至20世纪的油画后,仿出了一幅风格类似的作品。

佳士得对作品的形容是:在艺术与人工智能之间交互的实验。意味着,这幅拍卖作品的核心价值并不在画作本身,人们关注更多的是当时看来前所未有的生产方式。这足以说明,AI技术生成的图片不是既有图片的拼凑,而是类似人类经过长期绘画训练后的“再创作”。

尽管人工智能作品充满了冲击力和视觉张力,但和几乎所有其他的深度学习模型一样,在理解知识、推理、逻辑方面做得都不够好。一个已经被广泛注意到的问题,是人工智能经常会生成奇形怪状的手。

这就要先提到AI绘图的原理。据百度文心一格相关负责人介绍,AI从海量图文对应的数据中学习到了“语言描述”与“艺术画面”的关联,以随机化的起点开始,不断修正画作,最终形成在审美上与人类经验与知识高度一致的成品。

人的一只手有超过 20 个关节,是人类身体上形状最丰富的结构之一。在大部分用来训练的图片中,手部经常不是最核心的部位,不同角度、不同距离、手不同势、还有被阴影和其他物体遮挡等现象,就会让AI在手的表现上出现问题。

我的画拿奖了,但是用AI画的

从技术角度来看,需要提高的主要是两个方面,包括生成的可控性和细节描述能力。目前AI对于数量、逻辑、关系、多图关联等问题暂无有效的解决方案。例如要求生成2个苹果,左边是红色,右边是绿色。虽然这边的关系并不负责,但是在通常情况下,模型并不能稳定的生成正确的结果。

另一方面,AI对于更加复杂的、有规律性细节的描述能力有待提升。例如一栋居民楼的窗户应该具有多种形态,开着的、关上的、有人在窗边看风景、有晾在阳台上的衣服等等……但目前的AI绘画尚未具备这样的能力,同理,手部绘画也是这样的问题。

“大力出奇迹”的大模型

人工智能上一次惊艳互联网还是2020年。

这一年,由OpenAI公司开发的GPT-3横空出世。有开发者给GPT-3 做了图灵测试,发现GPT-3对答如流,正常得不像个机器。而最近又一次惊艳互联网的ChatGPT同样出自这家公司。

相比GPT-3,ChatGPT的主要提升点在于记忆能力。ChatGPT可以储存对话信息,延续上下文,从而实现连续对话,这在对话场景中至关重要,极大地提升了对话交互模式下的用户体验。

ChatGPT的背后离不开大模型、大数据、大算力。根据国盛证券研报数据显示,ChatGPT技术底座使用的是微调后的GPT-3.5系列模型,有着多达1750亿个模型参数,OpenAI主要使用的公共爬虫数据集有着超过万亿单词的人类语言数据集。GPT-3.5在微软Azure AI超算基础设施上进行训练,总算力消耗约3640PF-days(即每秒一千万亿次计算,运行3640个整日)。

而为AI绘画提供优质应用体验的关键技术是大模型。2021年3月OpenAI发布人工智能绘画产品DALL·E,现已升级到DALL·E 2;谷歌、Meta、百度、阿里等互联网巨头也推出了支持生成内容的AI大模型以及对应产品。

百度基于文心大模型推出了AI艺术与辅助创作平台文心一格,是百度依托于飞桨、文心大模型持续的技术创新,在“AI作图”方面发布的产品和技术工具。定位为面向有设计需求和创意的人群,基于文心大模型智能生成多样化AI创意图片,辅助创意设计,打破创意瓶颈。

文心一格是基于文心大模型的文生图系统实现的产品化创新。在文心一格官网,用户只需输入自己的创想文字,并选择期望的画作风格,即可快速获取由一格生成的相应画作。文心一格既能生产恢弘绚丽的艺术画,也能生产创意脑洞的超写实图,兼具中国特色,支持国风、动漫、插画、油画等十余种绘画风格和不同画幅的选择。

百度文心大模型已摸索出一条大模型产业化路径。百度CTO王海峰指出,具有算法、算力和数据综合优势的企业,可以将模型生产的复杂过程封装起来,通过低门槛、高效率的生产平台,为千行百业提供大模型服务,从而形成一条大模型产业化路径。

突破绘画的边界

1839年,照相机问世,给彼时纯手工的绘画带来了巨大的冲击。法国知名艺术家德拉洛奇也曾发出悲叹:“绘画已死!”但随着相机普及,摄影作品作为一种艺术品的观念,也逐渐为大众所接受。

19世纪英国著名的“卢德运动”中,大量英国工人闯进工厂破坏纺织机等机器,因为他们认为机器抢走了他们的工作。

但最终,绘画没有死,艺术出现了新的表现形式,机器帮助社会创造了更多的生产力。经济学家凯恩斯曾分析,新技术的出现会导致技术性失业。为了避免被淘汰,人们总是不得不提升应用各类技术的能力。

从目前的实践来看,AI绘画带来了新的创作方式,大幅提高了绘画效率。无论是对画师、设计师、艺术家等专业视觉内容创作者还是媒体、作者等文字内容创作者来说,AI作画无疑是提供创意思路,辅助进行艺术创作,既提升效率也提升质量。

对于未来,技术和应用都还将快速发展。从技术上来看,未来AI不止可以作画,还可以基于文字内容一键生成AI原创短视频,并自动配上字幕、语音、音乐等等。例如,2022万象·百度移动生态大会上,由百度APP推出的数字人度晓晓作词作曲演唱的《启航星》,是首支全AIGC生成的MV,其中画面部分由文心一格根据歌词自动生成。应用上,AI作画将不断的融入到各种内容创作场景,除了常见的插画师和艺术设计领域,未来在移动内容生产、游戏、工业设计、AI教育等场景都会有越来越广泛的应用。

对于卓越的艺术家来说,他们不可能会被AI替代。但普通的艺术家为了更具竞争力,很可能需要学习利用AI进行艺术创作,就好像现在的画师都要掌握数字绘图软件一样,先进的工具最终会成为必要的生产资料。

就像《太空歌剧院》的创作者对于争议回应时说的那样:“我不会为此道歉,我没有违反任何规则,我赢了。”

以上是尽管是通过AI绘制的,我的画还是获得了奖项的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文转载于:51CTO.COM。如有侵权,请联系admin@php.cn删除
拥抱面部是否7B型号奥林匹克赛车击败克劳德3.7?拥抱面部是否7B型号奥林匹克赛车击败克劳德3.7?Apr 23, 2025 am 11:49 AM

拥抱Face的OlympicCoder-7B:强大的开源代码推理模型 开发以代码为中心的语言模型的竞赛正在加剧,拥抱面孔与强大的竞争者一起参加了比赛:OlympicCoder-7B,一种产品

4个新的双子座功能您可以错过4个新的双子座功能您可以错过Apr 23, 2025 am 11:48 AM

你们当中有多少人希望AI可以做更多的事情,而不仅仅是回答问题?我知道我有,最近,我对它的变化感到惊讶。 AI聊天机器人不仅要聊天,还关心创建,研究

Camunda为经纪人AI编排编写了新的分数Camunda为经纪人AI编排编写了新的分数Apr 23, 2025 am 11:46 AM

随着智能AI开始融入企业软件平台和应用程序的各个层面(我们必须强调的是,既有强大的核心工具,也有一些不太可靠的模拟工具),我们需要一套新的基础设施能力来管理这些智能体。 总部位于德国柏林的流程编排公司Camunda认为,它可以帮助智能AI发挥其应有的作用,并与新的数字工作场所中的准确业务目标和规则保持一致。该公司目前提供智能编排功能,旨在帮助组织建模、部署和管理AI智能体。 从实际的软件工程角度来看,这意味着什么? 确定性与非确定性流程的融合 该公司表示,关键在于允许用户(通常是数据科学家、软件

策划的企业AI体验是否有价值?策划的企业AI体验是否有价值?Apr 23, 2025 am 11:45 AM

参加Google Cloud Next '25,我渴望看到Google如何区分其AI产品。 有关代理空间(此处讨论)和客户体验套件(此处讨论)的最新公告很有希望,强调了商业价值

如何为抹布找到最佳的多语言嵌入模型?如何为抹布找到最佳的多语言嵌入模型?Apr 23, 2025 am 11:44 AM

为您的检索增强发电(RAG)系统选择最佳的多语言嵌入模型 在当今的相互联系的世界中,建立有效的多语言AI系统至关重要。 强大的多语言嵌入模型对于RE至关重要

麝香:奥斯汀的机器人需要每10,000英里进行干预麝香:奥斯汀的机器人需要每10,000英里进行干预Apr 23, 2025 am 11:42 AM

特斯拉的Austin Robotaxi发射:仔细观察Musk的主张 埃隆·马斯克(Elon Musk)最近宣布,特斯拉即将在德克萨斯州奥斯汀推出的Robotaxi发射,最初出于安全原因部署了一支小型10-20辆汽车,并有快速扩张的计划。 h

AI震惊的枢轴:从工作工具到数字治疗师和生活教练AI震惊的枢轴:从工作工具到数字治疗师和生活教练Apr 23, 2025 am 11:41 AM

人工智能的应用方式可能出乎意料。最初,我们很多人可能认为它主要用于代劳创意和技术任务,例如编写代码和创作内容。 然而,哈佛商业评论最近报道的一项调查表明情况并非如此。大多数用户寻求人工智能的并非是代劳工作,而是支持、组织,甚至是友谊! 报告称,人工智能应用案例的首位是治疗和陪伴。这表明其全天候可用性以及提供匿名、诚实建议和反馈的能力非常有价值。 另一方面,营销任务(例如撰写博客、创建社交媒体帖子或广告文案)在流行用途列表中的排名要低得多。 这是为什么呢?让我们看看研究结果及其对我们人类如何继续将

公司竞争AI代理的采用公司竞争AI代理的采用Apr 23, 2025 am 11:40 AM

AI代理商的兴起正在改变业务格局。 与云革命相比,预计AI代理的影响呈指数增长,有望彻底改变知识工作。 模拟人类决策的能力

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

适用于 Eclipse 的 SAP NetWeaver 服务器适配器

适用于 Eclipse 的 SAP NetWeaver 服务器适配器

将Eclipse与SAP NetWeaver应用服务器集成。

mPDF

mPDF

mPDF是一个PHP库,可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件,并处理不同的语言。与原始脚本如HTML2FPDF相比,它的速度较慢,并且在使用Unicode字体时生成的文件较大,但支持CSS样式等,并进行了大量增强。支持几乎所有语言,包括RTL(阿拉伯语和希伯来语)和CJK(中日韩)。支持嵌套的块级元素(如P、DIV),

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一个PHP/MySQL的Web应用程序,非常容易受到攻击。它的主要目标是成为安全专业人员在合法环境中测试自己的技能和工具的辅助工具,帮助Web开发人员更好地理解保护Web应用程序的过程,并帮助教师/学生在课堂环境中教授/学习Web应用程序安全。DVWA的目标是通过简单直接的界面练习一些最常见的Web漏洞,难度各不相同。请注意,该软件中

Atom编辑器mac版下载

Atom编辑器mac版下载

最流行的的开源编辑器

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境