8 月 23 日举行的会议,CEDEC 2024 的第三天“几乎是一个完整的 AI 游戏。一种允许 Red Ram 生成无限数量的玩家偏好的神秘游戏的机制”。
《Red Ram》是由专门从事游戏AI的开发商Morikatron开发的一款技术演示,是一款尝试根据玩家输入的关键词自动生成谋杀悬疑风格的罪魁祸首的游戏。
在本次会议中,负责游戏自然语言处理的 Morikatron 首席工程师 Shigenori Miyamoto 和负责系统设计和客户端实现的 AI 工程师 Rikito Takahashi 解释了这一代的工作原理。
首席工程师 Shigenori Miyamoto(右)和 AI 工程师 Rikito Takahashi(左)
在游戏中使用生成AI创造的乐趣
会议开始时,高桥先生讲述了他在本次会议中传达的信息。也就是说,“我希望更多的游戏在游戏中使用新一代人工智能。”这是擅长人工智能技术的 Morikatron 独有的信息,但该公司认为,通过在游戏中利用生成式人工智能,可以创造两种乐趣。
一是有太多的变化,你不会感到无聊。另一个好处是能够创建适合每个玩家喜好的游戏体验。本次会议将讨论的“Red Ram”是为了研究生成人工智能独特的游戏体验而创建的。
《红羊》游戏概述 |
那么,Red Ram 是如何创作游戏的呢?
首先,玩家输入自己喜欢的设置,然后AI生成一个情节,即事件的轮廓。接下来,创建充实数据的故事数据,并根据该数据确定角色和设置。最后生成对话台词、人物图像、背景图像等,将它们组合起来完成游戏。
宫本先生详细讲述了这一代的细节。首先,根据玩家输入的关键词,使用LLM(大型语言模型/``Red Ram''使用OpenAI的GPT 3.5和4)分阶段生成剧情。如果需要复杂的生成条件,显然会使用高性能的GPT 4。
例如,即使玩家输入了一些不适合作为武器的东西,LLM也会相应地创建一个场景。
在剧情生成中,不仅会输入事件设定,还会输入悬疑写作指南以及如何创建进度流程作为提示。提前准备多个LLM手动生成的进度流程并随机使用。据说,生成没有任何格式限制的地块有望产生更高质量的产品。
从以这种方式创建的情节中,故事数据将以程序可以处理的格式生成。如下图所示,在绘图阶段只是纯文本,但从中提取了地点、受害者等必要数据,同时充实了内容。
接下来,根据故事数据生成游戏中出现的每个人、位置和证据的详细数据。除了确定一个人的个人资料(例如年龄、性格和职业)之外,还确定他们特有的语气。此时,也会产生生成图像的提示。
最后生成的是对话场景——玩家(侦探)对嫌疑人进行的审讯(对话)文本。根据事件的情况和地点,将迄今为止生成的数据插入到六种类型的模板中,从而创建提示并生成对话。此外,角色的情绪是从LLM的对话文本中推断出来的,并分为六种情绪。据说这用于在生成图像时改变嫌疑人的面部表情。
接下来,继续图像生成。根据LLM生成的文本,使用“Stable Diffusion”(图像生成AI的模型名称)准备图像。对于背景和证据图像,请使用生成相应详细信息时创建的提示。此时,进行调整,调整背景图像的视角,并替换和提取难以表示的证据项。
同样,人物肖像使用生成详细数据时创建的提示。应用约束,使得图像以固定位置和固定尺寸绘制,并且此时还执行背景透明处理(剪切)。
对于裁剪,使用语义分割(一种标记每个像素的分割方法)和估计图像深度的技术,通过仅提取深层部分来确保可靠的裁剪。
在生成姿势时仅在提示中添加极少量的内容,从而调整面部表情,使其看起来不像不同的人。
|
|
生成式人工智能游戏的挑战和未来前景
下一张幻灯片显示了实际产生的事件。
首先,既然凶器是``豆腐'',那么可以说死因是窒息。舞台被设置为“创新游戏开发公司”,因此产生了办公室或会议室之类的场所。
由于犯罪动机是“经济困难”
,因此建立了以借贷为中心的人际关系。顺便说一句,角色似乎可以在真人风格和动画风格之间进行选择。
|
会议最后,高桥先生谈到了当前的问题和未来的展望。
首先是质量问题。在《红羊》中,角色的对话有时毫无意义。例如,对话可能以“已找到证据”开始,但以神秘的方式结束,证据并未被发现。更重要的是,主角侦探甚至可能在一开始解释案件时就透露出真相。
这使得无法享受破案和推理的乐趣。换句话说,目前的情况是一个可以欣赏生成AI的奇怪行为的游戏。这有一定的风味并且很有趣,但这不是 Morikatron 的目标。
为了达到一致的场景,有必要进一步设计系统设计和给LLM的提示。还提出了其他问题,例如费用和等待时间,但这些问题预计将通过LLM模式的演变逐步解决。
高桥先生表示,未来他希望创造一种玩家输入的信息实时反映在游戏世界中的体验,并在2024年7月发布一个名为“言玉迷宫”的技术演示“.是。
该演示是一款文字冒险游戏,旨在征服地下城,但系统是根据玩家输入的文字生成物品的。根据输入的文字,当场生成该物品的图像、参数、风味文本等,并使用该物品显示主角。
此外,与“Red Ram”相关的论文和生成示例可在线获取。可以使用下面幻灯片中的二维码进行查看,所以如果您有兴趣,为什么不查看一下呢?
以上是可以把谜题游戏交给AI来生成的《红羊》的机制是什么? [CEDEC 2024]的详细内容。更多信息请关注PHP中文网其他相关文章!