利用人工智能试验多种角色设计:为人工智能驱动的美术注入精确度
这个由Keywords Studios人工智能卓越中心主导的研发项目重新定义了人工智能技术,使其成为美术设计师可掌控的创作工具。

艺术源自于精细控制
以著名的杰克逊·波洛克滴画为例,对普罗大众而言,这些滴画看似毫无规律,只是随性泼洒在画布上的颜料,随便一个小孩子都能做得出来,对吧?但这种想法忽略了艺术的本质:艺术不只关乎媒介,更关乎艺术家本人的控制和其背后的意向。波洛克的杰出之处不只在使用滴画这项技法,而是他精准地控制每一滴颜料滴落的时间、位置和方式。他通过控制这些变因,传达特定的创作意图,将原本可能只是杂乱无章的呈现转变为动人的艺术作品。
当我们考虑利用人工智能协助美术创作时,这种关乎控制的原则就变得格外重要。当前,许多人工智能图像生成器的运作犹如一个“黑箱”,您输入了指示后,只能期望得出有用的成品。虽然也有机会产出惊为天人的图像,但那些成品更类似于随机泼洒的颜料,而非具有明确艺术意图的作品。我们的研发团队致力于将人工智能从不可预期的生成工具,转型成能反映使用者艺术意图的精准工具。正如波洛克通过控制媒介成就了杰出之作,美术设计师能运用我们的工作流,在挥洒创意的过程中维持全面性的控制,这让他们于生成过程中不再只能扮演旁观者的角色,而是能以人工智能作为工具,将脑中的画面化为现实。
认识多模态思维链
此研发项目的核心是“多模态思维链”推导的概念,这是一种模拟人类问题处理流程的人工智能工作流。相较于在单一步骤中一次性地生成图像,多模态思维链系统会将复杂的任务拆解成符合逻辑的序列。通过整合视觉、文本和空间等多种类型的输入内容,我们的系统不只能理解美术设计师想打造的成果,更能明白各项元素在最终成品中有何意义。
这种运用多模态的方法使系统能够处理:
- 3D模型和参考图像中的视觉信息
- 全局和特定部分这两种层级的文本描述
- 3D模板中的空间关系和比例
此技术的实际运用
此原型利用Comfy UI这个基于节点的开源界面作为其工作流原型平台,以此来生成人工智能图像。技术美术设计师若熟悉Houdini或Unreal蓝图系统等基于节点的工具,应该会觉得此方法直观易懂。图像中的每个节点都代表推理链里的一个步骤,这能让美术设计师:
以视觉化的方式在多模态工作流中制作原型和试验多个版本
- 在过程中的任一点插入不同类型的输入内容
- 创建可重复使用的工作流模板
- 在逐个步骤中维持精准控制
原型工作流
我们的流水线在清楚的迭代过程中,运用结合了视觉、空间和文本输入的多模态工作流:
- 初始3D模板:美术设计师可用简单的3D角色模型为基础来着手创作。
- 分段识别:接着美术设计师可识别角色的关键分段(脸部、衣着、饰品等),创建不同区域来聚焦进行改良。
- 全局提示:美术设计师可通过概括性的提示来设置整体创意方向(如“牛仔竞技表演者”),借此建立角色的核心特性。
- 分段提示:通过明确的提示对各分段进行个别改良(如“左膝处破损的蓝色牛仔裤”),进而对每个设计面向进行精准地控制。
- 脸部样貌匹配:对于需要特定脸部特征或相貌相似性的角色,系统能融入参考图像,引导生成过程。
- 迭代输出:美术设计师可针对系统生成的图像进行后续改良,维持创作动力,同时在过程中保持自己的设计意图。

动态反馈循环
此工作流最强而有力的面向之一,是它能够截取并“锁定”人工智能生成的成功元素。当人工智能产出引人入胜的设计元素时(例如完美符合角色主题的精致皮带扣),美术设计师可以立即将这些要素融入3D模型中。这么做便会建立起一个动态反馈循环:
- 发现:人工智能生成非预期但很吸引人的设计元素
- 截取:美术设计师将这些元素添加到3D模型中,同时准确控制其大小和位置
- 分段:这些新元素成为有专属提示的独立分段
- 改良:未来的新版本可保留这些已锁定的元素,同时继续探索其他面向
- 这样的版本循环能确保让人满意的非预期输出成果成为符合设计师意图的设计选择,并能在角色开发过程中予以保留并进行改良。

对美术设计师的重要益处
对游戏制作来说,此研发项目原型展示了数个未来可期的优势:
- 直观控制:美术设计师可用其自然的视觉语汇来操作,不必费力处理复杂的文本提示
- 快速迭代:能快速改良并调整,不必每次都从头来过
- 精确调整:可在特定角色元素上进行细部改动
- 风格一致:自动遵循风格指南和设计参数
- 无缝整合:可与熟悉的3D工具和现有流水线同步运行
- 保留设计:可在3D模型更新时截取并保留成功的输出元素
超越角色创建
虽然我们的研发原型最初是聚焦在角色设计的用途,但其核心的多模态思维链工作流可以广泛应用在游戏开发的不同阶段。受控迭代和分段改良的类似原则可应用在:
- 武器设计:在迭代产出枪支、刀剑或魔法物品模型的同时,维持特定的游戏平衡比例
- 环境物件:以一致的建筑或自然风格进行建筑、植被或道具的开发
- 关卡设计:快速制作环境布景的原型,同时维持游玩空间和视野
- 载具设计:创建种类多元的载具,同时在技术或机械面维持特定限制
- 用户界面/用户体验元素:生成切合特定风格指南和使用规范的界面部件
这种功能上的多样性意味着此工作流几乎可用于支持游戏开发的各种视觉面向,在相当重视迭代改良和精确控制的工作上发挥效用。
未来的研发方向
Keywords人工智能卓越中心将持续探索其他方式,让此工作流对美术设计师来说更容易使用。未来的研发项目将聚焦在:
- 简化工作流以降低技术上的复杂性
- 与Maya或Blender等具行业标准的3D创意工具进行整合
- 精简分段识别和提示管理的过程
- 为不熟悉基于节点之工作流的美术设计师创建适合的界面