用骨架控制AI绘画：ControlNet插件入门

2023-02-24 AI绘画 Stable Diffusion ControlNet 教程

AI绘画工具Stable Diffusion能根据文字描述生成图像，但有时我们想要更精确地控制人物的姿态。一个名为ControlNet的插件，通过分析人物骨架图，让AI能“照着你给的姿势”来画画。这为创作特定场景、动作一致的角色打开了新的大门。下面，我将基于一份安装与使用指南，为你梳理其核心步骤与玩法。

必要的准备工作

在开始使用ControlNet之前，需要先搭建基础环境。这主要涉及两个软件的安装：Python和Git。Python是运行AI模型所需的编程环境，安装时记得勾选“Add Python to PATH”选项，以便系统能正确识别。Git则是一个版本管理工具，用于从开源平台获取Stable Diffusion的相关代码。这两步是后续所有操作的基础。

核心组件的安装与配置

基础环境就绪后，便可着手安装主体部分。首先，需要获取Stable Diffusion的Web用户界面（WebUI），这是一个让普通用户也能操作AI模型的图形化工具。原文提到，由于项目托管在GitHub，部分地区的用户可能需要使用网络工具才能顺利访问和下载。

接下来是关键一步：安装ControlNet插件。这需要将插件的代码库地址添加到WebUI的扩展列表中。安装完成后，还需下载特定的ControlNet模型文件，例如专注于人体姿态识别的control_sd15_openpose.pth文件，并将其放入指定的文件夹。完成这些后，重启WebUI，就能在界面中找到并使用ControlNet功能了。

从骨架到成图的工作流程

如何使用这个功能呢？整个过程可以概括为“提供骨架，描述画面，生成图像”。首先，你需要准备一张描绘了人物姿态的骨架图（通常可以由其他软件生成或手动绘制）。在WebUI中，通过ControlNet单元载入这张骨架图，并选择对应的姿态模型。

然后，像平常使用Stable Diffusion一样，输入你希望画面呈现内容的“正面关键词”，以及希望避免出现的“负面关键词”。原文提供了一个海滩女孩的例子，正面关键词描述了人数、服装、场景和艺术风格，负面关键词则排除了裸露、畸形、画质不佳等元素。最后，点击生成，AI便会尝试在遵循给定骨架的前提下，绘制出符合文字描述的图像。

多样的风格与模型尝试

ControlNet的魅力在于，它控制的是姿态结构，而画面的艺术风格则可以通过搭配不同的预训练模型（Checkpoint）或微调模型（LoRA）来实现千变万化。原文素材列举了几个其他风格的例子，例如国风模型、特定艺术家的风格模型等。每种风格都配有相应的推荐提示词。

这意味着，你可以用同一张骨架图，通过切换风格模型和调整提示词，生成出油画肖像、动漫角色或写实照片等完全不同风格的作品。这大大拓展了创作的可能性。

总结与起点

总的来说，ControlNet插件为Stable Diffusion用户提供了一种强大的控制手段，将抽象的文字描述与具体的形体结构结合起来。虽然初始的安装和配置步骤略显繁琐，但一旦完成，就能开启更精准、更具创意的AI绘画之旅。本文梳理的流程和示例，可以作为一个清晰的起点。剩下的，就交给你的创意和实验了。