OpenPose模型

22 次浏览 1 个月前 AI图片工具

AI绘画 Stable Diffusion OpenPose ControlNet

OpenPose模型是ControlNet插件的核心组件之一，用于在AI绘画中精确定位人体骨骼关键点，从而通过姿势控制生成符合特定动作的图像。

访问官方网站

扫码查看

OpenPose模型是什么

OpenPose模型是一个开源的人体姿态估计算法模型，由卡内基梅隆大学（CMU）的研究团队开发。在AI绘画领域，尤其是结合Stable Diffusion与ControlNet插件时，它扮演着“姿势控制器”的角色。

它并不直接生成图像，而是分析输入的图片（原图或参考图），提取出人物的骨骼关键点，包括头部、颈部、肩膀、肘部、手腕、臀部、膝盖和脚踝等18个或更多的节点。这些关键点组成的“火柴人”骨架数据，会被传递给ControlNet，引导AI绘画模型在生成新图像时，严格遵循这一姿态结构。这意味着用户可以任意指定人物的动作——无论是复杂的舞蹈姿势还是简单的站立动作，AI都能精准复现，解决了传统文生图难以精确控制肢体动作的痛点。

核心技术原理

OpenPose的核心在于其强大的特征提取能力，主要依赖于深度学习中的卷积神经网络（CNN）。其工作流程通常分为三个关键步骤：

部位检测：模型首先对输入图像进行多尺度分析，分别检测出人体的各个部位（如手、脚、躯干）。
关键点连接：在检测到部位后，通过亲和场（PAFs, Part Affinity Fields）算法，将属于同一个体的部位（例如左手肘和左手腕）进行正确连接，形成完整的骨骼肢体。
数据输出：最终输出包含所有关键点坐标和连接关系的位姿数据（通常为JSON格式或可视化为火柴人图像）。

在AI绘画工作流中，这一过程是预处理步骤。用户上传的图片经过OpenPose处理器后，生成一张黑白的骨骼图，ControlNet将其与文生图的提示词结合，确保生成的图像在人体结构上与骨骼图高度一致。

主要功能与应用场景

该模型的主要功能是打破传统生成式AI在人体结构控制上的局限性，具体应用如下：

精准动作控制：用户可以输入一张具体的人物动作图，让AI生成的角色完全模仿该动作，适用于创作特定情节的插画。
换脸与换装：保留原图的人物姿势，仅通过修改提示词（如改变发型、服装、场景）来生成新图片，实现“换汤不换药”的编辑效果。
多角色互动：通过OpenPose编辑器，可以加载包含多个人物的图片，分别提取或绘制骨骼图，从而控制生成复杂的多人交互场景（如拥抱、格斗、群舞），且能保持人物肢体互动的合理性。
修正错误：当文生图生成的人物肢体扭曲（如多只手、断腿）时，使用OpenPose可以强制修正人体结构，让画面回归正常。