ComfyUI 实战教程：一键扩图

原创

萤火遛AI 2024-08-05 09:22:00 ©著作权

文章标签 AIGC 人工智能重绘 ooc 加载 文章分类 HarmonyOS 后端开发

©著作权归作者所有：来自51CTO博客作者萤火遛AI的原创作品，请联系作者获取转载授权，否则将追究法律责任

大家好，我是每天分享AI应用的萤火君！

本文给大家分享一个很有用的技术：AI扩图。所谓扩图就是扩展图像的边界，在图像的边界外新增更多画面元素，这不仅仅是扩大图像的尺寸，还要让新添加的部分与原有图像的内容自然融合。

AI扩图有很多的应用场景，比如：

摄影后期处理：想要裁剪照片来获得更好的构图，但裁剪后可能会导致画面不平衡，扩图可以让裁剪后的照片看起来更加完整；
游戏开发：在游戏环境中添加更多的细节或者扩展场景，使得游戏世界更加真实丰富；
社交媒体和广告设计：有时候需要将图像调整到特定的尺寸，如果原始图片不够大，AI扩图技术可以帮助填充额外的空间，使设计更加美观。
虚拟现实（VR）和增强现实（AR）：在创建VR/AR体验时，为了增强沉浸感，可能需要扩展场景的边界，AI扩图技术可以自动合成出合适的环境延伸。

想想还是挺让人激动的，大家可能也有点等不及了，本文将使用 ComfyUI 工作流来实现AI扩图。

效果展示

老规矩，先看效果：

ComfyUI 环境准备

目前 ComfyUI 比较依赖显卡，要想流畅的运行各种工作流，24G显存的Nvidia显卡是标配，不过这个价格不菲，动辄过万。即使你不差钱，部署ComfyUI、安装插件、下载模型也都是坎。

手动安装

如果上边的问题都不是问题，可以看看我这篇安装教程：

mp.weixin.qq.com/s?__biz=Mzk…

使用云环境

如果你刚接触ComfyUI，或者平时只是偶尔用用，建议先在云环境体验。我最近在好易社区上传了一个ComfyUI 镜像，内置了常用的插件和模型，市面上大部分工作流都能直接跑起来，欢迎大家来试试，如有问题可以给我留言。

目前注册就送5个米，没收到的话可联系客服解决。

1、注册后访问这个地址：bbs.haoee.com/postDetail/… 点击页面右下角的 “创建实例”。

2、在容器实例页面，可以跟踪实例的状态，进行各种管理操作。

3、点击“JupyterLab”，进入程序启动器页面。

在“启动器”页面，点击双箭头按钮启动程序，待显示 http://127.0.0.1:7860 就代表启动成功了。

4、回到实例列表页面，点击“公网访问”，复制后在浏览器中打开。

不使用的时候，记得关机，以免继续扣费。

一键扩图工作流

这个工作流由多个部分组成，包括：提示词部分、扩图遮罩部分、IPAdapter部分和外扩重绘部分，下边将一一介绍。工作流下载见文末。

提示词部分

用来控制新图片中扩展画面的生成内容。

WD 14 Tagger：因为要扩图，我们需要参考原图中的内容，所以这里引入了一个反推提示词的节点：WD14 Tagger，可以生成一段描述图片元素的文本，作为扩图时的正向提示词。

CR Prompt Text：但是有时候扩图也不是完全引用原图中的元素，比如人物肖像图，就不需要在扩展的部分再画一个人出来，而是需要引入一些新的元素，所以这里也有一个手写提示词的节点。

Any Switch：不可同时使用“反推提示词”和“手写提示词”，Any Switch 保证最多只有一个提示词被使用。比如：当我们需要使用“反推示词”时，可以把“手写提示词”的分组忽略（在分组上右键选择忽略），Any Switch就会把“反推示词”生成的文本传递给后边的提示词节点，反之亦然。

CLIP Text Encode（Prompt） ：CLIP文本编码器，这里有两个，分别用来编码正向提示词和反向提示词。