基于目前的AI绘画工具,我们使用Midjourney可以更方便去生成多人物、大场景的图片,在使用Midjourney时无需设置过多的参数和模型选择,并且Midjourney对于自然语言的处理个人感觉略优于stable diffusion,这种便捷性也是Midjourney很大的优势。
下图是通过ChatGPT生成的一个Prompt后,通过Midjourney生成的一组图片中挑选出来并放大后的图片,从图片整体效果、图片色调、人物造型来看,都是比较不错的,但很可惜的是Midjourney生成的图片分辨率有限,大场景的画面往往会导致人物面部崩坏、细节缺失等问题(下图为Midjourney生成的原图)。
接下来,我们就要结合另外一款AI绘画软件stable diffusion对图片进行二次修改和调整,以便让图片达到更优质的效果。
首先我们将原图导入到stable diffusion的图生图中,可以使用CLIP或DeepBooru进行关键词反推,填上反向关键词(这里填写通用的反向关键词即可)(如果你不知道什么是CLIP、DeepBooru,可以先看这:https://huke88.com/article/8122.html)。
参数设置上采样方法(Sampler)使用了Euler a,采样迭代步数(Steps)建议设置40以上,宽度和高度根据原图尺寸设置或同比例缩放,重绘幅度不可过低不然就很难调整画面了建议设置在0.65~0.75左右。
ControlNet里需要开启2个,第一个ControlNet预处理器选择:tile_resample,模型选择:control_v11fle_sd15_tile,第二个ControlNet上传原图,预处理器选择reference_only。
(关于tile和reference_only的用途,各位可以看以下2篇文章:https://huke88.com/article/8112.html 和 https://huke88.com/article/8111.html)tile模型主要是用来调整细节,reference_only主要是用来控制图片内容。
最后再开启脚本中的SD upscale(SD放大),SD放大可以将图片分布进行生成的同时,放大图片的分辨率(不了解SD放大的可以看这:https://huke88.com/article/8115.html)。
上述的设置都完成后,我们就可以进行出图了,点击生成后,由于采样迭代步数较多、图片尺寸较大生成的时间会相对增加,耐心等待即可。
这是使用原图第一次生成后的效果,可以明显看到无论是人物的面部、岩石、建筑都有更多的细节,接下来我们把新生成的图片发送到图生图中,发送成功后宽度和高度要记得重新调整,其余的参数设置保持不变,进行二次生成。
第二次生成后相信从图片来看就可以发现很明显的对比,中心主体人物的造型、肌肉、面部都更进一步的刻画清晰,周围的所有元素也变的更为立体,细节也同步更加精致。
其实到这里基本已经搞定了,为了更极限的看一下出图效果,我们再把二次出图的图片发送到图生图中,并且把采样迭代步数(Steps)调整到80步,再看看会是什么效果。
最后生成的图片分辨力达到了11648 × 6528,整体细节可以说是刻画的相当详细了,当然过分的细节刻画也导致了画面元素主次关系变的不明显,整体画面前后关系变的不明确了,画面有点平了(下方对比图中,图4为最终成图,大家可以放大查看)。
当然由于图片没有特别细化的处理,一些细节刻画上还是有所不足,我们可以通过局部重绘在对人物的手部等位置进行细节处理,这里就不做演示了,最后我们再用画面局部细节进行效果对比,看看通过stable diffusion的一顿操作后,是否达到了我们想要的效果。
最后提供原图的prompt给大家参考,有兴趣的小伙伴可以自行生成图片进行尝试:This artwork depicts an epic battle between Greek gods and humans. During this war, humans demonstrated their strong will and perseverance, while Greek gods showcased their immense power and extraordinary abilities. In this piece, you can see the Greek gods using their incredible strength to eng age in fierce combat with human warriors, and the humans using their own fighting skills and weapons to fight back. The style of this artwork is game concept art style, with bright colors, fluid lines, and prominent light and shadow. The picture is full of dynamic energy, making it feel as though the characters in the picture are going to leap off the paper and engage in a life or death struggle --ar 16:9
你不可错过的好内容
《LoRA模型推荐:仙侠类LoRA模型 | 法天象地 | 道友,修仙吗?| Stable Diffusion》
https://huke88.com/article/8146.html
《Stable Diffusion插件:ControlNet的安装与模型下载教程》
https://huke88.com/article/8133.html
《Stable Diffusion小知识:图生图中的重绘幅度详解》
https://huke88.com/article/8131.html
《Stable Diffusion插件推荐:Tag反推(Tagger)|关键词反推》
https://huke88.com/article/8132.html
《Stable Diffusion插件:ControlNet的安装与模型下载教程》
https://huke88.com/article/8133.html
《Stable Diffusion小知识:缩放模式[拉伸|裁剪|填充|直接缩放(放大潜变量)]》
https://huke88.com/article/8130.html
《Stable Diffusion小知识:模型合并功能介绍|大模型合并》
暂无评论
违反法律法规
侵犯个人权益
有害网站环境