关于算法:人工智能AI图像风格迁移StyleTransfer基于双层ControlNetPython310

46次阅读

共计 1950 个字符,预计需要花费 5 分钟才能阅读完成。

图像格调迁徙(Style Transfer)是一种计算机视觉技术,旨在将一幅图像的格调利用到另一幅图像上,从而生成一幅新图像,该新图像联合了两幅原始图像的特点,目标是达到一种风格化叠加的成果,本次咱们应用 Stable-Diffusion 联合 ControlNet 来实现图像格调迁徙成果。

装置 ControlNet 插件

首先确保本地曾经装置并且配置好了 Stable-Diffusion-Webui 服务,对于 Stable-Diffusion-Webui,请参见:人工智能, 丹青圣手, 全平台 (原生 /Docker) 构建 Stable-Diffusion-Webui 的 AI 绘画库教程(Python3.10/Pytorch1.13.0),这里不再赘述。

随后进入我的项目目录,启动 Stable-Diffusion-Webui 服务:

python3 launch.py

如果是没有 N 卡的电脑,就应用 cpu 模式启动:

python3 launch.py --skip-torch-cuda-test --upcast-sampling --use-cpu interrogate

接着拜访 http://localhost:7860

抉择插件 (Extensions) 选项卡

点击从 url 装置,输出插件地址:github.com/Mikubill/sd-webui-controlnet.git

装置胜利后,重启 WebUI 界面。

因为 ControlNet 默认是一层网络,风格化操作咱们须要两层,所以在设置选单 (Settings) 中,将多层网络设置为 2。

设置好之后,下载模型文件:huggingface.co/webui/ControlNet-modules-safetensors/tree/main

将模型放入 stable-diffusion-webui/extensions/sd-webui-controlnet/models 目录

这里还须要独自下载一个格调迁徙模型,地址是:huggingface.co/TencentARC/T2I-Adapter/blob/main/models/t2iadapter\_style\_sd14v1.pth

同样放入 stable-diffusion-webui/extensions/sd-webui-controlnet/models 目录

至此,Stable-Diffusion-Webui 服务的 ControlNet 插件就配置好了。

格调迁徙

当初,咱们关上 ControlNet 的第一个图层,将原始图像的轮廓渲染进去,因为须要保障原始图像的根本形态。

这里预处理器抉择 head,模型应用 ControlNet 的 head 模型即可。

能够看到根本轮廓曾经失去了保留,风格化只负责色彩和线条。

随后配置第二个 ControlNet 图层,预处理器抉择 t2ia\_style-clipvison,模型抉择刚刚下载的 t2iadapter\_style\_sd14v1.pth,默认图像权重为 1,先不要动。

接着上传一张指标格调的图片,这里咱们抉择文森特梵高的表现主义作品《星空》:

随后点击 Generate 按钮做图生图(img2img)操作即可。

过拟合问题(Overfitting)

通过一段时间的本地推理,生成后果如下:

成果并不尽如人意,这也是大多数深度学习入门者会遇到的问题,也就是过拟合问题。

过拟合(Overfitting)是指在训练模型时,模型适度地学习了训练数据的特色和噪声,从而导致模型在新数据上体现不佳的问题。

艰深地讲,过拟合就像是一名学生背诵考试答案,然而他只是死记硬背了考试题目标答案,没有真正了解题目的实质和解题思路。当他遇到新的考试题目时,因为没有了解题目的实质和解题思路,他就无奈正确答复。

在机器学习中,过拟合的起因是模型简单度过高,导致模型对训练数据中的噪声和特色都适度谋求,并且疏忽了数据背地的实质法则和特色。因而,当模型面对新的数据时,因为没有真正了解数据的实质法则和特色,它就无奈正确地对新数据进行预测。

说白了,就是对于原始图的特色过分谋求,从而淡化了指标图的格调,还记得 ControlNet 默认权重是 1 吗?这里咱们只须要将权重往下调整,比方调成 0.8,再次尝试生成:

成果不错,既保留了原始图的大部分细节,又减少了梵高的表现主义格调。

当然了,权重也不能一味地往下调整,否则也会呈现欠拟合(Underfitting)问题,整个风格化迁徙的过程也能够了解为是一种“调参”的过程。

结语

通过 Stable-Diffusion 联合 ControlNet 插件,咱们能够失去一幅新的图像,该图像联合了两幅原始图像的特点,既具备内容图像的内容,又具备格调图像的格调。图像格调迁徙也能够利用于其余的畛域,比方电影、游戏、虚拟现实和动画创作等等。

正文完
 0