共计 1821 个字符,预计需要花费 5 分钟才能阅读完成。
什么是 Stable Diffusion
Stable Diffusion 是在 2022 年公布的深度学习文本到图像生成模型。它次要用于依据文字的形容生成具体图像,只管它也能够利用于其余工作,如内插绘制、外插绘制,以及在提醒词(英语)领导下生成图生成图的翻译。
简略来说,就是 AI 画图,能够依据你的 prompt 生成对应的图片。
Stable Diffusion 疾速上手
github 地址:https://github.com/camenduru/stable-diffusion-webui-colab
这里咱们抉择这一款模型,而后点击右边的 lite
点击后会跳转到 Goole 的 colab
什么是 colab,可参考:https://blog.gm7.org/%E4%B8%AA%E4%BA%BA%E7%9F%A5%E8%AF%86%E5%…
点击左上角的启动图标启动即可,而后就是漫长的期待
[!TIP]
尽量抉择稳固的网络,不然可能会常常断,每次断了就要重开,网上说每 60 秒模仿一次点击,试了下没用。
等所有命令都之行完结,会有一些 web 地址,点击即可达到对应的 UI 界面
在文本框中输出 prompt 词即可生成对应的图片,如我这里生成的蜘蛛侠图片。
应用 chatGPT 生成 Stable Diffusion 的 prompt
每次本人想 prompt 头都想破了,既然有 AI,那就 AI 到底,通过 AI 来调教 AI。
如果大家没有 chatGPT 账号,能够去 https://chat-shared1.zhile.io/shared.html 中体验一下
chatGPT 的 prompt 如下:
Stable Diffusion 是一种利用深度学习的文生成图模型,反对应用提醒词来生成新的图像,形容中蕴含或省略的元素。在 Stable Diffusion 算法中,引入了 Prompt 的概念,也被称为提示符。Prompt 通常用于形容图像,由常见的单词形成,最好是能够在数据集起源站点(例如 Danbooru)中找到的驰名标签。接下来,我将解释生成 Prompt 的步骤,并以形容人物为例。在 Prompt 的生成过程中,你须要应用提醒词来形容人物的属性、主题、表面、情绪、衣服、姿态、视角、动作和背景。你能够应用英语单词、短语甚至自然语言的标签来形容,不仅局限于我给你的单词。而后,将你心愿类似的提醒词组合在一起,应用英文逗号作为分隔符,并按从最重要到最不重要的顺序排列这些词。此外,请留神,在每个 Prompt 的后面都加上引号中的内容 "(((best quality))), (((ultra detailed))), (((masterpiece))), illustration",这是高质量的标记。在人物属性中,"1girl" 示意生成一个女孩,"2girls" 示意生成两个女孩。另外,请留神,Prompt 中不能蕴含连字符和下划线,能够蕴含空格和自然语言,但不要过多,防止单词反复。当初,请尝试生成一个钢铁侠的 Prompt,尽可能提供更多的细节,包含人物属性、主题、表面、情绪、衣服、姿态、视角、动作和背景,并依照从最重要到最不重要的顺序排列。
Negative Prompt:
blurred, low quality, pixelated, (unattractive), (grimy), (old man), (dark), (out of focus), (unclear), (dirty), ((extra arm)), ((extra leg)), ((extra nose)), ((extra mouth)), (out of frame), (bad composition), (too bright), (too dark), ((extra cigarette)), ((extra hand)), (poor lighting), (bad color grading), (red-eyed), (morphed face), (unnatural posture), (awkward pose), (frozen animation), (poorly photoshopped), (low-res), (bad framing), (insipid)
试试成果:
高阶:载入第三方模型
Stable Diffusion 反对咱们从 CivitAi 中加载一些模型,辅助批改生成图片的款式和内容。
举例如下:
首先下载模型
该模板的 Demo 如下:
下载模型实现后,点击对应的模型即可加载改模型,能够在 prompt 最初看到
最终生成成果如下: