关于人工智能:​DreamBooth-Hackathon-FAQ-来啦

1次阅读

共计 2271 个字符,预计需要花费 6 分钟才能阅读完成。

咱们正在和和鲸社区独特举办 DreamBooth 微调流动。具体介绍请看以下链接。本文是咱们总结探讨群大家遇到的常见问题作的 FAQ 心愿对大家有帮忙

收费;零根底;提供算力;提供代码;国内服务器,无网络要求;真的只有传几张照片就可生成你的文生图模型了;快来玩吧;还有奖品!欢送转发: 欢送加入 Hugging Face DreamBooth 微调编程马拉松流动!

开始 Hackathon 之前我须要筹备什么?

  • HuggingFace 账户,用于上传模型
  • HeyWhale 账户,用于获取计算资源
  • 几张对于你想训练的概念的图片(能够是照片,电脑绘图或者 CG 生成的内容等)

训练一个模型大略要多久?

快的话 30 分钟就够了。如果想屡次尝试,做到比较满意的成果,有 2-3 个小时的话应该就够了。如果遇到无奈解决的问题,欢送来群里探讨。

我齐全没有编程根底,能加入吗?

齐全能够。这里还有一个保姆级的教程能够参考(感激小帅同学):https://www.bilibili.com/video/BV143411Z7Ln/

图片有什么要求吗?

  • 主体清晰。背景色彩能够略微多元化一点,但最好不要特地简单,避免模型将背景的一部分内容 / 个性 / 纹理误认为是训练概念的一部分。
  • 倡议应用 jpg 格局。png 格局暂不反对(小挑战: 如果你胜利的批改了 notebook 并反对了 png 格局,请分割咱们~)
  • 倡议应用 https://www.birme.net/ 将图片裁切成正方形
  • 起码四张。notebook 外面有一段代码写死了逻辑,

什么是 type\_of\_thing 和 name\_of\_concept?

简略来说 Dreambooth 就是通过一个官网模型曾经学会的概念来学习此概念的一个新的实例。

比如说训练一个能生成的我家狗狗 caicai 的模型,那么 type\_of\_thing =“dog” name\_of\_concept = “caicai”

留神 type\_of\_thing 肯定是一个模型曾经理解的概念。name\_of\_concept 肯定是一个模型没有学习过的词汇。能够通过调用官网模型来理解模型是否理解这些概念。也能够查看 diffusers 模型的 tokenizer/vocab.json 来理解。这次 hackathon 咱们默认应用的是 SD1.4 的模型,能够参考以下文件 https://huggingface.co/CompVi… 如果文件中没有对应词汇则阐明模型不了解该概念。

我想训练一个格调,能够吗?

能够的。然而训练一个新的格调比训练一个曾经学习过概念的实例要简单一些。须要有更多的样本和调整过的超参数 (learning rate, steps 等等)。具体细节欢送加微信群交换。

如何上传我的数据集

能够参考 https://huggingface.co/datasets/xianbao/my-dreambooth 或者 https://huggingface.co/docs/datasets/image\_dataset 教程

我的模型看起来不错,但为什么上传模型文件要那么久?

文生图模型比拟大,大略有 4-5G 并且有的时候会遇到网络连接不稳固的状况,所以有时候可能会比拟久。如果失败,请重试。

常见报错

RuntimeError: Given groups=1, weight of size [128, 3, 3, 3], expected input[1, 4, 512, 512] to have 3 channels, but got 4 channels instead

数据集含有 png 图片,请转换成 jpg 格局

请留神 work 目录用量已超过 90%

work 目录空间无限,请删除一些无用文件。如果没有,则可疏忽此音讯。

为什么我产生的图片是黑的?

NSFW (Not safe for work) 检测器失效了。有的时候他可能会过于缓和。请尝试从新生成图片。因为随机数的作用每次生成的图片都会有所不同哦。

为什么我生成的图片手指的数量不对。

这个是一个老大难问题了。能够尝试从新生成或者本人 PS 一下。应用基于 SD2 的官网模型可能会成果好一些(但新模型可能会有比拟难 prompt 的问题)。

为什么我生成的图只有纹理,没有形态?

请确保 prompt 同时包含 type\_of\_thing 和 name\_of\_concept

CUDA out of memory 了怎么办?

可能有些 cell 被反复执行,但内存没有被开释。能够执行 notebook 外面清空 CUDA cache 的命令来开释内存。相似于以下代码:

with torch.no_grad():
    torch.cuda.empty_cache()

Webui 无奈载入我的模型

Webui 的 ckpt 格局和咱们这个 noetbook 应用的 diffusers 格局略有不同,能够参考这个文档来转化(感激 hhhxynh@):https://zhuanlan.zhihu.com/p/599017886

如何加入评奖

  • 请在 HeyWhale 社区上提交 repo 地址
  • 能够 在这里 看到本人的以后的全球排名
  • 每个类别的前三名能够取得寰球的奖品
  • 个别 HeyWhale 平台创立的模型都会带有 -heywhale 后缀,所以也能够看到本人在 HeyWhale 上的排名

如何取得更多的点赞

  • 倡议将一些生成成果还不错的图片和对应的 prompt 加到 readme.md
  • HF 的 markdown editor 反对粘贴图片主动上传
  • 在你的朋友圈宣传一下吧

再次特别感谢 HeyWhale 对本次流动的资源反对。群友 hhhxynh@ 在群里的热心答疑。感激海辛老师对流动宣传的反对。

咱们的 Hackathon 还有最初四天提交工夫。大家加油~

正文完
 0