关于人工智能:中国风古典系AI中文绘图创作尝鲜⛵

7次阅读

共计 2524 个字符,预计需要花费 7 分钟才能阅读完成。

本文对百度开源的中文 AI 图像生成器 ERNIE 进行解说,包含工具简介、通过 Demo 页面和 API 两种应用形式,以及应用中文提醒词生成的图像成果。


💡 作者:韩信子 @ShowMeAI
📘 深度学习实战系列:https://www.showmeai.tech/tutorials/42
📘 本文地址:https://www.showmeai.tech/article-detail/413
📢 申明:版权所有,转载请分割平台与作者并注明出处
📢 珍藏 ShowMeAI 查看更多精彩内容

💡 引言

人工智能图像生成器当初风行一时。尽管 📘Dall-E2、📘MidJourney 和 📘Stable Diffusion 目前处于核心舞台,然而百度开发的开源 AI 图像生成器 📘ERNIE-ViLG 也在互联网上流传。

💡 ERNIE-ViLG 是什么

ERNIE 代表通过常识整合加强示意——视觉语言生成。它是一个对立的生成预训练框架,用于应用 Transformer 模型进行双向图像文本生成。

须要明确的是,ERNIE 并不是 Stable Duffusion 的一个变体版本,只管这两种模型都是开源的。依据 📘ERNIE 论文 ,ERNIE-ViLG 2.0 是一种改良的文本到图像扩散模型,具备常识加强的去噪专家组合,以联合无关视觉场景的额定常识,并在不同步骤中解耦去噪能力。

💡 ERNIE-ViLG 应用办法

当初能够通过 huggingface 收费拜访该模型。咱们能够在 📘ERNIE-ViLG Demo 查看工具实例。

界面非常简单: 能够看到经典的提示框,各种艺术风格的抉择,以及图像分辨率。在艺术风格方面,ERNIE 提供了一些乏味的抉择。这让我想起了 📘Dream by WOMBO 中的一个相似性能。

让咱们用提醒“An astronaut riding a horse in space”来生成样本。

该应用程序生成六张分辨率为 1024×1024 的图像。

ERNIE 的钻研人员宣称,他们的办法比 Dall-E2 和 Stable Diffusion 产生更清晰、更天然的细节。

真的吗?当初让咱们尝试将艺术风格更改为“油画”。

这些后果自身都十分惊艳。

品质上,ERNIE 能够与 Dall-E2 和 Stable Diffusion 相媲美。然而,它在一致性方面体现不佳,就像在下面提到的,其中两个后果中的马无处可寻。这可能是训练 ERNIE 的数据集较小所致。

不过,如果认真思考数据集的大小,训练了 14.5 亿张图像的 ERNIE 与 MidJourney、Google Parti 等大型竞争对手的差距并不大。

兴许开发人员找到了一种优化算法的办法,使其可能在较小的数据集上运行良好。我假如如果模型是在更大的数据集上训练的,现有的限度就会隐没。

须要特地留神的是,ERNIE 是用中文开发的。这意味着,在开始图像生成过程之前,必须将英文提醒翻译成中文。当然,应用中文的宝宝能够纵情游玩~

这里有更多示例后果。

上图提醒文字:“戴眼镜的猫”格调“油画”

上图提醒文字:“五官端正的绘画女生”

💡 API 拜访 ERNIE-ViLG

您能够通过 API 拜访 ERNIE。如果您想尝试应用 API,请依照这个 📘GitHub 上的指南进行操作。

示例 API 调用如下所示。

def generate_image(
          text_prompts:str,
          style: Optional[str] = "摸索有限",
          topk: Optional[int] = 6,
          output_dir: Optional[str] = 'ernievilg_output')
  • text_prompts:输出提醒
  • style:生成图像的格调
  • topk:生成图像的数量(最多 6 个)
  • output_dir:保留输入图像的目录

ERNIE 的使用指南还有一个倡议列表,可帮忙您找到联合应用款式和修饰符的最佳形式。

  • 【作图规定】Prompt 构建是文本合乎逻辑的组合,有序且丰盛的形容能够一直晋升画面成果
  • 【新手入门】不知如何输出 Prompt?点击示例,体验文生图的魅力,参考教程,逐渐进阶~
  • 【格调生成】试试增加“国潮”、“国风”等,感触中国风的魅力
  • 【格调生成】试试混合两种代表性的格调,例如“赛博朋克,扁平化设计”、”皮克斯动画,赛博朋克”
  • 【人像生成】增加“仙鹤、月亮、楼阁、小屋、街道、玫瑰、机械”,画面会更丰满
  • 【人像生成】增加“粗劣面容、唯美、cg 感、细节清晰“等,人物刻画会更粗疏
  • 【格调生成】增加“扁平化格调,logo”等,能够设计出各类图标等,例如“猫猫头像,扁平化格调”
  • 【格调生成】指定色彩,或增加“烟雾回绕”、“火焰”、“烟尘”、“花瓣”,生成画面的气氛感更丰满
  • 【创意生成】施展想象力,例如:“中西混搭”、“泰迪熊唱京剧”、“米老鼠吃火锅”
  • 【格调生成】“水彩”,“水墨”与新诗组合,画面意境会有晋升~
  • 【格调生成】想要日系头像和拟人化动物?试试关键词“日系手绘”、“治愈风”
  • 【格调生成】增加“pixiv”,生成二次元或者动漫的画质更惊艳

参考资料

  • 📘 Dall-E2
  • 📘 MidJourney
  • 📘 Stable Diffusion
  • 📘 ERNIE-ViLG
  • 📘 ERNIE 论文
  • 📘 ERNIE-ViLG Demo
  • 📘 Dream by WOMBO
  • 📘 PaddleHub ERNIE-ViLG GitHub

举荐浏览

🌍 数据分析实战系列 :https://www.showmeai.tech/tutorials/40

🌍 机器学习数据分析实战系列 :https://www.showmeai.tech/tutorials/41

🌍 深度学习数据分析实战系列 :https://www.showmeai.tech/tutorials/42

🌍 TensorFlow 数据分析实战系列 :https://www.showmeai.tech/tutorials/43

🌍 PyTorch 数据分析实战系列 :https://www.showmeai.tech/tutorials/44

🌍 NLP 实战数据分析实战系列 :https://www.showmeai.tech/tutorials/45

🌍 CV 实战数据分析实战系列 :https://www.showmeai.tech/tutorials/46

🌍 AI 面试题库系列 :https://www.showmeai.tech/tutorials/48

正文完
 0