关于人工智能:MidJourney-v52-Stable-Diffusion-XL-09-出图对比

28次阅读

共计 1663 个字符,预计需要花费 5 分钟才能阅读完成。

最近两个最风行的 AI 图像生成器,Midjourney 和 Stable Diffusion,都公布了重大更新。Midjourney v5.2 引入了许多新性能,包含“放大”性能、“/ 缩短”命令、改良的图像品质等。

Stable Diffusion XL (SDXL) 0.9 则专一于改善图像品质和构图。新模型应用更大的数据集和更弱小的算法,生成的图像更清晰、更实在、更有凝聚力。

那么哪个 AI 图像生成器更好呢? 明天我将比拟 SDXL 0.9 和 MidJourney v5.2。

1、肖像

A beautiful young and cute attractive girl with ginger braided hair in a bun wearing glamorous makeup, watching the sunset at Santorini, Greece. Looking at the camera, half body, photorealistic

尽管这始终是 SDXL 的弱项。但这两模型都超出了我的预期,提供了惊人的后果。然而 SDX 脸颊上粗劣的雀斑和还有脖子后反射的光线,这可是以前素来没见到的

2、动物

Shot of Vaporwave fashion dog in miami

MidJourney 照片更清晰,狗狗的衣服和太阳镜真正体现了迈阿密的气氛。

3、自然景观

Traversing A Frozen landscape, Snowing, Fog, Volumetric Lighting, dramatic, Long-shot, Cinematic, Dramatic, Intricate detail, Rocky, Minimalistic, hyperrealism

这两张图片看起来十分类似。但 MidJourney 细节更多

4、动漫

1990s anime low resolution screengrab couple walking away in street at night

SDXL 更像 90 年代的格调。但 MidJourney 更古代

在 MidJourney 中增加了“- niji”参数,让 AI 应用 niji 模型,这个模型官网说是专门用于生成动画插图的,所以可能是这个起因无关。

5、插图

a silly smiling happy cat, impressionist abstract cubism tiny smooth wavy segments made of silk fabric, intricate details, harmonious waves

都不错

6、商业产品

Minimalism, product photo of bottle of coca-cola

左边的图像显著更好。然而这里“Coca-Cola”这个词的拼写精确,这又是一个提高。

7、食物

A cinematic still of a close-up shot of a japanese ramen

SDXL 还持续应用动漫格调,这个很奇怪

8、生物

Detailed photo of a creature with the body of a lion and the wings of an eagle cinematic still

两种模型生成的图像很类似。然而 MidJourney 的细节和表情很到位。

9、时尚

a colorful fashion design with lots of things in it, in the style of surrealistic fashion, candypunk, chaoscore, in style of glamour, endless photo, real life

两种后果都很惊人!

10、3D

A 3d cube shaped hamburger

MidJourney 胜出。汉堡看起来很好吃!

总结

两个 AI 图像生成器的构图和整体美学的匹配水平都十分的高,而 SDXL 是开源的,而且还在迭代。依据 Stable Diffusion 团队的说法,v0.9 只是一个钻研预览版,他们很快就会颁布最终版本 1.0,这应该是个好消息。

https://avoid.overfit.cn/post/0ee84ee5f8ed49c6b834db706f4c910e

作者:Jim Clyde Monge

正文完
 0