最近两个最风行的AI图像生成器,Midjourney和Stable Diffusion,都公布了重大更新。Midjourney v5.2引入了许多新性能,包含“放大”性能、“/缩短”命令、改良的图像品质等。

Stable Diffusion XL (SDXL) 0.9则专一于改善图像品质和构图。新模型应用更大的数据集和更弱小的算法,生成的图像更清晰、更实在、更有凝聚力。

那么哪个AI图像生成器更好呢?明天我将比拟SDXL 0.9和MidJourney v5.2。

1、肖像

A beautiful young and cute attractive girl with ginger braided hair in a bun wearing glamorous makeup, watching the sunset at Santorini, Greece. Looking at the camera, half body, photorealistic

尽管这始终是SDXL的弱项。但这两模型都超出了我的预期,提供了惊人的后果。然而SDX脸颊上粗劣的雀斑和还有脖子后反射的光线,这可是以前素来没见到的

2、动物

Shot of Vaporwave fashion dog in miami

MidJourney照片更清晰,狗狗的衣服和太阳镜真正体现了迈阿密的气氛。

3、自然景观

Traversing A Frozen landscape, Snowing, Fog, Volumetric Lighting, dramatic, Long-shot, Cinematic, Dramatic, Intricate detail, Rocky, Minimalistic, hyperrealism

这两张图片看起来十分类似。但MidJourney细节更多

4、动漫

1990s anime low resolution screengrab couple walking away in street at night

SDXL更像90年代的格调。但MidJourney更古代

在MidJourney中增加了“- niji”参数,让AI应用niji模型,这个模型官网说是专门用于生成动画插图的,所以可能是这个起因无关。

5、插图

a silly smiling happy cat, impressionist abstract cubism tiny smooth wavy segments made of silk fabric, intricate details, harmonious waves

都不错

6、商业产品

Minimalism, product photo of bottle of coca-cola

左边的图像显著更好。然而这里“Coca-Cola”这个词的拼写精确,这又是一个提高。

7、食物

A cinematic still of a close-up shot of a japanese ramen

SDXL还持续应用动漫格调,这个很奇怪

8、生物

Detailed photo of a creature with the body of a lion and the wings of an eagle cinematic still

两种模型生成的图像很类似。然而MidJourney的细节和表情很到位。

9、时尚

a colorful fashion design with lots of things in it, in the style of surrealistic fashion, candypunk, chaoscore, in style of glamour, endless photo, real life

两种后果都很惊人!

10、3D

A 3d cube shaped hamburger

MidJourney胜出。汉堡看起来很好吃!

总结

两个AI图像生成器的构图和整体美学的匹配水平都十分的高,而SDXL是开源的,而且还在迭代。依据Stable Diffusion团队的说法,v0.9只是一个钻研预览版,他们很快就会颁布最终版本1.0,这应该是个好消息。

https://avoid.overfit.cn/post/0ee84ee5f8ed49c6b834db706f4c910e

作者:Jim Clyde Monge