最近两个最风行的AI图像生成器,Midjourney和Stable Diffusion,都公布了重大更新。Midjourney v5.2引入了许多新性能,包含“放大”性能、“/缩短”命令、改良的图像品质等。
Stable Diffusion XL (SDXL) 0.9则专一于改善图像品质和构图。新模型应用更大的数据集和更弱小的算法,生成的图像更清晰、更实在、更有凝聚力。
那么哪个AI图像生成器更好呢?明天我将比拟SDXL 0.9和MidJourney v5.2。
1、肖像
A beautiful young and cute attractive girl with ginger braided hair in a bun wearing glamorous makeup, watching the sunset at Santorini, Greece. Looking at the camera, half body, photorealistic
尽管这始终是SDXL的弱项。但这两模型都超出了我的预期,提供了惊人的后果。然而SDX脸颊上粗劣的雀斑和还有脖子后反射的光线,这可是以前素来没见到的
2、动物
Shot of Vaporwave fashion dog in miami
MidJourney照片更清晰,狗狗的衣服和太阳镜真正体现了迈阿密的气氛。
3、自然景观
Traversing A Frozen landscape, Snowing, Fog, Volumetric Lighting, dramatic, Long-shot, Cinematic, Dramatic, Intricate detail, Rocky, Minimalistic, hyperrealism
这两张图片看起来十分类似。但MidJourney细节更多
4、动漫
1990s anime low resolution screengrab couple walking away in street at night
SDXL更像90年代的格调。但MidJourney更古代
在MidJourney中增加了“- niji”参数,让AI应用niji模型,这个模型官网说是专门用于生成动画插图的,所以可能是这个起因无关。
5、插图
a silly smiling happy cat, impressionist abstract cubism tiny smooth wavy segments made of silk fabric, intricate details, harmonious waves
都不错
6、商业产品
Minimalism, product photo of bottle of coca-cola
左边的图像显著更好。然而这里“Coca-Cola”这个词的拼写精确,这又是一个提高。
7、食物
A cinematic still of a close-up shot of a japanese ramen
SDXL还持续应用动漫格调,这个很奇怪
8、生物
Detailed photo of a creature with the body of a lion and the wings of an eagle cinematic still
两种模型生成的图像很类似。然而MidJourney的细节和表情很到位。
9、时尚
a colorful fashion design with lots of things in it, in the style of surrealistic fashion, candypunk, chaoscore, in style of glamour, endless photo, real life
两种后果都很惊人!
10、3D
A 3d cube shaped hamburger
MidJourney胜出。汉堡看起来很好吃!
总结
两个AI图像生成器的构图和整体美学的匹配水平都十分的高,而SDXL是开源的,而且还在迭代。依据Stable Diffusion团队的说法,v0.9只是一个钻研预览版,他们很快就会颁布最终版本1.0,这应该是个好消息。
https://avoid.overfit.cn/post/0ee84ee5f8ed49c6b834db706f4c910e
作者:Jim Clyde Monge