乐趣区

关于人工智能:Midjourney文心一格prompt教程技巧篇生成多样性增加艺术风格图片二次修改渐进优化

Midjourney| 文心一格 prompt 教程 [技巧篇]:生成多样性、减少艺术风格、图片二次批改、渐进优化、权重、灯光设置等 17 个技巧等你来学

1. 技巧一:临摹

我认为学习图片类的 prompt,跟学习画画是相似的,最好的学习办法不是间接用模板。

而是拿真图,或者他人生成的图来临摹。英文不好,也能够先写中文,而后让 ChatGPT 翻译。当你临摹了几张后,你就会缓缓搞懂如何做出相似的图了。

拿下面的那个握手图为例,咱们仔细观察下面那张图,图中元素有什么:

  1. 第一主体是两个手,而后握在了一起,并且看起来是两个亚裔男人。
  2. 第二两人都衣着西装。
  3. 第三背景看上去像是在办公楼的大门,两人可能是在握手辞别。并且背景刻意进行虚化了,或者是应用照相机拍摄的。

再演绎总结下,大略的信息:

  • 主体:两个衣着西装的亚裔男人在握手辞别
  • 场景:办公楼大门
  • 图像格调:stock photo,照相机拍摄,

这时候,咱们就能尝试写一下 prompt 了(如果你感觉本人英文程度还不太行,也能够尝试用翻译软件翻译)。

stock photo of two Asian men in suits shaking hands,say goodbye in front of the main entrance of the office building,taken with Canon

Midjourney 生成的后果如下所示。

Emm 🤔 如同跟咱们的预期不一样。不要慌,刚开始用 Midjourney 肯定会遇到这种问题,重要的是多尝试。

咱们再来剖析下 Midjourney 为何生成了这样的图片?复盘下:

  1. 首先图片的主体,或者说焦点,咱们只须要「握手」,而不是两个人。
  2. 照相模式如同并不能实现背景虚化?更像是一种图像格调,图四就像是一种老照片的格调。

那咱们调整下 prompt,减少焦点和背景虚化关键词:

stock photo of two Asian men in suits shaking hands,say goodbye in front of the main entrance of the office building, focus on two hands, taken with Canon, background bokeh

再来看看生成的后果,后果好很多,图 1 和 图 4 根本满足需要了,图 2 和图 3 裁剪一下,也能满足咱们的需要。不过须要留神,Midjourney 在人手的生成上,临时还有点问题,你细看图 2 和图 4,其中有一个人的手有 6 个手指 😂,但我认为将来应该会修复:

那咱们来总结一下 prompt,该 prompt 分成以下几个局部:

  • 第一局部(红色线):形容你想要的内容主体。
  • 第二局部(蓝色线):形容主体背景 / 环境。
  • 第三局部(黄色线):照片的焦点地位。
  • 第四局部(绿色线):照片的格调或者说是特殊要求。

2. 技巧二:多试验

我还想教给各位第二个技巧:多试验。

图片生成遇到不合乎预期的状况,不要慌,剖析问题,而后应用控制变量法,一个个调整图片,不要急,下面我写的 prompt 还有一个中央,不晓得各位有没有留神,就是结尾的 stock photo,试试将这两个词删掉会怎么?

two Asian men in suits shaking hands,say goodbye in front of the main entrance of the office building, focus on two hands, taken with Canon, background bokeh

生成后果也仍然满足需要,而且手指的数量也精确了,阐明这个 Stock Image 对模型的影响不是很大。

3. 技巧三:善用 Image2Image 性能

在 Stock Photo 场景里,还有一个十分厉害的技巧,这个办法我一开始感觉不太适宜教,因为这个对 Stock Photo 库影响太大了 😂

但本着工具中立的准则,并且这个技巧,其实在很多场景都能用(比方生成头像等),所以还是感觉有必要教给大家。

各位个别用 Stock Photo 库会遇到以下几个问题:

  1. 图有版权,没法商用,或者说须要付费。
  2. 有些图,被很多人用过,其他人一眼就看进去这是 Stock Photo。
  3. 图里的内容大体符合要求,但细节不符合要求,比方上图两个亚洲男性握手,可能换成一男一女,且其中一人是黑人会好一些。

要解决这三个问题,最好的形式就是让 AI 改一改原来的图片。让 AI 改图,只须要用到 Image2Image(或者叫 Blend)性能即可。操作步骤如下:

:::info

起初在某书刷到相似的教程,我才晓得这个办法大家个别叫垫图。老外如同个别都叫 Image2Image,或者 img2img。

:::

  1. 将你看到的不错的 stock photo 发给 Midjourney Bot(我还是以后面的那张握手照为例)
  2. 右键复制该图片的链接,而后黏贴到输入框
  3. 在链接后加个空格
  4. 接着输出你想要的内容,比方将其中一个人的手换成黑人,一个人换成女性:
one Afican-American hand and one Asian woman hand

生成的后果是这样的,我在 prompt 里没有提任何西装,以及场景背景信息,就说我要一个非裔的手,一个亚裔女性的手:

抛开 6 根手指的问题,这个技巧是不是很高效?不过须要留神,blend 性能(这个后续教程会讲到)我发现更适宜两张图交融,图片 + 文字不是很稳固,各位要有急躁,多测试一下。

4. 技巧四:减少格调——艺术静止

因为篇幅的起因,本教程不会介绍特地多的格调,我会在我的小红书账号上更新。感兴趣的敌人能够去关注下。

后面生成的 logo,有一些预计各位会感觉平平无奇,比方 Lettermark Logo,起因并不是 Midjourney 能力不强,而是咱们给的指令太少了,只有在 prompt 里加几个单词,就能生成不一样的 Logo:
右边四个的 prompt 是这样的,我仅仅在原来的 prompt 上加了两个单词 Pop Art:

letter A logo, lettermark, typography, vector simple, Pop Art

Pop Art 是什么?

波普艺术(Pop Art,又译为普普艺术或艰深艺术),是一种起源于 20 世纪 50 年代和 60 年代的艺术静止,它强调对大众文化、公众媒体和消费主义文化的反思和表白。Pop 来自“风行艺术”(popular art)一词里的 popular,由 1956 年英国艺术评论家罗伦斯·艾伟(Lawrence Allowey)所提出。

Pop Art 的特点是:

  • 它的内容主体个别是公众日常生活中常见的物品和图像,如广告标语、杂志封面、食品包装等。
  • 个别用色比拟大胆,同时线条比拟简洁,强调物品自身的视觉效果和意义。

左边边四个的 prompt 是这样的,我在 prompt 里加上了 De Stijl。

letter A logo, lettermark, typography, vector simple,De Stijl

De Stijl 是什么?

它是一个荷兰艺术静止,始于 1917 年,致力于简化视觉元素,包含直线,立体和根本色调。

它的成员包含画家 Piet Mondrian 和 Theo van Doesburg 等人。De Stijl 的成员致力于将艺术与设计交融,以发明出具备实用性和功能性的美学。

De Stijl 的特点有:

  • 经常用几何图形进行设计,如矩形和直线。
  • 用色根本只用根本色调,比方黑、白、灰、红、黄、蓝。
  • 谋求均衡和谐和,强调模式和构造,不重视细节和表现力。

5. 技巧五:减少格调——艺术家

前一章介绍了减少艺术静止,从而使得生成的图片更加特地,本章再教大家一个办法,是减少艺术家的名字。
首先须要留神,Midjourney 反对大部分的艺术静止,但在艺术家的反对上,相对来说比拟少,通过网友们的不懈努力,截止到 3 月 31 日,V4 已知反对的艺术家有 2000 多位,V5 有 100 多位。
其中在榜的 Logo 设计师,只有 Paul Rand 和 Saul Bass,Paul 是 IBM、英孚、NeXT logo 的设计师,Saul 是美国联结航空、AT&T logo 的设计师。
应用办法很简略,在 prompt 最初加上 by Paul Rand 即可:

letter A logo, lettermark, typography, vector simple, by Paul Rand

当然也不是说只能加 Logo 设计师,加上没有设计过 Logo 的设计师名字,也很有意思。比方左边四张图我加的就是 Piet Cornelies Mondrian,第三张 logo 有 Composition II in Red, Blue, and Yellow 那味了。右边四张则是 Paul 的,第二张红色框加彩色 A,有他的经典眼镜 logo 那味,十分喜爱:

最初须要留神,减少艺术家名,有可能呈现以下状况:

  1. 多长图的格调都很像:这是因为某些艺术家有十分强烈的标志性格调,比方我很喜爱的 Piet Mondrian,你用他的名字,会发现可能生成的很多张图都是 Composition II in Red, Blue, and Yellow 的格调。
  2. 生成的图看上去不太像该艺术家的格调:我本人测试,发现有两种可能,一种是模型并没有学习这个艺术家的作品(特地新的艺术家我感觉个别都不会收录),另一种可能是你的 prompt 里的一些词,跟该艺术家的格调有抵触,比方用了达芬奇 Leonardo da Vinci,但主体是个日本二次元小姑娘。

PS:在本教程里的 Artist List 能够看到我比拟喜爱的艺术家。

6. 技巧六:善用 no 参数,去掉不想要的元素

在徽章 Logo 的案例里,你应该还看过单色的徽章,比方校徽。但 Midjourney 有个习惯就是偏向于生成简单的内容,生成单色内容,你能够在 prompt 里退出色彩,背景等等词,让其变得简洁。

还有一个技巧是用 no 参数。比方我想制作一个单色校徽,校徽主体是一本书,同时因为 Midjourney 对文字不是很善于,我还要去掉 text。以下是我的 prompt,我在最初加了 no realistic color(没有色彩)text(字)。

emblem for a university with large book, vintage --no realistic color text

而后我把下面那个 Instant Noodles company 的 prompt 也加了 no text,最初生成的两组图片是这样的(最初须要留神,no 参数在 logo 里应用时,–no text 有的时候会生效,但如果你去掉 — 间接输出 no text 就会失效,很神秘,预计是个 bug):

7. 技巧七:多参数同时应用

在应用 img2img 的办法生成头像时,我发现问题是「文字权重比图片权重高」,导致其生成的图片不像原图,iw 参数在 V5 里最多晋升图片权重到 2,所以我就在想有没有可能进一步升高文字的权重。

而后我就试了下 s 参数,发现确实好了很多。

如果生成的图片还是不像,你能够在 —iw 2 根底上,再加一个参数 —s 200,留神同时用两个参数时,两头不要有逗号。我发现加了 s 参数之后确实像了很多,我集体猜想是 s 和 iw 连用会提高一减弱 text 的权重。

s 是管制生成图片的风格化水平。简略了解,这个值越低会更合乎 text prompt 的形容,数值越高艺术性就会越强,但跟 text prompt 关联性就会比拟弱。所以如果你生成的图还是不像,就加大这个值,比方调到 500。

我想通过这个案例通知大家,多个参数一起应用,有可能会造成合力,进一步放大模型的能力。将来有新的参数能力,无妨也想想有没有可能一起用?

8. 技巧八:应用 Seed 参数对图进行二次批改

留神:这个技巧,我集体感觉将来后劲比拟大,但目前 Midjourney 的实现成果还比拟个别,成果得不到保障。官网的社区的帮忙文档也提到这个性能在 V5 十分不稳固。具体能够看看我整顿的 Midjourney 官网 FAQ 一章。

你可能遇到相似这样的场景:

  1. 你输出一段 prompt,机器生成了 4 张图片
  2. 你看了下 4 张照片,发现其中有一张还行,但其余不是很称心,而后改了下 prompt,机器又生成了一些
  3. 但这次生成的照片你都不称心,你就很懊恼为何会这样
  4. 而后你就像为啥不能在第一次生成图上做批改呢?

基于某一次生成的后果进行二次 prompt 批改,实践上我认为是能够的,以赛博朋克头像为例,我先用上述 prompt 生成了四张图片,而后在音讯的右上角点击 emoji 按钮(下图 1),而后再输入框里(下图 2)输出 envelope,而后点击信封 emoji(下图 3),接着 bot 就会将 seed 号码发给你。

而后我批改下面的赛博朋克头像的 prompt,将其背景改为 China Town,此时须要留神:

  1. 新的 prompt 并不是只改 background,你须要将之前的 prompt 都带上。
  2. prompt 仅批改 background 的局部。
  3. 最初带上 seed 参数。

以下是我的案例:

原 prompt:

{img url}  avatar, cyberpunk robot face, holographic VR glasses,holographic cyberpunk clothing, neon-lit cityscape background, Cyberpunk, by Josan Gonzalez --s 500 --iw 1

新 prompt(seed 码只是示例,你要填写本人的 seed):

{img url}  avatar, cyberpunk robot face, holographic VR glasses,holographic cyberpunk clothing, China Town background, Cyberpunk, by Josan Gonzalez --s 500 --iw 1 --seed 758242567

以下是生成的成果(左图为原图,右图是用了 seed 后生成的图),能够看到,背景确实换了,但人的外观也有点变动 😂

成果不是很好,但我感觉值得摸索,这样能进步渐进优化的成功率:

9. 技巧九:神秘的 blend 性能

这个技巧,说实话,我感觉不能称其为技巧,但这又是一个 Midjourney 十分重要的 feature,所以在这里着重介绍一下。

这个性能应用起来非常简单,在 Discord 输入框里 /blend,而后点击这个菜单:

之后你的输入框就会变成这样:

而后你就能够点击这两个框,而后抉择你电脑上的照片,增加实现后,大喊一声「应用交融卡」(不是),而后点击回车:

而后 Midjourney 就会生成这样牛逼的后果,右边是交融钢铁侠,左边是交融巴斯光年:

这个性能我第一次看到时,我是十分震惊的,认为是小时候看游戏王里配角们应用「交融卡」的那种成果。惋惜并不是,这个性能十分不稳固,仅有在满足多个未知条件能力达到上述的成果。

我原本打算用这个办法用于生成头像,但我发现只有用本人的照片,交融其余格调的照片,成果都不太好,目前试验下来成果最好的是名人头像,我的感觉是因为 Midjourney 喂了不少名人的头像给模型,所以这种交融的成果都很好。

但我感觉它真的很适宜做头像,将本人的头像跟另一张图片交融一下,就能生成一张不错的图,不便又快捷。惋惜目前这个性能感觉还不太好用。

当然这个性能还不仅仅止于此,它还有很多应用场景,在后续会介绍给大家。

10. 技巧十:控制变量法渐进优化

很多人把 AI 生成图片比喻为炼丹,我感觉十分贴切,很多时候,也不晓得为啥,在 prompt 里加一点神秘配方,图片就会很不一样。

不过我感觉尽管过程很像炼丹,但并不代表咱们须要像今人那样,用撞大运的形式炼制丹药。我认为目前应用 Midjourney 最好的办法是:控制变量渐进优化法。

拿下面那个配备集的图片为例,我心愿它生成的是配备,并且是一件件地排布,而且光剑的成果也很奇怪,首先咱们来逐条排查 prompt:

<div style={{width:180}}></div> Prompt 查看
类型是什么? blender 3d, game sheet 这个如同有点问题,我心愿的炉石传说的格调,如同不是这种粗劣的 3D 成果,生成的格调更像是星际争霸的,而炉石传说是那种黏土格调(clay render)。
主体是什么? lightsabers, paladin armor, 这里可能也有问题,会不会是没有写 different types of lightsabers 导致只生成一种光剑。
背景是什么? null 这个应该没啥问题
构图是怎么的? null 这个应该没啥问题
用什么镜头? null 这个应该没啥问题
是什么格调? style of Hearthstone 感觉生成的图没有那种中世纪盔甲的油腻感,但如果后面改了黏土格调,会不会好一些?这里可能也须要优化下。
参数 null 这个应该没啥问题

从这个表里能够看到,咱们发现了三个问题,其中第一个黏土格调问题,跟最初一个问题无关,此时我的倡议是:

  1. 每次仅批改一个,其余变量不变。
  2. 批改完一条,成果合乎预期后,再批改下一个。
  3. 我的教训优先批改主体内容,因为主体有的时候会影响其余的变量。
  4. 如果想确定这个批改是否具备一致性,或者说是否符合要求,而不是凑巧合乎,能够用雷同的 prompt 再生成一次。不过因为没生成一次都要花钱,所以这个是可选项。

OK,依照以上准则,咱们批改一下咱们的 prompt,看看生成了什么,确实加了 different types of 后,光剑就多了,问题解决了:

而后咱们批改下 blender 3d,将其改为 clay render(黏土渲染),我改完之后发现生成的后果(右边四张),如同质感还是差了一点,于是我又试了下保留 3d blender 加 oily 的成果(两头四张),以及 clay render 加 oily 两个一起用(左边四张)。

我集体感觉如同两个都改了成果是最好的(左边四张)。

比照一下最开始的 prompt 生成的图片,是不是最终的图片成果更好?所以这个技巧次要想通知大家,写 prompt 没有必要照抄答案,你也有能力本人写好 prompt。

11. 技巧十一:减少格调——国家

说到手办,大家应该第一反馈会想起日本,再介绍一个技巧,在 prompt 里退出 Japanese style 即可,拿圣女贞德作手办,以及之前做的 logo 作为例子:

圣女贞德是不是有种 FF 的感觉?Logo 也比拟简洁,猫的外观也有点像动漫里猫的外观,当然除了 Japanese 还有 Chinese(右边 4 张),甚至 African Style:

12. 技巧十二:减少权重

各位有没有发现,下面那个 Chinese 手办生成的后果如同只有第三张是中国人脸孔?起因是 Chinese style 的权重太低,所以仅输入了一个后果。你在实际的过程中,也必定会遇到,AI 疏忽了某些 prompt 词的状况,比方你提到画面中要有一只鸟,但它就是没画进去。

那为何会产生这样的后果?起因 Midjourney 的 prompt 权重是依照程序一一升高(详情请见我翻译的 Midjourney 官网 FAQ),在咱们下面的 prompt,咱们将 Chinese Style 放到了最初,所以生成的后果也是起码的。疏忽了某些词,这个起因临时为止,但应该很可能是权重导致的问题。

减少权重的办法有很多,最简略的办法就是调整程序 ,比方将下面的 Chinese Style 放到最后面(而后生成的后果就是眯眯眼 style 了 🤣,我生成了两次,第二次好一些):

product photography, Chinese Style,Joan of Arc, full body, hand painted, plastic, detailed, white background, studio lighting

调整下程序,成果就大不一样,所以各位不要科学所谓的 prompt 模板,多试试。

第二种办法是 Slider 办法。

你须要在 prompt 最初加,而后加上你须要调整权重的词语,接着再加,最初加上权重值。比方还是下面的例子,我想突出 Chinese style 但不想调整程序,就能够改为:

product photography,Joan of Arc, full body, hand painted, plastic, detailed, white background, studio lighting, Chinese Style :: Chinese Style :: 0.5

而后你会发现,如同权重太高了,生成了跟 prompt 无关的图(下方左图),那咱们能够在原来的根底上,再加以下 Joan of Arc 的权重(下方右图):

product photography,Joan of Arc, full body, hand painted, plastic, detailed, white background, studio lighting, Chinese Style :: Joan of Arc:: 0.25 style of Chinese:: 0.5

你能够看到,调整参数后,生成的 4 张图有 2 张具备较强的 Chinese 格调:

不过坦白说来,这个办法,并不特地适宜这个案例,调整主体内容,或者程序,ROI 会更高一些,这个办法更适宜 miss 掉某个 prompt 词时应用,比方官网的案例是这样的:

several sad cats watch a crying woman in a home-office environment with laptop

生成的图片里(左四张图),猫咪们都看着你(你可能才是 crying woman 😂),如果用 slider 的性能(左边四张),crying woman 就呈现在画面里了:

several sad cats watch a crying woman in a home-office environment with laptop:: several sad cats::0.5 crying woman::0.6 laptop::0.7

另外须要留神,slider 可用的参数有 0.25、0.5、0.6、0.7,也能够用这个办法升高权重,区间是 -0.7、-0.6、-0.5、-0.25:

如果你用了 slider 还是没有呈现应该有的画面, 那还有一个大招 cowbell,坦白说来,这个并不合乎 Midjourney 的官网最佳实际,但确实是个可行的办法,以上面这个 prompt 为例,生成的图片里,woman 看起来并不 shy(右边四张图):

A songbird sits on the shoulder of a shy blonde woman dressed in white.

此时你能够反复反复再反复(我感觉这就是为何这个办法叫 cowbell 的起因):

A songbird sits on the shoulder shoulder shoulder shoulder shoulder shoulder of a shy shy shy shy shy shy shy blonde woman dressed in white.

13. 技巧十三:善用灯光

坦诚地跟大家说,我不是设计师,也不是摄影师(而且我十分不善于摄影),所以我仅能跟大家分享一下根底内容,因为这个对我来说,太多过程性知识了,不实际操作过,基本不晓得有什么。

言归正传,摄影中,罕用摄影灯光有以下几种:

  1. 主灯 (Key Light):主灯是最根本的摄影灯光之一,通常搁置在被拍摄物体的正前方或正侧方,用于照明主体,决定拍摄物体的次要明暗度。主灯通常是亮度最高的灯光。
  2. 填光灯 (Fill Light):填光灯用于补救主灯照耀的暗影局部,调整暗影的深浅水平,使照片亮堂一些。通常填充光应该比主光暗一些,以避免出现适度曝光。
  3. 逆光灯 (Back Light):逆光灯用于照耀被拍摄物体的反面,可能区别出主体和背景,并使物体轮廓变得清晰,罕用于拍摄骨感、重物感和逆光成果的照片等。
  4. 环境光 (Ambient Light):环境光就是摄影环境天然产生的光线,包含室内照明、自然光、街灯等,它能够补充被拍摄物体的外表,晋升照片的天然度和真实感。
  5. 故事性灯光 (Special Light):通常是为了制作出某种情境或者表白某种意义而应用的,例如烛光、亮光等。它们可能产生和煦、浪漫、神秘等场景和氛围,以摸索和表白艺术的想象力和创造力。

基于这些灯进行排列组合,你会失去不同应用场景的灯光。灯光的细节品种,能够去我演绎的 Lighting List 里查看,我这里次要分享一些罕用和易用的场景灯光:

14. 技巧十四:减少格调——年份

下面的老照片场景,咱们用了 1990s 格调,严格地说,这个 1990s 更适宜放在主体,或者环境里,放在格调里也不是不行,因为不仅仅心愿主体是 1990s 还心愿图片生成的格调也是 1990s。

这就是最初一种格调词用法:年代。

拿插画那一章的两个 prompt 批改一下,我都没在 prompt 里加艺术家的名字,而是改为 style of 1920s,玫瑰的图有点那味,猫的图右上角那张太逗了。

15. 技巧十五:如何让 Midjourney 生成的人更具备多样性?

这里的多样性其实是指人的高矮胖瘦,甚至身材的一些特殊性等。

不晓得各位有没有发现,大多数用 AI 生成的图片,人物都十分丑陋和英俊,但这并不好,这其实某种程度上代表了社会的偏见。

所以我想在本章重点介绍下,如何让 Midjourney 生成更多样的人体。

办法一:Slider 办法

在上一章,我介绍了减少权重的办法,这个办法还能够帮忙你生成不同体型的人物,以下是 Midjourney 官网社区的案例:

Plus-sized ginger female dressed in bohemian vest, maxi skirt, espadrilles, walking across autumn campus courtyard, morning atmosphere:: plus-sized::-0.3 --ar 2:3

你能够管制 plus-sized 前面的参数,从而使画面中的人物变胖或者变瘦。这里须要留神,并不是正数就是越瘦的意思,而是减弱了 plus-sized 权重,如果你的 prompt 词是 thin 你加个正数 slider 参数那就是变胖了:

办法二:间接形容

Midjourney 是晓得一些多样性的词语的,比方:

  • blind:失明
  • deaf:聋
  • cerebral palsy:小儿麻痹
  • accessibility:行动不便

16. 技巧十六:扭转相机与镜头

前几章节分享了灯光,本章分享下,相机和镜头。

可能有些敌人用过一些手机 App,它并不像 PS 工具那样,容许你批改图片的白平衡等参数,而是让你体验用旧相机(如胶卷相机)拍照,尽管实质上来说,它也是通过各种参数来模仿当年的相机成果,但确实挺有意思的。

在 Midjourney 里,你也能够通过减少相机或者镜头的名称,从而达到相似的成果。依据我的试验,Midjourney 能够扭转以下几类:

  1. 相机:反对不同品种的相机,比方静止相机 GoPro
  2. 胶卷:比方 8 mm 电影胶卷
  3. 镜头:比方 15 mm 镜头
  4. 相机设置:比方长曝光、双重曝光
  5. 景深 & 焦点:比方深景、浅景,还有隐没点

我很喜爱双重曝光的成果,以及长曝光:

不过各位应用时,须要依据本人的场景抉择适合的相机和镜头,比方无人机视角,都不太适宜拍近物:

17. 技巧十七:看到他人的图,想晓得它的 prompt 是啥

最简略的办法,当然就是间接问。

如果问不到,倒是能够借助一些工具,Midjourney 反对图片转 prompt 性能。办法很简略。第一步在输入框输出 /describe:

点击 describe 后,会弹出一个增加文件的入口,上传文件,并点击回车。

Midjourney 就会返回后果,点击图片下方的 1、2、3、4 按钮,能够间接发 prompt 给 bot,让其生成图片,左边是别离用 #1 和 #4 prompt 生成的图片,我感觉用它来探寻原图的构图、主体、格调应该都不错,但不要预期能生成一个齐全一样的图:

参考链接:

https://github.com/thinkingjimmy/Learning-Prompt

https://github.com/wangxuqi/Prompt-Engineering-Guide-Chinese

https://github.com/tonyyuhang/ChatGPT/tree/main

https://github.com/f/awesome-chatgpt-prompts

退出移动版