共计 7924 个字符,预计需要花费 20 分钟才能阅读完成。
Midjourney| 文心一格 prompt 教程 [根底篇]:注册应用教程、格调设置、参数介绍、隐衷模式等
结尾讲一下为什么抉择 Midjourney 和文心一格,首先 Midjourney 性能成果好不多论述;其次文心一格再屡次迭代优化后成果也不错,重点也收费,反对一下国产。
1. 首先注册 Midjourney,文心一格
Midjourney 网址:https://midjourney.com/home/
文心一格网址:https://yige.baidu.com/ 进官网注册一下就好, 能够把画图 prompt 技巧在这个下面测试。
首先,你须要注册一个 Discord 账号,而后退出 Midjourney 的 Discord 服务器。或者去 Midjourney 的官网点击右下角的 Join the Beta:
note:目前国内容易被锁还是须要用一下工具的 ,邮箱账号能够应用谷歌等。
1.1 在 Discord 公共服务器里应用
注册并进入到 Midjourney 的服务器后,有可能须要实现各种工作(这个取决于 Midjourney 的经营策略,后续可能会变),如果有,则依照疏导实现即可。
接着你就能在 Midjourney 的 Discord 的左侧栏,看到 newbies-XXX 的频道,轻易点击一个,进入该频道,这个频道就是给收费用户测试应用的:
而后在输入框里输出 / 而后你能看到输入框上呈现一个菜单,个别最顶部就是 /imagine,点击该菜单(如果没有呈现该菜单,就输出完 / 后持续输 imagine),就能在 prompt 框里输出图片 prompt 了:
接着你就会看到一个叫 Midjourney 的机器人复述了你的话,在这句话的最初,有一句 Waiting to start,这就意味着你的 prompt,机器人曾经接管到了,正在为你生成图片:
而后过一阵你会看到一张含糊的图,而后段落最初显示 0% 意味着程序正在生成图片:
当你看到图片下方有几个 U1、V1 的按钮,这就意味着图片生成实现了 🎉
- Upscale
生成的四格图,单格图片的分辨率是 512 512(如果你是 V5 版本,则是 1024 1024),如果你想要生成一个更清晰的图片,则能够点击四宫格图片下的 U 按钮,U1 代表左上角第一张图,U2 是右上角,U3 是左下角,U4 是右下角。点击后,你须要期待一会,就会生成高清图。须要留神,V5 版本,U 按钮曾经不会影响分辨率了,只是做为一个裁切图片的性能。换句话说就是将第一次生成的四格图,裁成一张。
- Variation
说完 U 按钮,说下,V 按钮,这个按钮代表 variation,点击该按钮后,程序会用你抉择的那张图片,再生成新的 4 张图,不过这 4 张图的整体会跟你抉择的那张图比拟像:
- 从新生成🔄
最初一个按钮 🔄 则是 re-roll 从新生成,点击后程序会依照你的 prompt 从新生成 4 张图片。
1.2 通过 Midjourney Bot 应用隐衷模式
因为在公共频道上应用,你发的图片会被频道里的人看到,所以如果你不想让本人的图被大量的人看到,能够应用 Midjourney Bot 的形式。
但须要留神,这种形式并不代表「仅有你可见」,你发的图片依然会在 Midjourney 的会员 Gallery 上显示,目前仅有 Midjourney 的付费 Pro 会员能设置为隐衷模式。
应用 Midjourney Bot 也很简略,跟在 Discord 的单聊比拟相似,你只须要在 Midjourney 的 newbies-XXX 频道里找到 Midjourney Bot,而后点击它的头像,在弹出的菜单的下方有个「私信 @Midjourney Bot」的输入框,在这个输入框里,轻易输出点内容,而后按回车发送。
而后你就会在你的私信列表里看到这个 Midjourney Bot,应用办法就跟下面介绍的办法一样,无任何差异。
1.3 保留 & 删除图片
保留图片跟应用很多聊天工具一样,点击图片会看到放到的图片,而后右键点击图片能够抉择「图像另存为」并保留图片(如果你用的是 Discord 的客户端,右键款式可能与我不一样,但操作根本是一样的):
如果生成的图片你不喜爱,其实你能够不必管它 😂
如果你肯定要删,也有一个删除的渠道,但操作跟你日常应用的聊天工具的形式不太一样,在你想要删除的图片音讯右上角有个 emoji 按钮(下图标注为 1 的按钮),点击后会 呈现一个 emoji 菜单,而后在 emoji 菜单里输出 x(下图标注为 2 的输入框),最初点击 ❌ emoji 即可删除该图片。留神这个删除并不仅仅只是删除聊天信息里的图片,还会将图片从 Midjourney 的会员 Gallery 里删除。
2. Midjourney Prompt 根本构造
在 Midjourney 的官网介绍文档里,介绍了最简略的 Prompt 构造是这样的:
但我感觉下面那个 Prompt 过于简略了 😂,反而 Advanced Prompt 更适宜学习:
2.1 Image Prompts(选填)
Prompt 分成三个局部。第一个是 Image,这个属于选填,能够填也能够不填。
先说下这个 Image URL 是干什么用的,有很多玩法,比方将两张图合并为一张,大家能够看看上面这个例子,我就是将一个大理石雕像和花朵的图片上传到 Discord:
而后让 Midjourney blend(混合)一下(后续 blend 章节会介绍更多用法)后,就能生成上面这种图片:
须要留神的是:
- 你输出的是图片的 URL 地址,而且必须是公开可拜访的地址。
- 图片格式仅反对 png、gif 和 jpg。
- 你最多只能放两张图的 URL,或者一张图的 URL + 一段话。
如果你不想将图片上传到一些图床服务器,也能够应用 Discord 的图床,你能够私聊 Midjourney Bot 而后通过上传图片的形式,将图片先发到 Discord 上,而后右键复制图片链接,像这样:
2.2 Text Prompt
这个就是你心愿 AI 生成的图片的形容。这个有十分多的技巧,后续会具体介绍。这里我想说下,Midjourney 跟 ChatGPT 有点不一样:
- 无奈了解句子构造和语法:Midjourney 没法像 ChatGPT 那样懂你说的话。类比的话,Midjourney 更像是命令式编程,ChatGPT 更像是申明式编程,你须要给 Midjourney 残缺的指令,它才有可能生成你称心的后果。
- Midjourney 有违禁词的设计:有些词语无奈输出,比方 emoji 就没法输出,因为这个 emoji 是 butts 的俚语,经常会导致模型生成一些不太好的图片,所以也被禁止了。
2.3 Parameter(参数)
Midjourney 大概有 20 多个参数设置项,我会在下一章介绍几个罕用参数。理解完基本参数后,你应该就能用 Midjourney 生成不错的图了。
3.Midjourney Prompt 罕用参数
简略说来,你能够将这些参数了解为官网的固定 prompt 模版,而且这个模板蕴含了一些特殊字符,让模型能百分百保障输入后果的一致性,并且还能晋升 prompt 的准确度和输出效率。
如果你有用过 ChatGPT,应该会遇到过这种场景,用了他人一样的 prompt 模板,但却没法令 ChatGPT 生成雷同的内容。
而 Midjourney 因为是图片类目,绝对比拟垂直,所以他们将很多图片类的通用 prompt 语句做成了模板,比方图片长宽比,有 1:1、2:3、4:7 等等,如果你要用 ChatGPT 的应用习惯,就须要在 prompt 里一直反复 Aspect Ratios 1:1 等,而且每个人的表白 Aspect Ratios 的形式都不一样,模型还要去了解人说的话,比拟麻烦。
所以 Midjourney 就设计了一些参数,让你能疾速调用,比方 Aspect Ratio 这个,就只须要输出 — ar 1:1 即可。同时因为固定了表达方式,大家要改长宽比,都会用这种形式表白,Midjourney 调整下模型,就能保障输入的图片的一致性了。
因为其稳固且必须,所以我才会先教各位参数。
3.1 版本抉择
目前 Midjourney 反对多个版本,最新的版本是 V5,跟 ChatGPT 略微有点不一样,Midjourney 给我的感觉,并不是版本越大,越厉害,而是善于的货色不太一样。相干区别请查阅 Midjourney 各版本差别。
Version 参数应用形式见下表。你也能够在设置里,调整默认的版本,相干教程请查阅 Midjourney 根底设置。
调用办法 | 应用案例 | 注意事项 |
---|---|---|
在关键词后加空格,而后带上版本参数:<ul><li> –v 或者 —v </li> <li>–version 或者 —version</li></ul> | vibrant california poppies –v 5 | 版本仅反对 1、2、3、4、5。 |
因为能够在 prompt 里间接加版本参数,同时又能够在设置里设置版本,所以你有可能会遇到如下图这样的状况(我想生成版本 1 的图,但设置里设置了 5 怎么办?):
此时模型会依照从左往右的程序运行这些参数,依照下面的例子,其实生成的图片是 V1 版本,能够跟上面的这个 V5 版本比照下:
3.2 高宽比设置
第一个参数是图片的长宽比,应用形式如下,及版本差别如下:
调用办法 | 应用案例 | 注意事项 | V5 | V4 | V3 | niji |
---|---|---|---|---|---|---|
在关键词后加空格,而后带上长宽比参数:<ul><li> –ar 或者 —ar</li><li> –aspect 或者—aspect</li></ul> | vibrant california poppies –ar 5:4 | <ul><li> 默认比例是 1:1。</li><li> 比例数须要是整数,比方 1.3:1 是不行的,但 13:10 能够。</li><li> 长宽比会影响生成图像的形态和构图。当放大图片时,有些长宽比可能会产生轻微的扭转。比方 –ar 16:9(1.75) 最终生成的图片可能是 7:4(1.74)。</li></ul> | ✅ 反对任意比例。但 2:1 以上的宽高比是实验性的,可能会产生不可预测的后果。 | ✅ 1:2 到 2:1 | ✅ 5:2 到 2:5 | ✅ 1:2 到 2:1 |
另外,长宽比在业界也有最佳实际:
- 5:4 多用于传统打印
- 3:2 多用于照片打印
- 7:4 比例靠近于 HD TV 的比例,或者是智能手机
- NO
这个参数的意思是不要什么,如果你不想让 AI 生成的图片里呈现树,那就输出 plants 即可:
调用办法 | 应用案例 | 注意事项 | V5 | V4 | V3 | niji |
---|---|---|---|---|---|---|
在关键词后加空格,而后带上你不想 AI 生成的内容:<ul><li>–no 或者 —no</li></ul> | —no plants | 无 | ✅ | ✅ | ✅ | ✅ |
3.3 随机性参数 Chaos
这个参数跟 ChatGPT 里的 Top P 有点像,次要管制模型的随机性,数字越高,约有可能产生一些意想不到的后果,数字越低一致性会更高。看看官网的例子,prompt 是 watermelon owl hybrid。
这是当 Chaos 为 0 的时候,一致性会比拟高,西瓜和猫头鹰的交融的形式,在四次输入里都比拟相似,另外在单次输入里,4 张图(四宫格)的格调类似度也比拟高:
这是 Chaos 为 100 的时候,你会发现屡次输入的交融格调都不太一样,且即便是在单次输入里,4 张图的格调区别也比拟大。如果你是想让 AI 帮你做一些探索性的事件,我倡议初期能够将 Chaos 调高一点,后果会发散一些。
调用办法 | 应用案例 | 注意事项 | V5 | V4 | V3 | niji |
---|---|---|---|---|---|---|
在关键词后加空格,而后带数字:<ul><li>–c 或者 —c</li><li>–chaos 或者—chaos</li></ul> | —c 10 | 能够输出 0 – 100,默认是 0 | ✅ | ✅ | ✅ | ✅ |
3.4 格调
这个参数跟 ChatGPT 里的 Temperature 有点像,次要是管制生成图片的风格化水平。简略了解,这个值越低会更合乎 prompt 的形容,数值越高艺术性就会越强,但跟 prompt 关联性就会比拟弱。
咱们一起看下官网的例子,prompt 都是 colorful risograph of a fig。Risograph 是一种数字印刷机,它应用模板和专用油墨来制作印刷品。Risograph 通常用于制作海报、宣传册等低成本印刷品。这种印刷机能够产生非凡的色调和纹理成果,头三张图基本上符合 risograph 的格调,但右下角那四张就十分不像了,模型加了很多戏 😂
除了在 prompt 里输出外,你也能够在设置里,调整默认的版本,相干教程请查阅 Midjourney 根底设置。
调用办法 | 应用案例 | 注意事项 | V5 | V4 | V3 | niji |
---|---|---|---|---|---|---|
在关键词后加空格,而后带数字:<ul><li>–s 或者 —s</li><li>–stylize 或者—stylize</li></ul> | —s 50 | 默认是 100 | ✅ | ✅ | ✅ | ✅ |
3.5 Niji 格调
这个其实 Niji 模型,是 Midjourney 跟 Spellbrush 一起开发的。「niji」是日语「にじ」,意思是「彩虹」或者「2D」。
它在生成动漫类的图片上,比拟在行。举个例子,prompt 是 fancy peacock,左图是 v5 模型,右图是 niji v5 模型,右图更偏差于漫画格调:
应用办法跟 Version 比拟像,只须要在文字 prompt 最初输出 —niji 即可
调用办法 | 应用案例 | 注意事项 |
---|---|---|
在关键词后加空格,而后带上版本参数:<ul><li>–niji 或者 —niji</li></ul> | vibrant california poppies –niji | 局部参数对 Niji 有效。大家能够在残缺列表里查看哪些参数对 Niji 有效。 |
4.Midjourney 根底设置
你能够在 Midjourney 的服务器,或者 Midjourney Bot 聊天窗口,输出 /setting,而后按下回车:
接着你就能看到这样的 Bot 音讯:
第一二行是版本切换,你能够依据本人的须要切换不同的版本,MJ Version 1-5 别离示意 Midjourney 的不同版本,切换后,输入的所有图,默认都会用该版本生成,各个版本区别请查阅 Midjourney 各版本差别。2023 年 4 月 5 日,Midjourney 上线了其 Niji 5,所以版本设置截图里会有 Niji 4 和 Niji 5 Mode 按钮,请知悉:
4.1 图像品质设置
第三行是图像品质设置。留神这个参数并不影响分辨率。它扭转的更多的是图片的细节,具体的介绍能够查阅 Midjourney Prompt 高级参数 这一章。
基本上放弃默认的就能够了,即图中的 Base quality:
4.2 格调设置
第四行格调设置,格调设置简略了解,这个值越低会更合乎 prompt 的形容,数值越高艺术性就会越强,但跟 prompt 关联性就会比拟弱。具体的介绍能够查阅 Midjourney Prompt 罕用参数 这一章。
4.3 隐衷设置
这个设置默认是 Public(公开),只有付费的 Pro 用户能够将其设置为 Stealth Mode(隐衷),Basic 和 Standard 都没法设置为 Stealth,对 Midjourney 付费感兴趣的能够看看 订阅 Midjourney 会员 这一章。
4.4 Remix 设置
Remix Mode 目前是一个试验性能,可能会随时更改或删除。
我本人应用下来,有点像 blend(混合)图片模式,应用办法是这样的。首先在 Remix 模式下,点击 Variation 按钮,会弹出一个 Prompt 输入框,输出完后,模型会在不扭转第一张图的构造的状况下,减少 Prompt 里提到的内容,比方上面这个例子,第一张图原来是一堆南瓜,点击 Variation 按钮输出 pile of cartoon owls,就会生成了一张保留原来南瓜图构图,但主体换成了卡通猫头鹰的图。
4.5 生成速度设置
这个默认是 Fast Mode,这个只有付费的 Standard 和 Pro 用户能够设置,其余用户都是 Fast Mode。Standard 和 Pro 用户能够在 Relax Mode 模式下,生成有限图片。对 Midjourney 付费感兴趣的能够看看 订阅 Midjourney 会员 这一章。
5. 对于 Midjourney 会员状况
你能够在 Midjourney 的服务器,或者 Midjourney Bot 聊天窗口,输出 /subscribe,而后按下回车:
而后 Bot 就会发送这样的音讯,点击 Open subscription 按钮就能进入到付费页面了:
付费的过程还比较简单,我这里就不做介绍了,只是须要留神,Midjourney 的付费性能用的服务提供商是 Stripe,目前应该只反对信用卡领取,所以如果要买会员须要有一张信用卡。
5.1 各套餐之间的差别有哪些?
:
Basic Plan | Standard Plan | Pro Plan | |
---|---|---|---|
月付价格 | $10 / month | $30 / month | $60 / month |
年付价格 | $8 / month | $24 / month | $48 / month |
Fast Generations | 3 hours 左右(大概能生成 200 张图) | 15 hours | 30 hours |
Concurrent Fast Jobs | 3 | 3 | 12 |
Relaxed Generations | ❌ | ✅ | ✅ |
Stealth Mode | ❌ | ❌ | ✅ |
首先,Midjourney 的计费跟 OpenAI 不太一样,OpenAI 计费用的是 Token,Midjourney 用的计费形式是工夫,因为其次要的老本在 GPU 计算,Midjourney 采纳这种形式,预计也是因为他们的 GPU 也是租的,租用 GPU 的费用也是按工夫计算,所以转嫁到消费者上也依照工夫算了,Basic 版本看后盾,Fast Generation 的工夫是 3h 20 min,而后官网阐明是应该能生成 200 多张图。
不过每张图所耗的 GPU 工夫并不固定,还取决于你的图片品质等,影响费用的因素有以下几种,各个参数对应的影响,能够查阅教程里对于参数的内容。我这不开展解释,简而言之,图片品质越好,个性化因素越多,价格就越贵。
低于平均价格 | 平均价格 | 高于平均价格 | |
---|---|---|---|
不同工作 | Variations(就是生成图片后,图片下的 V 按钮) | /imagine 生成图片 | Upscale(就是生成图片后,图片下的 U 按钮) |
Aspect Ratio 长宽比 | 默认 | tall or wide(换句话说,改这个参数就要花更多的钱) | |
Model Version 模型版本 | 默认(—V 4) | —test or —testp 这两个模型会更贵一些,我个别很少用 | |
Quality Parameter 图像品质参数 | –q 0.25 or —q 0.5 | 默认(—q 1) | —q 2 |
Stop Parameter 进行参数 | –stop 10 到 —stop 99 | 默认(—stop 100) |
而后 Standard Plan 开始还有一种叫 Relaxed Gerneration 的模式,这种模式下,该套餐付费用户,能够有限出图,但图片生成的速度会变慢,依照官网解释是 0-10 分钟。
其实实质上它是一种 GPU 闲暇资源排队计划,切换到 Relax 模式下,所有生成图片申请会进入到一个排队期待状态,当没有 Fast 模式下的用户应用 GPU 时,就会将 GPU 资源给 Relax 模式的用户,所以才须要期待那么长的工夫,实质上是闲置资源的利用。
另外须要留神:
- 你用得越多 Relax 模式,你期待的工夫就越长,这个有点像是手机运营商的有限套餐逻辑,流量达到某个阈值就会降速,所以如果你是和别人合购账号,就须要留神了,Fast 工夫基本上就是先到先得,Relax 模式越用会越慢。
- 即便你上个月底曾经切换为 Relax 模式,每个月的月初,零碎也会主动将模式切换为 Fast 模式。
最初还有一个 Stealth 模式,Midjourney 是一个默认凋谢的社区,所以你在 Midjourney 上生成的图片(包含你私聊 Bot 生成的图片),都是公开的,你能够在会员 Gallery 那看到所有人生成的图片。
只有 Pro 版本能够不公开本人的图片到 Gallery,另外还有一点须要留神,如果你关上了 Stealth 模式,而后在 Midjourney 的 Discord 公开频道生成图片,Stealth 模式不失效,生成的图片仍然会被 Discord 公开频道里的人看见。
参考链接:https://github.com/thinkingjimmy/Learning-Prompt