关于人工智能:Midjourney文心一格prompt教程Text-Prompt上篇品牌logApp徽章插画头像场景生成

8次阅读

共计 16589 个字符,预计需要花费 42 分钟才能阅读完成。

Midjourney| 文心一格 prompt 教程 [Text Prompt(上篇)]:品牌 log、App、徽章、插画、头像场景生成,各种格调抉择:科技风、静止风

1. 撰写 Text Prompt 注意事项

Midjourney 跟 ChatGPT 在 prompt 的应用上有很多不一样的中央,本章会具体介绍下 Midjourney 的 text prompt 区别。

  • 语法

首先 Midjourney 基本上是不懂语法的,所以即便你语法错了,只有词对了,也能生成图片。。

另外,不懂语法也导致了另一个问题:prompt 不是越长越好。特地是各种定语从句,它基本就不懂,还不如把指令用逗号隔开,一个个输出。以下是官网举荐的语法倡议:

  • 应用形容词 + 名词的词序来替换介词短语。

    • hair flowing in the wind 应该改为 flowing hair
    • a carrot for a nose 应该改为 carrot nose
  • 应用十分具体的动词来替换介词短语。

    • a girl with a flashlight 应该改为 a girl using a flashlight
    • a girl with a big smile on her face 应该改为 smiling girl

最初,Midjourney 是不会辨别大小写的。

  • 单词

在单词的局部,Midjourney 跟 ChatGPT 有点相似,它对同义词的了解也不是很好。比方举两个例子:

  1. big(大)这个词,到底指多大?越具象的大,对于 Midjourney 来说,成果越好,比方用 gigantic 就比用通用的 big 好。
  2. cats(猫)这个词是个复数,但到底是多少只?对于 Midjourney 来说,two cats(两只猫)比 cats 更明确。

另外,Midjourney 还能用 emoji 代替单词(我感觉实质上 emoji 也是单词),算是一个比拟有意思的个性。

  • 与其说不要什么,不如说要什么

这个跟 ChatGPT 相似,你应该将你想要的货色说分明,而不是通知 Midjourney 不要什么,如果你想让 Midjourney 不生成某样货色,就须要用到 参数 — no。

  • 你不说,模型就会随机给你

因为图像信息的信息量远超过文字,所以很多时候,Midjourney 会随机填充一些内容给你,它既是缺点,也是亮点性能。因为当你不在 prompt 里阐明这些词时,你就能取得发散的后果。

如果你想缩小这些随机性,就须要用到一些 prompt 框架(或者所谓的模板),本教程会由浅入深地将这个框架教给你。

  • 参数

Midjourney 还有一点跟 ChatGPT 有较大差别,它容许你在 prompt 里退出参数,而且这些参数相对来说一致性都比拟好,所以如果你想实现的性能,参数里反对,那优先应用参数,而不是在主体里形容。你会在后续的教程中学到如何善用参数。

另外,须要留神,本教程生成的图片默认为 V5 版本,所以我没有在 prompt 里就加 v5 参数。

2. 场景 1:图库图片 Stock Photo

Text Prompt 的局部难点

  1. 图片信息量十分大,万能模板确实让你生成一张及格的图片,但很难让你生成一个齐全称心的图片。
  2. 要想生成一张高分图片,须要的不仅仅是 prompt engineering,甚至还须要一些美学常识,不同场景参数的应用都是不一样的,所以有些时候,用模板反而有点死板。

所以,我不想间接教大家所谓的万能模板,而是通过一个个理论场景教大家如何写好 text prompt,因为不同场景,你告知给模型的信息是不一样的。

而且我认为,晓得为什么,远比晓得怎么做更重要。当你晓得为什么后,遇到新的场景,你也能很好地解构出 prompt 里须要什么,而不是自觉套模板。

最初,图片场景有十分多,我会尽量分享一些大家日常工作中能用上的。心愿能让 AI 进步你的工作效率,而不是用完即弃的玩具。

Text Prompt 开篇介绍一下 Midjourney V5 晋升较大的 Stock Photo 场景。

Stock Photo 直译为图库图片。个别你能在一些图库网站上找到,这些图片通常来自一些摄影师或设计师。局部图片因为版权的起因,如果你须要应用则须要付费。

大部分应用 Stock Photo 的用户都是一些设计公司,或者广告公司。你应该经常能看到这类图片,比方最经典的两人握手照片:

我认为 AI 生成图片对图片库冲击十分大,V5 版本基本上满足了我的 Stock Photo 需要。

技巧一:临摹

我认为学习图片类的 prompt,跟学习画画是相似的,最好的学习办法不是间接用模板。

而是拿真图,或者他人生成的图来临摹。英文不好,也能够先写中文,而后让 ChatGPT 翻译。当你临摹了几张后,你就会缓缓搞懂如何做出相似的图了。

拿下面的那个握手图为例,咱们仔细观察下面那张图,图中元素有什么:

  1. 第一主体是两个手,而后握在了一起,并且看起来是两个亚裔男人。
  2. 第二两人都衣着西装。
  3. 第三背景看上去像是在办公楼的大门,两人可能是在握手辞别。并且背景刻意进行虚化了,或者是应用照相机拍摄的。

再演绎总结下,大略的信息:

  • 主体:两个衣着西装的亚裔男人在握手辞别
  • 场景:办公楼大门
  • 图像格调:stock photo,照相机拍摄,

这时候,咱们就能尝试写一下 prompt 了(如果你感觉本人英文程度还不太行,也能够尝试用翻译软件翻译)。

stock photo of two Asian men in suits shaking hands,say goodbye in front of the main entrance of the office building,taken with Canon

Midjourney 生成的后果如下所示。

Emm 🤔 如同跟咱们的预期不一样。不要慌,刚开始用 Midjourney 肯定会遇到这种问题,重要的是多尝试。

<img

src={"https://res.craft.do/user/full/d845172f-becd-4255-bf79-d722098b2d83/doc/15EA26B6-9B49-4076-B8D8-DFE53ABD52C8/E398A4A0-ECBB-4592-8CAA-AE68AED3FCCC_2/srcSfwZqzcgOymCyOlvnAMVi1okc5zsoKI3eSfA6kh8z/MJ021.png"} 
style={{width: 500}} 

/>

咱们再来剖析下 Midjourney 为何生成了这样的图片?复盘下:

  1. 首先图片的主体,或者说焦点,咱们只须要「握手」,而不是两个人。
  2. 照相模式如同并不能实现背景虚化?更像是一种图像格调,图四就像是一种老照片的格调。

那咱们调整下 prompt,减少焦点和背景虚化关键词:

stock photo of two Asian men in suits shaking hands,say goodbye in front of the main entrance of the office building, focus on two hands, taken with Canon, background bokeh

再来看看生成的后果,后果好很多,图 1 和 图 4 根本满足需要了,图 2 和图 3 裁剪一下,也能满足咱们的需要。不过须要留神,Midjourney 在人手的生成上,临时还有点问题,你细看图 2 和图 4,其中有一个人的手有 6 个手指 😂,但我认为将来应该会修复:

<img

src={"https://res.craft.do/user/full/d845172f-becd-4255-bf79-d722098b2d83/doc/15EA26B6-9B49-4076-B8D8-DFE53ABD52C8/4931E039-2B61-49DB-98C1-B524E780BBC3_2/W6jeVicuOIl0RU7EqpXP71NeJ8BWY3FHgXoxFobCQmMz/MJ161.png"} 
style={{width: 500}} 

/>

那咱们来总结一下 prompt,该 prompt 分成以下几个局部:

  • 第一局部(红色线):形容你想要的内容主体。
  • 第二局部(蓝色线):形容主体背景 / 环境。
  • 第三局部(黄色线):照片的焦点地位。
  • 第四局部(绿色线):照片的格调或者说是特殊要求。

总结下之后,你是不是就总结出了一个模板了?😁

技巧二:多试验

上述的案例,我还想教给各位第二个技巧:多试验。

图片生成遇到不合乎预期的状况,不要慌,剖析问题,而后应用控制变量法,一个个调整图片,不要急,下面我写的 prompt 还有一个中央,不晓得各位有没有留神,就是结尾的 stock photo,试试将这两个词删掉会怎么?

two Asian men in suits shaking hands,say goodbye in front of the main entrance of the office building, focus on two hands, taken with Canon, background bokeh

生成后果也仍然满足需要,而且手指的数量也精确了,阐明这个 Stock Image 对模型的影响不是很大。

<img

src={"https://res.craft.do/user/full/d845172f-becd-4255-bf79-d722098b2d83/doc/15EA26B6-9B49-4076-B8D8-DFE53ABD52C8/BBB1BC5B-BDE3-4034-B297-46D10CEC44D6_2/iH9AHSuCO6bCVxInVZvgbnybwNXUTbwkjT9Bjumf36Mz/MJ023.png"} 
style={{width: 500}} 

/>

技巧三:善用 Image2Image 性能

在 Stock Photo 场景里,还有一个十分厉害的技巧,这个办法我一开始感觉不太适宜教,因为这个对 Stock Photo 库影响太大了 😂

但本着工具中立的准则,并且这个技巧,其实在很多场景都能用(比方生成头像等),所以还是感觉有必要教给大家。

各位个别用 Stock Photo 库会遇到以下几个问题:

  1. 图有版权,没法商用,或者说须要付费。
  2. 有些图,被很多人用过,其他人一眼就看进去这是 Stock Photo。
  3. 图里的内容大体符合要求,但细节不符合要求,比方上图两个亚洲男性握手,可能换成一男一女,且其中一人是黑人会好一些。

要解决这三个问题,最好的形式就是让 AI 改一改原来的图片。让 AI 改图,只须要用到 Image2Image(或者叫 Blend)性能即可。操作步骤如下:

:::info

起初在某书刷到相似的教程,我才晓得这个办法大家个别叫垫图。老外如同个别都叫 Image2Image,或者 img2img。

:::

  1. 将你看到的不错的 stock photo 发给 Midjourney Bot(我还是以后面的那张握手照为例)
  2. 右键复制该图片的链接,而后黏贴到输入框
  3. 在链接后加个空格
  4. 接着输出你想要的内容,比方将其中一个人的手换成黑人,一个人换成女性:
one Afican-American hand and one Asian woman hand

生成的后果是这样的,我在 prompt 里没有提任何西装,以及场景背景信息,就说我要一个非裔的手,一个亚裔女性的手:

抛开 6 根手指的问题,这个技巧是不是很高效?不过须要留神,blend 性能(这个后续教程会讲到)我发现更适宜两张图交融,图片 + 文字不是很稳固,各位要有急躁,多测试一下。

3. 场景 2:品牌 Logo

前一章各位搞懂了根底 prompt 后,从本章开始就会教大家更多垂直场景的 prompt。对于垂直场景,我看到大量的教程和分享都是分享各种提醒词,比方 Logo 相干的提醒词有:

  • modern
  • minimalist
  • vintage
  • cartoon
  • geometric

坦率地说,在我学习如何应用 Midjourney 的过程中,我一开始也认为只有看了他人的 prompt 用了他人的提醒词,就能生成好的图片。

但对于老手来说,我不倡议各位间接上来就记模版,记这些词。

因为写好一段 prompt,你缺的不是提醒词, 而是对设计的了解,甚至是想象力。

比方本章节的 Logo 设计,如果你基本不晓得 Logo 蕴含哪些元素,适宜什么格调,你懂再多的提醒词也没法生成称心的 Logo。正如我 Midjourney 教程后面提到的那样,Midjourney 跟 ChatGPT 不一样,ChatGPT 是申明式的,你甚至能够让它表演某个角色,但 Midjourney 是指令式的,你只能用指令让它画出你设想中的图片。当你能很稳固地出图后,再钻研这些词不迟。

对于普通人来说,真正妨碍咱们的可能不是学会这些词语,而是咱们的审美。

2.1 常见的品牌 Logo

常见的品牌 Logo 个别分成以下 4 种模式:

  • Graphic Logo:个别以图形为主,像 Apple、Twitter 以及 Midjourney 就是这种 logo。
  • Lettermark Logo:个别用公司名字的首字母作为 logo 主体,像 Facebook、Tesla 还有 IBM(IBM 全称是 International Business Machines)都是用公司名的首字母作为 logo。
  • Geometric Logo:几何图形组成的 logo,比方 Nike、百事可乐、万事达卡就是这个类型。
  • Mascot Logo:以公司吉祥物为 logo 的相对来说比拟少见,像米其林的 logo 就是吉祥物轮胎人,我最喜爱的烤鸡餐厅 Nando’s 就是一只🐔

其实常见的品牌 Logo 里其实还有一种,是文字组合式的,文字加上面任意一种,比方 Tesla 的 残缺 Logo 就是 Tesla 加一个 T。但因为 Midjourney 在文字的生成上,有十分多的问题,所以不在本章进行介绍。

Graphic Logo

当你想用 AI 生成 Logo 的时候,我倡议你选一个你认可的方向,而后再让 AI 生成。

首先咱们来剖析一下 Graphic Logo 的个性:

  1. Logo 类型:graphic logo
  2. Logo 图形形容:比方猫
  3. 格调:

    1. 多为扁平化设计:flat
    2. 多为矢量图形:vector graphic
    3. 简洁:simple

依据个性撰写的 prompt,外围的要害就是将格调形容分明:

flat vector graphic logo of cat, simple minimal

Graphic Logo 还有一种常见的设计,比方后面的例子里 Midjourney 的 Logo 就是这种,只须要在 graphic 后加一个 line 即可:

flat vector graphic line logo of cat, simple minimal

下方右边 4 个是没有加 line 的版本:

Lettermark Logo

这个依据我的试验,也试用了很多人写的 prompt,我集体的感触是,这种类型的 Logo 看起来简略,就一个字母进行变形,但让 AI 生成反而成果很个别,而且有一个算是比拟有意思的发现,用 A 字母做进去的 Logo 品质比其余字母做进去的 Logo 品质要好很多(非严格依照数据统计,仅集体感触)。这个类型的 Logo 有以下特点:

  1. Logo 类型:lettermark
  2. Logo 图形形容:

    1. 纯字母
    2. 字体款式:能够按需加上喜爱的字体
  3. 格调:

    1. 矢量
    2. 简洁:simple minimal

依据个性撰写 prompt(最初生成的是 A 和 C 的 logo,我个人感觉 A 的好很多),另外须要留神,这个例子其实是想阐明,在 Midjourney 里,语法并不重要,lettermark 不一样要依照语法要求,写成 lettermark logo of letter A:

letter A logo, lettermark, typography, vector simple minimal

Geometric Logo

这个类型的 Logo 相对来说,尽管只有图形,但有很多玩法,介绍两个罕用玩法:

  • 循环反复

如果你用的是 iPhone,能够看看 iPhone 里的照片利用的 Logo,它也是一个 Geometric Logo,而且它是椭圆图形旋转反复,最初组合成了一朵花的形态。拆解一下,关键词是:

  1. Logo 类型:geometric logo
  2. Logo 图形形容:

    1. 旋转反复:radial repeating
  3. 格调:

    1. 简洁:simple minimal

让咱们来写一个相似的 prompt:

Flat geometric vector geometric logo of flower, petals radial repeating, simple minimal
  • 突变

另一个常见玩法就是渐变色,如果你用的是电脑的浏览器是 Edge,能够去看看它的 Logo,它的 Logo 就是一个渐变色,而后是个浪的外观。拆解一下,关键词是:

  1. Logo 类型:geometric logo
  2. Logo 图像形容

    1. 浪的形态:curved wave shape
    2. 蓝绿突变:blue green gradient
  3. 格调:

    1. 简洁:simple minimal

让咱们来写一个相似的 prompt:

Flat geometric vector graphic logo of curved wave shape, blue green gradient ,simple minimal

最初生成的后果是这样的,我很喜爱花的第三个,浪的第二个:

Mascot Logo

这种吉祥物类型的 Logo,我认为是 Midjourney 最善于的 Logo 格调。但也十分考验咱们的想象力,当然咱们也能够仅提供一些比较简单的词语,让 AI 帮咱们生成,让咱们一起来为一个机器人公司写一个 Mascot Logo,拆解一下 prompt 关键词:

  1. Logo 类型:mascot logo
  2. Logo 主体形容:比方机器人 robot
  3. 格调:

    1. 简洁:simple

最初 prompt:

a mascot vector logo of a robot, simple,

还有给一家泡面公司生成一个吉祥物又会怎么:

simple mascot logo for a Instant Noodles company

以下是生成的后果,我很喜爱泡面公司的 logo:

技巧四:减少格调——艺术静止

因为篇幅的起因,本教程不会介绍特地多的格调,我会在我的小红书账号上更新。感兴趣的敌人能够去关注下。

后面生成的 logo,有一些预计各位会感觉平平无奇,比方 Lettermark Logo,起因并不是 Midjourney 能力不强,而是咱们给的指令太少了,只有在 prompt 里加几个单词,就能生成不一样的 Logo:
右边四个的 prompt 是这样的,我仅仅在原来的 prompt 上加了两个单词 Pop Art:

letter A logo, lettermark, typography, vector simple, Pop Art

Pop Art 是什么?

波普艺术(Pop Art,又译为普普艺术或艰深艺术),是一种起源于 20 世纪 50 年代和 60 年代的艺术静止,它强调对大众文化、公众媒体和消费主义文化的反思和表白。Pop 来自“风行艺术”(popular art)一词里的 popular,由 1956 年英国艺术评论家罗伦斯·艾伟(Lawrence Allowey)所提出。

Pop Art 的特点是:

  • 它的内容主体个别是公众日常生活中常见的物品和图像,如广告标语、杂志封面、食品包装等。
  • 个别用色比拟大胆,同时线条比拟简洁,强调物品自身的视觉效果和意义。

左边边四个的 prompt 是这样的,我在 prompt 里加上了 De Stijl。

letter A logo, lettermark, typography, vector simple,De Stijl

De Stijl 是什么?

它是一个荷兰艺术静止,始于 1917 年,致力于简化视觉元素,包含直线,立体和根本色调。

它的成员包含画家 Piet Mondrian 和 Theo van Doesburg 等人。De Stijl 的成员致力于将艺术与设计交融,以发明出具备实用性和功能性的美学。

De Stijl 的特点有:

  • 经常用几何图形进行设计,如矩形和直线。
  • 用色根本只用根本色调,比方黑、白、灰、红、黄、蓝。
  • 谋求均衡和谐和,强调模式和构造,不重视细节和表现力。

4. 场景 3:App & 徽章 Logo

Logo 篇比拟长,所以拆成两章介绍。

App Logo

其实 App Logo 能够应用前一章提到的品牌 Logo,加上一个矩形边框就 OK 了,用 Figma 几步就能实现 😂,但如果你切实不想用 Figma,也能够用 Midjourney 生成。

不放看看你手机上的 App,想想 App Logo Prompt 应该怎么写?

我用前一章的案例,写了两个 prompt,输入的后果如下:

要害是:

  1. Logo 类型:mobile app logo
  2. Logo 图形形容:

    1. iOS 的都是圆角矩形:squared with round edges
    2. Logo 图形形容,比方 an icon for a Instant Noodles company
  3. 格调:

    1. 连续应用上一章提到的办法即可,我这加了个 pop art
squared with round edges mobile app logo, an icon for a Instant Noodles company, pop art

另外我发现在 Logo 图形形容前加 an icon for,生成的 Logo 会更合乎预期一些,左边是加了 an icon for,右边是没有加的:

另外,Logo 图案是 Graphic、Lettermark 还有 Geometric 的,会更合乎预期:

技巧五:减少格调——艺术家

前一章介绍了减少艺术静止,从而使得生成的图片更加特地,本章再教大家一个办法,是减少艺术家的名字。
首先须要留神,Midjourney 反对大部分的艺术静止,但在艺术家的反对上,相对来说比拟少,通过网友们的不懈努力,截止到 3 月 31 日,V4 已知反对的艺术家有 2000 多位,V5 有 100 多位。
其中在榜的 Logo 设计师,只有 Paul Rand 和 Saul Bass,Paul 是 IBM、英孚、NeXT logo 的设计师,Saul 是美国联结航空、AT&T logo 的设计师。
应用办法很简略,在 prompt 最初加上 by Paul Rand 即可:

letter A logo, lettermark, typography, vector simple, by Paul Rand

当然也不是说只能加 Logo 设计师,加上没有设计过 Logo 的设计师名字,也很有意思。比方左边四张图我加的就是 Piet Cornelies Mondrian,第三张 logo 有 Composition II in Red, Blue, and Yellow 那味了。右边四张则是 Paul 的,第二张红色框加彩色 A,有他的经典眼镜 logo 那味,十分喜爱:

最初须要留神,减少艺术家名,有可能呈现以下状况:

  1. 多长图的格调都很像:这是因为某些艺术家有十分强烈的标志性格调,比方我很喜爱的 Piet Mondrian,你用他的名字,会发现可能生成的很多张图都是 Composition II in Red, Blue, and Yellow 的格调。
  2. 生成的图看上去不太像该艺术家的格调:我本人测试,发现有两种可能,一种是模型并没有学习这个艺术家的作品(特地新的艺术家我感觉个别都不会收录),另一种可能是你的 prompt 里的一些词,跟该艺术家的格调有抵触,比方用了达芬奇 Leonardo da Vinci,但主体是个日本二次元小姑娘。

PS:在本教程里的 Artist List 能够看到我比拟喜爱的艺术家。

徽章 Logo

学校的校徽就是典型的徽章 Logo,应用办法也非常简单,只须要调整 Logo 类型为 emblem 就能够,另外,跟徽章很搭的格调是 Vintage,两个都加上后 prompt 是这样的:

emblem for a Instant Noodles company, vintage, simple minimal

左边四个是加了 vintage 的,是不是很复旧,我十分喜爱:

技巧六:善用 no 参数,去掉不想要的元素

在徽章 Logo 的案例里,你应该还看过单色的徽章,比方校徽。但 Midjourney 有个习惯就是偏向于生成简单的内容,生成单色内容,你能够在 prompt 里退出色彩,背景等等词,让其变得简洁。

还有一个技巧是用 no 参数。比方我想制作一个单色校徽,校徽主体是一本书,同时因为 Midjourney 对文字不是很善于,我还要去掉 text。以下是我的 prompt,我在最初加了 no realistic color(没有色彩)text(字)。

emblem for a university with large book, vintage --no realistic color text

而后我把下面那个 Instant Noodles company 的 prompt 也加了 no text,最初生成的两组图片是这样的(最初须要留神,no 参数在 logo 里应用时,no text 有的时候会生效,但如果你去掉 — 间接输出 no text 就会失效,很神秘,预计是个 bug):

5. 场景 4:插画

通过后面的学习,你应该或多或少都临摹了几个图片。如果没有,我倡议你多练练,纸上得来终觉浅。

略微总结下咱们所学:

  • 撰写 prompt 外围是「形容分明你想要的画面」,「越具体」生成的图片就约合乎你的要求。
  • 要想进步 prompt 撰写能力,最好的办法是临摹他人的作品,而后本人尝试写一写,最初再看看他人的 prompt。
  • 要想形容分明画面,能够从以下几个角度进行解构:
Stock Image Logo
类型是什么? stock photo of graphic logo of
主体是什么? two Asian men in suits shaking hands cat
背景是什么? in front of the main entrance of the office building null(该场景不须要填写)
构图是怎么的? focus on two hands null(该场景不须要填写)
是什么格调? background bokeh vector simple minimal
  • 在格调这块,有两个小技巧,能够应用艺术静止,以及艺术家名字。

水彩

从本章开始,咱们会进行一些更简单的设计。水彩插画相对来说,应该会是小朋友比拟喜爱的格调。

咱们依照之前所学的模板来一步步写一下:

Prompt 解释
类型是什么? light watercolor 水彩
主体是什么? a sleeping cat 睡觉的猫
背景是什么? white background 因为个别水彩都是在白纸上画,所以这里加了红色背景
构图是怎么的? null 不太重要,就让 AI 自由发挥
是什么格调? Studio Ghibli 我很喜爱吉卜力格调所以加了个格调进去

而后再写一个带场景的:

Prompt 解释
类型是什么? light watercolor 水彩
主体是什么? children playing on the beach 在沙滩上游玩的孩子
背景是什么? white background 因为个别水彩都是在白纸上画,所以这里加了红色背景
构图是怎么的? null 不太重要,就让 AI 自由发挥
是什么格调? Jon Klassen 他 是我很喜爱的插画师,我很喜爱他的《This Is Not My Hat》

以下是生成的图片:

百科插画

除了水彩外,我很喜爱的另一种插画是百科全书手绘插画。咱们一起画一副玫瑰:

Prompt 解释
类型是什么? botanical illustration 植物学插画
主体是什么? types of rose 我想画一组玫瑰科普插画
背景是什么? white background 个别画在白纸上,所以红色背景也 OK
构图是怎么的? null 不太重要,就让 AI 自由发挥
是什么格调? Pierre-Joseph Redoute 他是驰名植物学家兼画家

再画一组恐龙:

Prompt 解释
类型是什么? dinosaur scientific illustration 恐龙迷信插画
主体是什么? Tyrannosaurus 霸王龙
背景是什么? white background 个别画在白纸上,所以红色背景也 OK
构图是怎么的? null 不太重要,就让 AI 自由发挥
是什么格调? Andrey Atuchin 他是驰名俄罗斯古艺术家、生物学家、插画师

以下是生成的图片,看起来,Midjourney 并不知道霸王龙只有两只脚,哈哈哈,不过第一张真的十分像 Andrey 的格调:

绘本插画

我集体感觉绘本插画只有用好技巧五:减少格调——艺术家,基本上就能做出一些不差的插画。我绘本看得不算多,但应该不少人晓得彼得兔,咱们试试画一副和彼得兔相似格调的小猫:

Prompt 解释
类型是什么? illustration 插画
主体是什么? A cat standing and running on two legs in a denim jacket 我想画一只站立跑动的猫
背景是什么? null 不太重要,就让 AI 自由发挥
构图是怎么的? null 不太重要,就让 AI 自由发挥
是什么格调? Beatrix Potter 她是彼得兔的作者

另外咱们也试试小熊维尼的插画师 E.H. Shepard 的格调(左边四张)。这里要额定阐明下,为了让生成的后果更偏向于该作者的格调,我没在 prompt 里退出太多背景信息:

Behance 风科技插画

坦白说来,这个并不是一种插画风,但作为互联网行业从业人士,我感觉这个还挺刚需的,但须要留神,通过我的测试,只有在最后面退出 tech illustration 也能生成相似的格调插画,但成果比拟个别,当我加上 behance style 后(Behance 简略了解是一个设计师分享作品的网站,分享的作品多与科技产品无关,如 App 设计等),就变得粗劣和丑陋了:

Prompt 解释
类型是什么? tech illustration 科技风插画
主体是什么? man jogging by the waterfront 一个在海边跑步的男人
背景是什么? null 不太重要,就让 AI 自由发挥
构图是怎么的? null 不太重要,就让 AI 自由发挥
是什么格调? style of behance 减少后,感觉格调确实有变成 behance 风

另外,我还做了一个大家比拟相熟的咖啡馆场景:

Prompt 解释
主体是什么? a lady drinking coffee at the computer in a cafe 一位在咖啡店坐在电脑前喝咖啡的女士

最初的后果:

最初,这外面还有一个神秘参数,就是加上一些公司(比方 by Microsoft),我目前测试过像 Slack、Dropbox、Microsoft、Apple 感觉是有一点点差别,但我不晓得 Midjourney 是怎么了解或解决这个词的,上面是两组案例,右边是微软的,左边是苹果的,除了苹果的第四个有个苹果 logo 外,我是看不太进去还有什么中央体现苹果的,集体感觉可能是在用色上会用该品牌的品牌色?

感兴趣的敌人能够去摸索下。🆘 征集案例

填色插画

最初一个要介绍的也不晓得是不是插画,但可能不少敌人见过,就是那种能够让你在下面用蜡笔,或水笔填色的填色插画。我感觉非常适合让小朋友本人生成填色插画,而后打印进去,让小朋友上色。以下是霸王龙的例子:

Prompt 解释
类型是什么? clean coloring book page 填色书籍
主体是什么? Tyrannosaurus 霸王龙
背景是什么? null 不太重要,就让 AI 自由发挥
构图是怎么的? null 不太重要,就让 AI 自由发挥
是什么格调? black and white 黑白格调

白雪公主的版本只有将主体改成「Snow White」即可,以下是生成的图片:

6. 场景 5:头像

在 Stock Photo 一章中,介绍了 img2img 的办法,这个办法除了解决 Stock Photo 的那几个问题外,还很适宜多个场景。

本章会着重介绍用这个办法生成的头像的 prompt。并且从本章开始会逐渐丰盛咱们的 prompt 构造,使其更加残缺。

在介绍 img2img 的利用前,我想强调一下:

  1. 不要在 Discord Midjourney 公开群上传本人的照片!这样你的照片会被公开群里的所有人看见。倡议应用 Midjourney Bot。
  2. 另外,非 pro 付费会员,生成的图片都会被其余会员看见。但你能够在生成完头像后,删掉生成的图片。如果还不晓得如何应用 Bot,及删除照片,请看基本操作篇。
  3. img2img 的操作我就不过多赘述了。如果你还不太分明,能够看基本操作篇,以及 Stock Photo 那篇。

3D 卡通头像

第一个要分享的是卡通头像。首先跟大家强调下:

  1. 我基本上把国内国外的生成头像教程都看过,并试过一遍,还跟 Midjourney 社群的人也交换过。我的了解是,以目前 V5 的能力,不论你如何调整 prompt,想用 img2img 办法生成一张十分像原图的图片,根本靠运气,即应用了后面介绍的技巧七办法,也只是进步概率。如果你有令头像十分像的办法,无妨通过 Issue 分享给我,我会署下你的名字,并分享给大家。
  2. 各位在学习的过程中,如果发现生成的图片不像原图,也不须要泄气。这是失常的。
  3. 你能够通过我分享的办法,生成一张有原图韵味的卡通头像。留神必定不会十分像原图。

在 prompt 里加上原图链接(倡议应用证件照,或者背景比拟繁多的照片,这样成功率会高一些),而后用我后面提到的框架设计一个 prompt:

Prompt 解释
类型是什么? Portraits / Avatar 如果你的原图是证件照,能够在 prompt 里退出「肖像」一词,或者「Avatar 头像」。
主体是什么? smiling cute boy, undercut hairstyle 这里能够是选填,你能够先不加这个形容,只填其余 prompt,而后如果生成的图片不像你。那你就在这里加点形容下你的头像的词,个别就是性别、样貌、发型、配饰(比方眼镜、耳环等)、表情等。留神,尽量挑特色比拟强的局部输出,特色对了,生成的图片根本会有几份像。
背景是什么? white background 我这里保留了证件照的白底,你能够加一些理论场景的背景,比方餐厅之类的。
构图是怎么的? null 因为咱们事后传了图片,图片是张证件照,所以不填
用什么镜头? soft focus 柔焦是指摄影中,应用柔焦镜头,使得拍摄的影像既清晰又柔和的成果。个别多在拍摄人像的时候应用,我在 prompt 里加上这个,能够使照片更柔和。你也能够不加。
是什么格调? 3d render,Pixar style 因为指标是生成 3d 照片,所以这里加了 3d render(3d 渲染),以及我喜爱的皮克斯格调
参数 —iw 2 iw 是一个文字和 img 权重参数。数值越大,就越像原图,对于这个值的介绍,能够看高级参数篇。

最初,还有三个技巧:

  1. 如果你生成的照片并不像预设的照片,能够在四张图里,挑一张比拟像的,而后点 V(Variation),让模型持续生成,再持续挑一张像一点的照片,而后持续生成新照片,直到呈现一张比拟像的。
  2. 第二个,我感觉很神奇,如果前两个办法你都试过了,你生成的图片还是跟原图不像,那就在 prompt 里加上「wear glasses(戴眼镜)」,真的很神奇,我只有加上戴眼镜就像十分多,如果你原图戴眼镜了,你试试在参数里加个 —no glasses,你会失去一张更不像你的图。
  3. 最初,就是多用一个参数,这个办法会在技巧八中开展说下。

本章最初,有我的证件照的案例。

技巧七:多参数同时应用

在应用 img2img 的办法生成头像时,我发现问题是「文字权重比图片权重高」,导致其生成的图片不像原图,iw 参数在 V5 里最多晋升图片权重到 2,所以我就在想有没有可能进一步升高文字的权重。

而后我就试了下 s 参数,发现确实好了很多。

如果生成的图片还是不像,你能够在 —iw 2 根底上,再加一个参数 —s 200,留神同时用两个参数时,两头不要有逗号。我发现加了 s 参数之后确实像了很多,我集体猜想是 s 和 iw 连用会提高一减弱 text 的权重。

s 是管制生成图片的风格化水平。简略了解,这个值越低会更合乎 text prompt 的形容,数值越高艺术性就会越强,但跟 text prompt 关联性就会比拟弱。所以如果你生成的图还是不像,就加大这个值,比方调到 500。

我想通过这个案例通知大家,多个参数一起应用,有可能会造成合力,进一步放大模型的能力。将来有新的参数能力,无妨也想想有没有可能一起用?

动漫风头像

与 3D 卡通头像一样,次要的批改是在图片格调上:

Prompt 解释
类型是什么? Portraits / Avatar 持续应用雷同形容
主体是什么? smiling cute boy, undercut hairstyle 持续应用雷同形容
背景是什么? white background 持续应用雷同形容
构图是怎么的? null 持续应用雷同形容
用什么镜头? null 因为是漫画风,就不加柔光镜头了
是什么格调? anime, Studio Ghibli 指标是制作动漫风的头像,所以这里加了 anime(动漫),而后加了吉卜力格调
参数 —iw 2 —s 500 留神同时用两个参数时,两头不要有逗号。

赛博朋克头像

这是我最喜爱的格调之一,也是只须要改一下格调和背景即可:

Prompt 解释
主体是什么? cyberpunk robot face, holographic VR glasses, holographic cyberpunk clothing 加了脸的润饰,还有戴上 VR 眼镜,穿上赛博朋克风衣服
背景是什么? neon-lit cityscape background 为了让图片更像是赛博朋克,就加了个霓虹灯城市背景,让其看起来更有赛博那味
是什么格调? Cyberpunk, by Josan Gonzalez 加了赛博朋克格调,以及我十分喜爱的赛博朋克画家 Josan Gonzalez

下面这几个头像 prompt 最初生成的头像是这样的,坦率地说,我曾经尽力了,我的集体特色太少了,人也不帅,生成的图片,都有种东南亚人那味,感觉 Midjourney 对亚洲人的了解还不是很行 😂

技巧八:应用 Seed 参数对图进行二次批改

留神:这个技巧,我集体感觉将来后劲比拟大,但目前 Midjourney 的实现成果还比拟个别,成果得不到保障。官网的社区的帮忙文档也提到这个性能在 V5 十分不稳固。具体能够看看我整顿的 Midjourney 官网 FAQ 一章。

你可能遇到相似这样的场景:

  1. 你输出一段 prompt,机器生成了 4 张图片
  2. 你看了下 4 张照片,发现其中有一张还行,但其余不是很称心,而后改了下 prompt,机器又生成了一些
  3. 但这次生成的照片你都不称心,你就很懊恼为何会这样
  4. 而后你就像为啥不能在第一次生成图上做批改呢?

基于某一次生成的后果进行二次 prompt 批改,实践上我认为是能够的,以赛博朋克头像为例,我先用上述 prompt 生成了四张图片,而后在音讯的右上角点击 emoji 按钮(下图 1),而后再输入框里(下图 2)输出 envelope,而后点击信封 emoji(下图 3),接着 bot 就会将 seed 号码发给你。

而后我批改下面的赛博朋克头像的 prompt,将其背景改为 China Town,此时须要留神:

  1. 新的 prompt 并不是只改 background,你须要将之前的 prompt 都带上。
  2. prompt 仅批改 background 的局部。
  3. 最初带上 seed 参数。

以下是我的案例:

原 prompt:

{img url}  avatar, cyberpunk robot face, holographic VR glasses,holographic cyberpunk clothing, neon-lit cityscape background, Cyberpunk, by Josan Gonzalez --s 500 --iw 1

新 prompt(seed 码只是示例,你要填写本人的 seed):

{img url}  avatar, cyberpunk robot face, holographic VR glasses,holographic cyberpunk clothing, China Town background, Cyberpunk, by Josan Gonzalez --s 500 --iw 1 --seed 758242567

以下是生成的成果(左图为原图,右图是用了 seed 后生成的图),能够看到,背景确实换了,但人的外观也有点变动

成果不是很好,但我感觉值得摸索,这样能进步渐进优化的成功率:

技巧九:神秘的 blend 性能

这个技巧,说实话,我感觉不能称其为技巧,但这又是一个 Midjourney 十分重要的 feature,所以在这里着重介绍一下。

这个性能应用起来非常简单,在 Discord 输入框里 /blend,而后点击这个菜单:

之后你的输入框就会变成这样:

而后你就能够点击这两个框,而后抉择你电脑上的照片,增加实现后,大喊一声「应用交融卡」(不是),而后点击回车:

而后 Midjourney 就会生成这样牛逼的后果,右边是交融钢铁侠,左边是交融巴斯光年:

这个性能我第一次看到时,我是十分震惊的,认为是小时候看游戏王里配角们应用「交融卡」的那种成果。惋惜并不是,这个性能十分不稳固,仅有在满足多个未知条件能力达到上述的成果。

我原本打算用这个办法用于生成头像,但我发现只有用本人的照片,交融其余格调的照片,成果都不太好,目前试验下来成果最好的是名人头像,我的感觉是因为 Midjourney 喂了不少名人的头像给模型,所以这种交融的成果都很好。

但我感觉它真的很适宜做头像,将本人的头像跟另一张图片交融一下,就能生成一张不错的图,不便又快捷。惋惜目前这个性能感觉还不太好用。

当然这个性能还不仅仅止于此,它还有很多应用场景,在后续会介绍给大家。

参考链接:

https://github.com/thinkingjimmy/Learning-Prompt

https://github.com/wangxuqi/Prompt-Engineering-Guide-Chinese

https://github.com/tonyyuhang/ChatGPT/tree/main

https://github.com/f/awesome-chatgpt-prompts

正文完
 0