场景1:Stock Photo

我希望通过一个或几个万能模板教会大家写 Midjourney 的文本提示词,但实际试了很多遍后,我发现:

  1. 图片信息量非常大,万能模板的确让你生成一张及格的图片,但很难让你生成一个完全满意的图片。
  2. 要想生成一张高分图片,需要的不仅仅是 prompt engineering,甚至还需要一些美学知识,不同场景参数的使用都是不一样的,所以有些时候,用模板反而有点死板。

所以,这里没有所谓的万能模板,而是通过一个个实际场景教大家如何写好提示词 ,因为不同场景,你告知给模型的信息是不一样的。

而且我认为,授人以鱼不如授人以渔。当你知道为什么后,遇到新的场景,你也能很好地解构出提示词里需要什么,而不是盲目套模板。

最后,图片场景有非常多,本初级教程指南尽量分享一些大家日常工作中能用上的。希望能让 AI 提高你的工作效率,而不是用完即弃的玩具。

什么是 Stock Photo?

Stock Photo 直译为图库图片。一般你能在一些图库网站上找到,这些图片通常来自一些摄影师或设计师。部分图片因为版权的原因,如果你需要使用则需要付费。

大部分使用 Stock Photo 的用户都是一些设计公司,或者广告公司。你应该常常能看到这类图片,比如最经典的两人握手照片:

stock photo示例图片

技巧一:临摹

在画廊里看别人生成的图,或者找真图来临摹。英文不好也没关系,可以先写中文,然后用ChatGPT等一些翻译工具翻译。当你临摹了几张后,你就会慢慢搞懂如何做出类似的图了。

拿上面的那个握手图为例,我们仔细观察上面那张图,图中元素有什么:

  1. 第一主体是两个手,然后握在了一起,并且看起来是两个亚裔男人。
  2. 第二两人都穿着西装。
  3. 第三背景看上去像是在办公楼的大门,两人可能是在握手告别。并且背景刻意进行虚化了,或者是使用照相机拍摄的。
stock photo重点标记图片

再归纳总结下,大概的信息:

  • 主体:两个穿着西装的亚裔男人在握手告别
  • 场景:办公楼大门
  • 图像风格:stock photo,照相机拍摄

这时候,我们就能尝试写一下提示词了(如果你觉得自己英文水平还不太行,也可以尝试用翻译软件翻译)。

提示词

Midjourney 生成的结果如下所示,好像跟我们的预期不一样。不要慌,刚开始用 Midjourney 一定会遇到这种问题,重要的是多尝试:

Midjourney生成的图片

我们再来分析下 Midjourney 为何生成了这样的图片?复盘下:

  1. 首先图片的主体,或者说焦点,我们只需要「握手」,而不是两个人。
  2. 照相模式好像并不能实现背景虚化?更像是一种图像风格,图四就像是一种老照片的风格。

那我们调整下提示词,增加焦点和背景虚化关键词:

优化后的提示词

再来看看生成的结果,结果好很多,图 1 和 图4 基本满足需求了,图 2 和图 3 裁剪一下,也能满足我们的需求。

Midjourney生成的图片

那我们来总结一下 prompt ,该 prompt 分成以下几个部分:

提示词
stock photo of two Asian men in suits shaking hands,say goodbye in front of the main entrance of the office building, focus on two hands, taken with Canon, background bokeh
  • 第一部分(红色):描述你想要的内容主体。
  • 第二部分(蓝色):描述主体背景/环境。
  • 第三部分(黄色):照片的焦点位置。
  • 第四部分(绿色):照片的风格或者说是特殊要求。

总结下之后,你是不是就总结出了一个模板了?

技巧二:多实验

图片生成遇到不符合预期的情况,不要慌,分析问题,然后使用控制变量法,一个个调整图片,不要急,上面写的提示词还有一个地方,不知道各位有没有注意,就是开头的 stock photo,试试将这两个词删掉会怎样?

提示词

生成结果也依然满足需求,而且手指的数量也准确了,说明这个 Stock Image 对模型的影响不是很大。

Midjourney生成的图片

技巧三:善用 以图生图 功能

各位一般用 Stock Photo 库会遇到以下几个问题:

  1. 图有版权,没法商用,或者说需要付费。
  2. 有些图,被很多人用过,其他人一眼就看出来这是 Stock Photo。
  3. 图里的内容大体符合要求,但细节不符合要求,比如上图两个亚洲男性握手,可能换成一男一女,且其中一人是黑人会好一些。

要解决这三个问题,最好的方式就是让 AI 改一改原来的图片。让 AI 改图,只需要用到 以图生图(垫图) 功能即可。

操作步骤如下:

  1. 将你看到的不错的 stock photo 上传到提示词生成器的以图生图处
  2. 接着在文本处输入你想要的内容,比如将其中一个人的手换成黑人,一个人换成女性:
提示词

生成的结果是这样的,在提示词里没有提任何西装,以及场景背景信息,就说我要一个非裔的手,一个亚裔女性的手:

Midjourney生成的图片

各位要有耐心,多测试一下,一定会得到你的期望图片。