公司新闻

使用 Midjourney 生成摄影作品:基础篇

本文章来自AI工匠

前面我们用 5 章的内容介绍了 Midjourney 的基础使用。从本章开始,我们将介绍 Midjourney 的一个大类生成场景:摄影照片。由于摄影本身主题比较大,为避免单篇内容过长,我们会划分为多个部分来介绍。本章作为基础篇,主要是介绍一些我们后续会使用的重要概念。

AI 绘图与摄影

生成震撼的绘画易,生成真实的照片难。

在 AIGC 图片生成领域,生成具有真实感的照片(photorealistic, photorealism)一向是非常具有挑战性的工作,也是学界研究的热点。

摄影与画作最大的区别就是:一般来说摄影比较注重真实感,对细节的要求很高,因此除了镜头成像时因为对焦景深产生的虚化,一般没有比较夸张的艺术修饰。梵高或者莫奈的抽象画要是错一点,非专业人士不可能看的出来;但是要换成照片,普通人也能快速的看出味道不对的地方。

目前 AI 在很多细节上还是比较容易出错的。熟悉 Stable Diffusion 的读者应该都知道,Stable Diffusion 中人像经常露出来的手、腿、脚(鞋)、眼睛、头、镜面反射、透镜折射等等,都是非常容易出问题的部分。其实这个问题在 AI 绘图产品中广泛存在(包括 Midjourney),并非 Stable Diffusion 特有。

IMG_257腿畸形,两个头,眼睛细节失真

Midjourney 的优化整体要好很多,基本不需要什么特别的技巧也能保证画出来的东西「基本正确」。不过 Midjourney 也经常需要借助 Photoshop 或者各种工具[1] 来让人物的眼睛能够镜像对称或者修复一些细节。对于使用 AI 辅助的专业画师来说,AI 出图只是第一步,后面的 PS 精修是必不可少的。

Photoshop 修复的生成图片

Midjourney 经过几个大版本的迭代,特别是两周前 V 5.1[2] 版本的发布, 已经成为了目前最为强大与易用的 AI 摄影图片生成产品,没有之一。Stable Diffusion 虽然理论上拥有与之比肩甚至超越的潜力,不过其折腾和使用难度对普通用户来说太不友好;再考虑到易用性和适用范围,基本上可以放弃了。

Midjourney 摄影基础

好比用 ChatGPT 写代码,你至少需要懂点代码一样。想用 Midjourney 生成摄影作品,你还是需要了解一点摄影知识。

如果你本身懂摄影,那么在生成的时候会更加得心应手且富有创造力。比如常见的摄影类型有哪些,拍特定题材,要使用什么样的镜头以及拍摄距离,怎么打光,怎么选择拍摄角度等等,会更加懂得如何去描述自己的需求。如果你完全不懂摄影,首先就会在表述上遇到很大的困难。

抽象摄影 by Midjourney
抽象摄影 by Midjourney

当然也不用太过担心,起步来说并不需要了解很多,我们会给大家介绍重要的基础概念以及一些固定的搭配供大家尝试。随着大家「拍摄」经验的增加,会对各种概念有一个更好的把握。

使用 Midjourney (以及其他 AI 绘图产品) 生成摄影作品,会涉及的主要概念如下:

  •  

相机,Camera:型号 Camera Models,角度 Camera Angles ,位置 Camera Levels,焦距、镜头、光圈与快门 Focus Length, Lens, Aperture, Shutter Speed

  •  
  •  

景别,Field of Shooting:比如 大远景Extreme Long Shot, 远景 Long Shot (有时候也称为 Wide Shot),全景Full Shot,中景Medium Shot,特写Close Up等等。

  •  
  •  

灯光,Lighting:比如 自然光Natural Light, 背光Backlight, Backlighting,硬光Hard Light 等等。

  •  
  •  

色调,Color Grading:比如 电影级Cinematic,复古Vintage,去饱和Desaturated 等等。

  •  

接下来我们将用尽量简洁的语言一一介绍这些概念,并给出一些示例,帮大家快速建立直观印象。大家在后面遇到问题的时候可以回到这里来查看。因为篇幅所限,所以只能简略介绍。如果有看了仍然搞不清楚的或者想了解更多,可以自行搜索关键词了解。

Camera Models

Camera Models 也就是相机,比如 佳能的 Canon EOS R5, 索尼的 Sony A7S III 等等。通常不同的摄影题材会有不同的常用拍摄机,如果匹配的好,生成的照片也会更加靠谱(准确)一点。常用的相机有数十种之多,我们会在后面讲「摄影类型」的时候给出一些推荐的相机搭配。

Canon EOS R5

Camera Angles

Camera Angles 摄像机角度,这个不难理解。大家主要是语言表述上可能会遇到一些问题,可以参考下图:

IMG_261Camera Angles 示意图

这里面比较常用的就是:平视角度(Straight On)、微仰角(Hero View,正如其名,凸显人物高大)、微俯角(Slightly Above,让观看者拥有上位视角)以及鸟瞰角(Bird View,Bird’s Eye View,生成航拍图或者高楼俯瞰图有用)。

下面是我们使用 Hero View 绘制的 乔布斯街拍图:

Street photography of Steve Jobs, shot by Fujifilm x100v, full body, natural lighting, hero view, 4k

乔布斯- Hero View

Camera Levels

Camera Levels[3] 摄影机位置,和角度有一点关联,但具体来说并不是一回事。Levels 参考下图,图中右边标明的是 Shot Size,不过和我们后面会介绍的景别(Field of Shooting)有一些重叠,实际使用上也是景别用的更多。

IMG_263Camera Levels 摄像机位置示例

比较常用的是 Eye-Level,偶尔需要小动物视角会用到 Knee-Level。经典恐怖片《闪灵》里面小朋友骑车视角,使用了最低的 Ground-level shots。合理的设置摄像机位置,可以增加画面代入感(相信大家都知道接下来要发生什么

IMG_264闪灵- Ground-Level Shots

焦距Focus Length 镜头 Lens

理解焦距[4]需要一点中学的光学知识(透镜成像原理)。我们知道大家已经忘干净了,所以大家也可以直接记结论即可:焦距越小,成像收纳角度越大(但焦点距离越近)焦距越大,焦点成像距离越远(但收纳角度越小)。参考下图:

IMG_265焦距 – Focus Length

我们把焦距小于 35mm 的称为广角镜头(wide-angle lens),把焦距大于200 mm的称为长焦镜头(Telephoto Lens)或者说远摄镜头。广角和长焦,想必大家看名字就能理解是什么意思了。

比如下图我们使用广角,鸟瞰视角生成一张东京夜景图:

Landscape Photography of Tokyo, shot by Nikon D850, high angle shot, Blue hour, wide angle lens, 35mm, f/1.8 2s 4k

东京夜景 – 鸟瞰 广角

光圈 Aperture (F-number) 与快门 Shutter Speed

这张东京夜景图的咒语中 35mm 是焦距, 而 f/1.82s 就是 光圈大小和快门速度,这两经常是放一起来说的。

光圈(的单位)又称为焦比[5],表述类似 f/1.4 。下面的值(分母)越小,光圈越大。光圈大小能比较直观的控制光线射入镜头的量,进而影响成片的曝光度。

IMG_267F-number/Aperture 光圈

快门一般按 1/500 这种来表述,单位就是秒。因此 1/500 就是 500 分之 1 秒 (2 毫秒),Shutter 决定了曝光时间。

一般来说,快门快的话,需要使用大光圈,来确保足够的曝光;如果快门慢,就需要使用小光圈来防止过曝(excessive exposure)。这两者的搭配和使用算是一种摄影技巧,讲究颇多。比如通过长曝光(2s ,3s)来制造一些动感模糊的效果( Motion Blur )、车灯或者烟花光线拖拽效果(Light painting[6])等等。不过我们是「云拍摄」,所以可以直接要求 Midjourney 生成 Motion Blur 的摄影作品,而不需要真的去调整光圈和快门,这两者之间在咒语表述上是有一些重叠的。

Motion Blur

景别

景别,Field of Shooting,4 种常见的景别如下图所示:

远-中-特写-大特写

其实 Shooting 还有非常非常多的类别,景别只是其中强调拍摄对象离镜头距离远近的。还有强调内容、时间与主题的 Establishing Shot,强调拍摄方式、地点的 Handheld Shot(手持摄影)、Aerial Shot (空中摄影)、Underwater Shot(水下摄影),强调视觉情绪的 POV Shot (Point of View,视点镜头) 等等,还有很多来自于电影拍摄技法,我们会在后续的「摄影类型」中涉及并给出实例。

IMG_270《杀死比尔》中的视点镜头,渲染女主的无助情绪

灯光,Lighting

光线的重要程度毋庸置疑,其运用是影响照片构图最为有效的手段之一,对人物肖像照而言更是如此。这个需要大家专门去学习,并在实践中积累经验。比较常见的比如:

自然光(Natural Light),通常我们会使用更为明确的 golden hour (又称为 magic hour, 指日初生或者日将落的时候) 和 blue hour (日将升或者日刚落的时候) 来描述光线。比如上面我们画的东京夜景图,就使用了 blue hour。如果你想生成国家地理杂志动物摄影师那种感觉,特别是非洲大草原上的动物,那么 golden hour 就是不二之选。National Geographic Animal Portraits 的咒语在 PromptBase 上售价 5.99 美金[7]现在免费甩卖啦

Wildlife Photography of lions, shot by Sony A1, side view, Natural light, golden hour, Telephoto, 4

National Geographic 狮子 – Golden Hour

前光(Front Light)与 背光(Backlight)。前光可以淡化面部阴影,遮掩面部的皱纹和瑕疵;而背光则可以用来强化人物的边缘与剪影。下面是一个背光的例子(最后一张不太对,不用在意……)。

portrait photography of a woman, shot by Canon EOS 5D Mark IV, eye-level, backlighting, 4k

背光 Backlighting

柔光(Soft Light)与 硬光(Hard Light)。柔光在室内一般会选用柔光灯(箱)和扩散器,主要是拍妹子显年轻、更有亲和力;而硬光则会带来强烈的明暗对比,凸显冲突与人物立体感。

柔光和硬光,大家应该能看出来吧

更为专业的,还有 伦勃朗光(Rembrandt lighting)分割布光(Split lighting)环形布光(Loop lighting)等等,我们后续会出一期专门的灯光总结,大概有 40 左右种不同的灯光设置,供大家参考。

环形光 – 伦勃朗光 – 分割光

色调

色调 Color Grading。前面介绍的东西都是成品前的重要因素,相比较而言色调有点像是后期的调色。在 Midjourney 中我们可以通过直接引用知名电影来生成类似的色调风格,不过这并不总是有效。毕竟我们也无法确定 Midjourney 对我们说引用的电影到底了解多少,所以我们倾向于直接明确的在咒语中声明色调。

色调中最为常见的就是 黑白(black and white)了。

Portrait Photography of a young japanese woman, shot by Nobuyoshi Araki, Canon EOS 5D Mark IV, eye-level, black and white, medium shot, 4k

年轻的日本女人 by Nobuyoshi Araki

这里我们用了日本摄影师 荒木経惟(Nobuyoshi Araki)[8] 老爷子的摄影风格。

我们可以通过 Lomography[9] 这种色调来生成 LOMO LC-A 这种非常具有年代感的相机才能拍摄出来的作品,一出手就是苏联时代老毛子山寨机过度饱和、失衡曝光的那种感觉。

landscape photography of a village, Lomography, shot by Lomography Lomo LC-A+, natural light, 4k

IMG_276Lomography

此外,还有「电影级 Cinematic」色调用来生成剧照、「复古Vintage」色调用来生成老照片等。其实并没有一个严格的定义什么是电影级,因为电影实际上色调风格千差万别,比如非常有特色的《罪恶之城》(Sin City)。不过常规上 Cinematic 会让生成的图片带一点微微的茶黄色。

Cinemagraphs of a man in river, cinematic, 4k –ar 2:1

Cinematic

就生成电影剧照而言有一个常用的小技巧就是直接让 Midjourney 参考已知电影,我们可以增加一组 filmed by <director> 的关键词。如果这个导演风格多变,也可以用 in/from <director's> <movie> 这样的关键词直接指定导演 + 电影。比如我们可以使用下面这个咒语来把一个日本武士弄到《罪恶之城》,为了更接近电影的感觉,本节的几张图片都使用了美国电影 2:1 的宽高比(实际应该是 1.85:1,但是 Mj 目前并不支持这种小数宽高比 )。

Samurai holding katana in Frank Miller’s Sin City, 4k

日本武士杀入罪恶之城

我们后续会给大家整理一份常见的色调风格表供大家参考。

生成摄影作品的基础公式

大家看了前面我们的一些示例,基本也能看出来,摄影作品其实有一个基础的生成公式,即:

<photography style> of , shot by <Artist/Camera Models>, <Lighting>, <angle/level>, 4k

此外还有我们前面提到的 色调,景别,摄像机位置等等,都可以根据需要组合和安插。这里面 photography style (摄影分类)又是一个大类,本章我们用于讲解的,就包括了 街拍 (street photography), 肖像摄影 (portrait photography),风景摄影(landscape photography) ,动物摄影(Wildlife Photography)等,此外还有数十种其他类别的摄影分类。鉴于本篇内容已经很长,我们就放到下一篇再介绍。

结语

本章我们介绍了一些基本的摄影概念,理解了这些概念以后就能更好的理解社区中优秀的AI绘画作品的咒语逻辑,同时也能自己尝试来写一些摄影照片的咒语。

接下来我们将会按类别整理一些资料,把本章挖的坑都填一下。敬请期待

参考资料

[1]使用工具来修复图片: https://www.youtube.com/watch?v=ZWBXtrUQ3U4

[2]Midjourney V 5.1: https://docs.midjourney.com/docs/model-versions#default-model-version-51

[3]摄像机位置 Camera Levels: https://www.studiobinder.com/blog/ultimate-guide-to-camera-shots/

[4]焦距: https://en.wikipedia.org/wiki/Focal_length

[5]光圈: https://en.wikipedia.org/wiki/Aperture

[6]Light Painting: https://en.wikipedia.org/wiki/Light_painting

[7]National Geographic Animal Portraits: https://promptbase.com/prompt/national-geographic-animal-portraits

[8]荒木経惟: https://www.sfmoma.org/artist/Nobuyoshi_Araki/

[9]Lomography: https://en.wikipedia.org/wiki/Toy_camera


2 Comments

ZHANG HUA · 2023年6月15日 at 下午11:22

VERY GOOD

发表回复

Avatar placeholder

您的邮箱地址不会被公开。 必填项已用 * 标注