使用 Midjourney 生成摄影作品：基础篇

本文章来自AI工匠

前面我们用 5 章的内容介绍了 Midjourney 的基础使用。从本章开始，我们将介绍 Midjourney 的一个大类生成场景：摄影照片。由于摄影本身主题比较大，为避免单篇内容过长，我们会划分为多个部分来介绍。本章作为基础篇，主要是介绍一些我们后续会使用的重要概念。

AI 绘图与摄影

生成震撼的绘画易，生成真实的照片难。

在 AIGC 图片生成领域，生成具有真实感的照片（photorealistic, photorealism）一向是非常具有挑战性的工作，也是学界研究的热点。

摄影与画作最大的区别就是：一般来说摄影比较注重真实感，对细节的要求很高，因此除了镜头成像时因为对焦景深产生的虚化，一般没有比较夸张的艺术修饰。梵高或者莫奈的抽象画要是错一点，非专业人士不可能看的出来；但是要换成照片，普通人也能快速的看出味道不对的地方。

目前 AI 在很多细节上还是比较容易出错的。熟悉 Stable Diffusion 的读者应该都知道，Stable Diffusion 中人像经常露出来的手、腿、脚（鞋）、眼睛、头、镜面反射、透镜折射等等，都是非常容易出问题的部分。其实这个问题在 AI 绘图产品中广泛存在（包括 Midjourney），并非 Stable Diffusion 特有。

腿畸形，两个头，眼睛细节失真

Midjourney 的优化整体要好很多，基本不需要什么特别的技巧也能保证画出来的东西「基本正确」。不过 Midjourney 也经常需要借助 Photoshop 或者各种工具[1] 来让人物的眼睛能够镜像对称或者修复一些细节。对于使用 AI 辅助的专业画师来说，AI 出图只是第一步，后面的 PS 精修是必不可少的。

Midjourney 经过几个大版本的迭代，特别是两周前 V 5.1[2] 版本的发布，已经成为了目前最为强大与易用的 AI 摄影图片生成产品，没有之一。Stable Diffusion 虽然理论上拥有与之比肩甚至超越的潜力，不过其折腾和使用难度对普通用户来说太不友好；再考虑到易用性和适用范围，基本上可以放弃了。

Midjourney 摄影基础

好比用 ChatGPT 写代码，你至少需要懂点代码一样。想用 Midjourney 生成摄影作品，你还是需要了解一点摄影知识。

如果你本身懂摄影，那么在生成的时候会更加得心应手且富有创造力。比如常见的摄影类型有哪些，拍特定题材，要使用什么样的镜头以及拍摄距离，怎么打光，怎么选择拍摄角度等等，会更加懂得如何去描述自己的需求。如果你完全不懂摄影，首先就会在表述上遇到很大的困难。

当然也不用太过担心，起步来说并不需要了解很多，我们会给大家介绍重要的基础概念以及一些固定的搭配供大家尝试。随着大家「拍摄」经验的增加，会对各种概念有一个更好的把握。

使用 Midjourney (以及其他 AI 绘图产品) 生成摄影作品，会涉及的主要概念如下：

相机，Camera：型号 Camera Models，角度 Camera Angles ，位置 Camera Levels，焦距、镜头、光圈与快门 Focus Length, Lens, Aperture, Shutter Speed。

景别，Field of Shooting：比如大远景Extreme Long Shot, 远景 Long Shot (有时候也称为 Wide Shot)，全景Full Shot，中景Medium Shot，特写Close Up等等。

灯光，Lighting：比如自然光Natural Light, 背光Backlight, Backlighting，硬光Hard Light 等等。

色调，Color Grading：比如电影级Cinematic，复古Vintage，去饱和Desaturated 等等。

接下来我们将用尽量简洁的语言一一介绍这些概念，并给出一些示例，帮大家快速建立直观印象。大家在后面遇到问题的时候可以回到这里来查看。因为篇幅所限，所以只能简略介绍。如果有看了仍然搞不清楚的或者想了解更多，可以自行搜索关键词了解。

Camera Models

Camera Models 也就是相机，比如佳能的 Canon EOS R5, 索尼的 Sony A7S III 等等。通常不同的摄影题材会有不同的常用拍摄机，如果匹配的好，生成的照片也会更加靠谱（准确）一点。常用的相机有数十种之多，我们会在后面讲「摄影类型」的时候给出一些推荐的相机搭配。

Camera Angles

Camera Angles 摄像机角度，这个不难理解。大家主要是语言表述上可能会遇到一些问题，可以参考下图：

Camera Angles 示意图

这里面比较常用的就是：平视角度（Straight On）、微仰角（Hero View，正如其名，凸显人物高大）、微俯角（Slightly Above，让观看者拥有上位视角）以及鸟瞰角（Bird View，Bird’s Eye View，生成航拍图或者高楼俯瞰图有用）。

下面是我们使用 Hero View 绘制的乔布斯街拍图：

Street photography of Steve Jobs, shot by Fujifilm x100v, full body, natural lighting, hero view, 4k

乔布斯- Hero View

Camera Levels

Camera Levels[3] 摄影机位置，和角度有一点关联，但具体来说并不是一回事。Levels 参考下图，图中右边标明的是 Shot Size，不过和我们后面会介绍的景别（Field of Shooting）有一些重叠，实际使用上也是景别用的更多。

Camera Levels 摄像机位置示例

比较常用的是 Eye-Level，偶尔需要小动物视角会用到 Knee-Level。经典恐怖片《闪灵》里面小朋友骑车视角，使用了最低的 Ground-level shots。合理的设置摄像机位置，可以增加画面代入感（相信大家都知道接下来要发生什么

闪灵- Ground-Level Shots

焦距Focus Length 镜头 Lens

理解焦距[4]需要一点中学的光学知识（透镜成像原理）。我们知道大家已经忘干净了，所以大家也可以直接记结论即可：焦距越小，成像收纳角度越大（但焦点距离越近）；焦距越大，焦点成像距离越远（但收纳角度越小）。参考下图：

焦距 – Focus Length

我们把焦距小于 35mm 的称为广角镜头（wide-angle lens），把焦距大于200 mm的称为长焦镜头（Telephoto Lens）或者说远摄镜头。广角和长焦，想必大家看名字就能理解是什么意思了。

比如下图我们使用广角，鸟瞰视角生成一张东京夜景图：

Landscape Photography of Tokyo, shot by Nikon D850, high angle shot, Blue hour, wide angle lens, 35mm, f/1.8 2s 4k

东京夜景 – 鸟瞰广角

光圈 Aperture (F-number) 与快门 Shutter Speed

这张东京夜景图的咒语中 35mm 是焦距, 而 f/1.8, 2s 就是光圈大小和快门速度，这两经常是放一起来说的。

光圈（的单位）又称为焦比[5]，表述类似 f/1.4 。下面的值（分母）越小，光圈越大。光圈大小能比较直观的控制光线射入镜头的量，进而影响成片的曝光度。

F-number/Aperture 光圈

快门一般按 1/500 这种来表述，单位就是秒。因此 1/500 就是 500 分之 1 秒 (2 毫秒)，Shutter 决定了曝光时间。

一般来说，快门快的话，需要使用大光圈，来确保足够的曝光；如果快门慢，就需要使用小光圈来防止过曝（excessive exposure）。这两者的搭配和使用算是一种摄影技巧，讲究颇多。比如通过长曝光（2s ，3s）来制造一些动感模糊的效果（ Motion Blur ）、车灯或者烟花光线拖拽效果（Light painting[6]）等等。不过我们是「云拍摄」，所以可以直接要求 Midjourney 生成 Motion Blur 的摄影作品，而不需要真的去调整光圈和快门，这两者之间在咒语表述上是有一些重叠的。

Motion Blur

景别

景别，Field of Shooting，4 种常见的景别如下图所示：

远-中-特写-大特写

其实 Shooting 还有非常非常多的类别，景别只是其中强调拍摄对象离镜头距离远近的。还有强调内容、时间与主题的 Establishing Shot，强调拍摄方式、地点的 Handheld Shot（手持摄影）、Aerial Shot (空中摄影)、Underwater Shot（水下摄影），强调视觉情绪的 POV Shot (Point of View，视点镜头) 等等，还有很多来自于电影拍摄技法，我们会在后续的「摄影类型」中涉及并给出实例。

《杀死比尔》中的视点镜头，渲染女主的无助情绪

灯光，Lighting

光线的重要程度毋庸置疑，其运用是影响照片构图最为有效的手段之一，对人物肖像照而言更是如此。这个需要大家专门去学习，并在实践中积累经验。比较常见的比如：

自然光（Natural Light），通常我们会使用更为明确的 golden hour (又称为 magic hour, 指日初生或者日将落的时候) 和 blue hour (日将升或者日刚落的时候) 来描述光线。比如上面我们画的东京夜景图，就使用了 blue hour。如果你想生成国家地理杂志动物摄影师那种感觉，特别是非洲大草原上的动物，那么 golden hour 就是不二之选。National Geographic Animal Portraits 的咒语在 PromptBase 上售价 5.99 美金[7]。~~现在免费甩卖啦~~。

Wildlife Photography of lions, shot by Sony A1, side view, Natural light, golden hour, Telephoto, 4

National Geographic 狮子 – Golden Hour

前光（Front Light）与 背光（Backlight）。前光可以淡化面部阴影，遮掩面部的皱纹和瑕疵；而背光则可以用来强化人物的边缘与剪影。下面是一个背光的例子（最后一张不太对，不用在意……）。

portrait photography of a woman, shot by Canon EOS 5D Mark IV, eye-level, backlighting, 4k

背光 Backlighting

柔光（Soft Light）与 硬光（Hard Light）。柔光在室内一般会选用柔光灯（箱）和扩散器，主要是拍妹子显年轻、更有亲和力；而硬光则会带来强烈的明暗对比，凸显冲突与人物立体感。

更为专业的，还有 伦勃朗光（Rembrandt lighting），分割布光（Split lighting），环形布光（Loop lighting）等等，我们后续会出一期专门的灯光总结，大概有 40 左右种不同的灯光设置，供大家参考。

色调

色调 Color Grading。前面介绍的东西都是成品前的重要因素，相比较而言色调有点像是后期的调色。在 Midjourney 中我们可以通过直接引用知名电影来生成类似的色调风格，不过这并不总是有效。毕竟我们也无法确定 Midjourney 对我们说引用的电影到底了解多少，所以我们倾向于直接明确的在咒语中声明色调。

色调中最为常见的就是 黑白（black and white）了。

Portrait Photography of a young japanese woman, shot by Nobuyoshi Araki, Canon EOS 5D Mark IV, eye-level, black and white, medium shot, 4k

年轻的日本女人 by Nobuyoshi Araki

这里我们用了日本摄影师 荒木経惟(Nobuyoshi Araki)[8] 老爷子的摄影风格。

我们可以通过 Lomography[9] 这种色调来生成 LOMO LC-A 这种非常具有年代感的相机才能拍摄出来的作品，一出手就是苏联时代老毛子山寨机过度饱和、失衡曝光的那种感觉。

landscape photography of a village, Lomography, shot by Lomography Lomo LC-A+, natural light, 4k

Lomography

此外，还有「电影级 Cinematic」色调用来生成剧照、「复古Vintage」色调用来生成老照片等。其实并没有一个严格的定义什么是电影级，因为电影实际上色调风格千差万别，比如非常有特色的《罪恶之城》（Sin City）。不过常规上 Cinematic 会让生成的图片带一点微微的茶黄色。

Cinemagraphs of a man in river, cinematic, 4k –ar 2:1

就生成电影剧照而言有一个常用的小技巧就是直接让 Midjourney 参考已知电影，我们可以增加一组 filmed by <director> 的关键词。如果这个导演风格多变，也可以用 in/from <director's> <movie> 这样的关键词直接指定导演 + 电影。比如我们可以使用下面这个咒语来把一个日本武士弄到《罪恶之城》，为了更接近电影的感觉，本节的几张图片都使用了美国电影 2:1 的宽高比（实际应该是 1.85:1，但是 Mj 目前并不支持这种小数宽高比）。

Samurai holding katana in Frank Miller’s Sin City, 4k

日本武士杀入罪恶之城

我们后续会给大家整理一份常见的色调风格表供大家参考。

生成摄影作品的基础公式

大家看了前面我们的一些示例，基本也能看出来，摄影作品其实有一个基础的生成公式，即：

<photography style> of , shot by <Artist/Camera Models>, <Lighting>, <angle/level>, 4k

此外还有我们前面提到的色调，景别，摄像机位置等等，都可以根据需要组合和安插。这里面 photography style (摄影分类)又是一个大类，本章我们用于讲解的，就包括了街拍 (street photography)，肖像摄影 (portrait photography)，风景摄影（landscape photography) ，动物摄影（Wildlife Photography）等，此外还有数十种其他类别的摄影分类。鉴于本篇内容已经很长，我们就放到下一篇再介绍。

结语

本章我们介绍了一些基本的摄影概念，理解了这些概念以后就能更好的理解社区中优秀的AI绘画作品的咒语逻辑，同时也能自己尝试来写一些摄影照片的咒语。

接下来我们将会按类别整理一些资料，把本章挖的坑都填一下。敬请期待

参考资料

[1]使用工具来修复图片: https://www.youtube.com/watch?v=ZWBXtrUQ3U4

[2]Midjourney V 5.1: https://docs.midjourney.com/docs/model-versions#default-model-version-51

[3]摄像机位置 Camera Levels: https://www.studiobinder.com/blog/ultimate-guide-to-camera-shots/

[4]焦距: https://en.wikipedia.org/wiki/Focal_length

[5]光圈: https://en.wikipedia.org/wiki/Aperture

[6]Light Painting: https://en.wikipedia.org/wiki/Light_painting

[7]National Geographic Animal Portraits: https://promptbase.com/prompt/national-geographic-animal-portraits

[8]荒木経惟: https://www.sfmoma.org/artist/Nobuyoshi_Araki/

[9]Lomography: https://en.wikipedia.org/wiki/Toy_camera

使用 Midjourney 生成摄影作品：基础篇

AI 绘图与摄影

生成震撼的绘画易，生成真实的照片难。

Midjourney 摄影基础

Camera Models

Camera Levels

焦距Focus Length 镜头 Lens

光圈 Aperture (F-number) 与快门 Shutter Speed

景别

灯光，Lighting

色调

生成摄影作品的基础公式

结语

2 Comments

ZHANG HUA · 2023年6月15日 at 下午11:22

admin · 2023年6月15日 at 下午11:30

发表回复取消回复

超级实用 Midjourney提示词-2

超级实用 Midjourney提示词

深圳第七部“小成本”院线电影《此生有约》在深圳点映

使用 Midjourney 生成摄影作品：基础篇

AI 绘图与摄影

生成震撼的绘画易，生成真实的照片难。

Midjourney 摄影基础

Camera Models

Camera Levels

焦距Focus Length 镜头 Lens

光圈 Aperture (F-number) 与快门 Shutter Speed

景别

灯光，Lighting

色调

生成摄影作品的基础公式

结语

2 Comments

ZHANG HUA · 2023年6月15日 at 下午11:22

admin · 2023年6月15日 at 下午11:30

发表回复 取消回复

Related Posts

超级实用 Midjourney提示词-2

超级实用 Midjourney提示词

深圳第七部“小成本”院线电影《此生有约》在深圳点映

发表回复取消回复