AI视频进阶技巧:从提示词工程到叙事创作

AI视频进阶技巧:从提示词工程到叙事创作

本系列教程将带你从零开始学习AI视频创作,掌握专业的镜头语言和运镜技巧。

上一篇我们聊了单个镜头的运用技巧。但说实话,真正的AI视频创作不仅仅是生成漂亮的单个镜头,更重要的是要用多个镜头讲一个完整的故事。

这篇进阶教程,我想分享一些我实战中总结的经验。

提示词工程实战

结构化公式

刚开始写提示词的时候,我就在那堆文字,结果生成的画面总是差点意思。后来我发现,提示词其实需要结构化思维。

我总结了一个黄金公式:

1
[镜头类型] + [主体描述] + [动作细节] + [环境场景] + [光影氛围] + [情感基调] + [技术参数]

举个例子看看区别。

基础版本:

1
一个人在雨中走

进阶版本:

1
低角度跟随镜头 + 一个穿着黑色风衣的中年男人 + 在大雨中孤独前行,雨水打湿了他的头发和风衣 + 霓虹灯闪烁的东京街头,路面积水反射着彩光 + 蓝色和粉色的霓虹灯光,侧逆光照明 + 忧郁、孤独、电影感的氛围 + 4K画质,电影级调色,慢动作

效果对比特别明显。基础版本可能就生成个普通的雨中行走,进阶版本直接是电影质感的赛博朋克风格。

负面提示词

我发现告诉AI”不想要什么”,往往比告诉它”想要什么”更重要。

常用负面提示词:

  • 质量问题:模糊、失焦、低分辨率、噪点、颗粒感
  • 变形问题:扭曲、变形、多余的手指、面部不对称
  • 风格问题:卡通、插画、动漫、油画风格(如果想要写实)
  • 构图问题:裁剪、边缘缺失、构图不平衡
  • 运动问题:抖动、跳跃、不流畅的运动

实战示例:

正面提示词:

1
一个美丽的女人在花园里微笑,阳光明媚,电影质感

负面提示词:

1
模糊、失焦、面部扭曲、多余手指、过度美颜、不自然的表情、光线过曝

权重控制

不同的AI工具支持不同的权重语法。

可灵(Keling)的语法是这样的:

1
(非常重要:1.5) + (重要:1.2) + (普通:1.0) + (不太重要:0.8)

示例:

1
(特写镜头:1.3) + 一位(年轻女性:1.2) + 穿着(红色连衣裙:1.1) + 在(雨中:1.0) + 行走,(背景虚化:0.8)

权重分配原则我总结了一下:

  • 主体:1.2-1.5(视频的核心焦点)
  • 关键动作:1.1-1.3(表达故事内容)
  • 环境细节:0.8-1.0(辅助叙事)
  • 背景元素:0.6-0.8(不应喧宾夺主)

情感场景模板库

我实战中积累了一些好用的模板,直接改改就能用。

温馨治愈:

1
柔焦镜头 + 一位祖母和孙子 + 坐在老房子的木质门廊上 + 祖母在织毛衣,孙子在看书 + 阳光透过树叶洒下斑驳光影 + 温暖的金色光线 + 宁静、温馨、怀旧的氛围 + 胶片质感

紧张悬疑:

1
手持摇晃镜头 + 一个侦探 + 在废弃的工厂里 + 缓慢前行,手电筒的光束在黑暗中扫视 + 阴影、尘埃、生锈的机器 + 冷色调、高对比度 + 紧张、悬疑、危险的氛围

浪漫唯美:

1
无人机俯拍镜头 + 一对情侣 + 在巴黎埃菲尔铁塔下的草坪上 + 依偎着看夕阳 + 金色的夕阳、远处的城市轮廓 + 梦幻的光晕、柔焦 + 浪漫、唯美、感人的氛围

多镜头叙事技巧

三幕式结构

电影里常用的三幕式结构,在AI视频里也很好用。

我一般是这么安排的:

  • 开场(2-3个镜头):建立世界观、介绍角色,用环境空镜、角色特写
  • 发展(4-6个镜头):展开冲突、推进情节,用动作镜头、跟随镜头
  • 高潮与结局(2-4个镜头):情感释放、故事收尾,用推镜头、特写镜头

实战案例:悬疑短片《午夜追击》

脚本大纲:

  • 侦探收到匿名信
  • 追踪线索到废弃工厂
  • 发现惊人真相

镜头序列:

镜头 镜头类型 提示词 时长
1 特写镜头 一封信封静静躺在桌上,台灯的暖光打在信封上,神秘感 3秒
2 推镜头 镜头缓慢推进到信封,聚焦到邮戳日期 2秒
3 过肩镜头 侦探的手伸入画面,拿起信封 2秒
4 特写镜头 侦探打开信封,抽出信纸 2秒
5 浅焦镜头 从模糊的信纸内容聚焦到侦探震惊的表情 3秒
6 跟随镜头 侦探快速走出房间,镜头跟随他的背影 3秒
7 车载镜头 从车内视角看雨夜的街道,雨刷来回摆动 3秒
8 无人机视角 废弃工厂的全景,闪电划过夜空 4秒
9 窥视镜头 从窗户缝隙拍摄工厂内部,神秘的光影 3秒
10 推镜头 侦探推开门,镜头推进到黑暗的内部 3秒
11 动作镜头 手电筒光束快速扫过工厂内部 2秒
12 旋转镜头 发现重要线索时,镜头围绕线索旋转 3秒
13 特写镜头 侦探震惊的脸部特写 2秒
14 拉镜头 从侦探脸部拉远,展示他孤独的背影 3秒

视频连续性控制

这个是我踩过最多坑的地方。角色长相变了、场景对不上,这些连续性问题太常见了。

保持角色一致

我实战中总结的经验:

第一步,创建角色档案:

  • 固定年龄、发型、服装风格、身体特征
  • 描述服装的颜色、材质、款式
  • 眼镜、首饰、道具等配饰
  • 典型的站姿、坐姿、手势

第二步,每次都用完整描述:

第一次出现:

1
特写镜头,一位50岁的亚洲女性,短发整齐,戴金丝边眼镜,穿着米色针织衫,背景是温馨的客厅,正在阅读一封信,柔和的窗光照明

后续出现:

1
中景镜头,同一位(50岁亚洲女性:1.2),(短发:1.1),(金丝边眼镜:1.1),(米色针织衫:1.1),在(温馨的客厅:1.0),放下手中的信,表情复杂,(柔和窗光:1.0)

关键技巧:

  • 使用”同一位”强调
  • 用权重强化识别特征
  • 保持环境描述一致

保持场景一致

我习惯创建”场景圣经”,把每个场景的固定元素都写清楚。

1
2
3
4
5
6
7
8
9
10
11
场景名称: 老书房
时间: 黄昏
天气: 雨天
光线: 暖色台灯 + 窗外冷色天光
色调: 怀旧棕黄色调
关键物品:
- 老式木质书桌
- 青铜台灯
- 墙上的老照片
- 满架的书
- 古董闹钟

每个镜头都包含:

  • 核心场景元素(至少3个)
  • 统一的光源描述
  • 一致的色调描述

连续性检查清单

生成视频后,我习惯这样检查:

角色连续性:

  • 发型是否一致?
  • 服装是否相同?
  • 配饰是否统一?
  • 年龄是否匹配?
  • 动作是否流畅衔接?
  • 位置是否合理变化?
  • 情绪是否有逻辑递进?

场景连续性:

  • 光源方向是否一致?
  • 色调是否统一?
  • 关键物品是否保持在场景中?
  • 时间(白天/黑夜)是否匹配?
  • 物品位置是否合理?
  • 空间关系是否正确?

复杂场景构建

多层景深设计

情感场景示例:

1
2
3
4
前景:虚化的室内植物叶子(暗示从室内向外看)
中景:阳台上的两人背影
背景:远处的城市天际线和夕阳
效果:层次丰富,有深度感

提示词:

1
过肩镜头,从室内向外拍摄,前景是虚化的绿色植物叶子,中景是阳台上的两个人背对镜头坐着,背景是远处的城市天际线和金色的夕阳,前景虚化,中景清晰,远景朦胧,电影质感

光影氛围营造

光源类型表:

光源类型 情感基调 适用场景 提示词关键词
自然光 自然、清新、温暖 日常场景 阳光、天光、窗光
人工暖光 温馨、怀旧、亲密 室内情感戏 台灯、蜡烛、壁灯
人工冷光 冷酷、科技、疏离 科幻、悬疑 霓虹灯、LED灯、荧光灯
混合光 冲突、复杂、戏剧性 高潮场景 暖光+冷光对比
背光/逆光 神秘、神圣、剪影 情绪高潮 逆光、轮廓光、夕阳

色彩心理学应用

色彩情感映射:

  • 蓝色:冷静、孤独、忧郁。适合悲伤、思考场景。参考《银翼杀手》雨夜
  • 橙色/金色:温暖、希望、怀旧。适合温情、回忆场景。参考《爱乐之城》夕阳
  • 红色:激情、危险、警告。适合紧张、高潮场景。参考《黑客帝国》红药丸
  • 绿色:自然、诡异、科技。适合自然、科幻场景。参考《黑客帝国》矩阵代码
  • 紫色:神秘、幻想、梦境。适合梦境、奇幻场景。参考《银翼杀手2049》
  • 黑白:经典、严肃、怀旧。适合纪录、回忆场景。参考《辛德勒的名单》

完整创作工作流

从脚本到视频

我做过一个情感短片《那封信》,分享一下完整流程。

脚本:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
标题:那封信
类型:情感短片
时长:约30秒

场景1:老书房 - 黄昏
1. 全景:老式书房,暖色灯光
2. 特写:桌上的老照片
3. 中景:老妇人从书架上取下一封信
4. 特写:信封上的邮戳:1995年
5. 浅焦:从信封聚焦到老妇人的脸
6. 特写:老妇人的眼角有泪水
7. 拉远:老妇人坐在桌前读信,孤独的背影

场景2:回忆 - 明亮
8. 闪回:年轻的女子在阳光下写信
9. 特写:信纸上的一行字

场景3:老书房 - 黄昏
10. 回到现实:老妇人放下信
11. 特写:老妇人微笑着看向窗外
12. 全景:窗外的夕阳

镜头拆解:

镜头 类型 提示词
1 全景 全景镜头,老式书房,深色木质墙板,满架的书,靠墙的木质书桌,桌上有一盏青铜台灯发出暖光,墙上挂着黑白老照片,窗外是黄昏的暖光射入,怀旧的棕黄色调,电影质感
2 特写 特写镜头,书桌上的老照片,照片上是年轻时的夫妇,照片边缘泛黄,台灯的暖光打在照片上,有尘埃在光中飞舞,怀旧氛围
3 中景 中景镜头,(同一位65岁亚洲女性:1.2),(银发:1.1),(米色针织衫:1.1),在(老式书房:1.2),从书架上取下一封信,动作缓慢温柔,(暖色台灯照明:1.0)
4 特写 极特写镜头,信封上的邮戳,清晰显示"1995年",纸张泛黄,有折痕,暖光照明,怀旧质感
5 浅焦 浅焦镜头,从手中的信封开始,焦点慢慢转移到(同一位65岁女性:1.2)的脸,她的眼神温柔而感伤,(暖光:1.0)侧光照明,(米色针织衫:1.1)
6 特写 面部特写,(同一位65岁女性:1.2)的眼角,有一滴泪水缓缓滑落,(暖光:1.0)照亮泪珠,真实感人的细节
7 拉远 缓慢拉远镜头,从(同一位65岁女性:1.2)的面部拉远到中景,展示她坐在(老式书房:1.2)的桌前读信,孤独而温暖的背影,(窗外黄昏:1.0)的暖光

生成流程:

  1. 按顺序生成每个镜头
  2. 检查角色连续性
  3. 检查场景一致性
  4. 不满意则调整提示词重新生成
  5. 保存所有满意的镜头素材

剪辑与配乐:

  • 转场:交叉叠化(回忆与现实的切换)
  • 节奏:前慢(营造氛围)- 中快(回忆片段)- 后慢(情感沉淀)
  • 总时长:30-45秒
  • 配乐:前半段钢琴独奏缓慢忧伤,回忆段加入弦乐温暖明亮,结尾回归钢琴渐弱结束

常见问题解决方案

角色不稳定怎么办?

问题表现:
同一个角色在不同镜头中长得不一样,年龄忽大忽小,服装颜色不一致

解决方案1:固定角色描述
创建一个”角色卡”,每次都完整复制:

1
2
3
4
5
6
7
8
9
10
角色:林奶奶
年龄:65岁左右
性别:亚洲女性
发型:银色短发,整齐
眼镜:金丝边眼镜
服装:米色针织衫
特征:温和的表情,略带皱纹

每次使用:
(同一位65岁亚洲女性:1.3),(银色短发:1.2),(金丝边眼镜:1.2),(米色针织衫:1.2),(温和表情:1.1)

解决方案2:使用参考图像
先用图生视频生成一个满意的镜头,然后在后续生成时使用该镜头的截图作为参考图,提示词:”Same character as reference image”

场景不连贯怎么办?

问题表现:
光源方向不一致,物品位置随意变化,时间(白天/黑夜)不匹配

解决方案1:创建场景圣经

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
场景名称: 老书房
固定物品:
- 深色木质书桌:靠右墙
- 青铜台灯:桌上左侧
- 老照片:墙上正中央
- 书架:左侧墙
- 窗户:右侧墙

光源设定:
- 主光源:青铜台灯(暖色)
- 辅光源:窗外天光(冷色,黄昏)
- 光线方向:台灯从左,窗户从右

色调设定:
- 整体:怀旧棕黄调
- 暖部:台灯照明区
- 冷部:阴影区

每个镜头都加上:
(老式书房:1.2),(深色书桌靠右:1.1),(台灯在左:1.1),(窗外黄昏冷光:1.1)

解决方案2:统一光线描述
每个镜头都明确说明光源:”台灯的暖光从左侧照射,窗外的冷光从右侧形成轮廓光”

运动不自然怎么办?

问题表现:
人物运动僵硬、不流畅,镜头运动突兀,速度不均匀

解决方案:
明确运动方式,模糊描述改成清晰描述:

1
2
3
4
5
❌ 模糊:一个人走
✅ 清晰:缓慢、优雅地走,每一步都稳重

❌ 模糊:镜头移动
✅ 清晰:镜头缓慢、平滑地向右移动

常用速度词汇:

  • 极慢:slow motion, 慢动作
  • 缓慢:slowly, 缓慢
  • 正常:normal speed
  • 快速:quickly, 快速
  • 极快:rapidly, 迅速

描述运动轨迹:

1
2
❌ 摄像机移动
✅ 摄像机沿弧线轨迹从左向右移动,保持主体在画面中心

实战项目分析

15秒产品广告

需求:

  • 产品:智能手表
  • 时长:15秒
  • 风格:现代、科技、动感

镜头脚本:

镜头 时长 提示词
1 2秒 极特写镜头,智能手表的表盘,黑色金属质感,屏幕亮起显示时间,科幻蓝色光晕,4K
2 3秒 微距镜头,手表的侧边按钮,手指按下的特写,金属质感,细节清晰
3 3秒 特写镜头,手表屏幕显示心率数据,数字变化,动画效果流畅
4 3秒 中景镜头,年轻男性的手腕戴着黑色智能手表,在健身房跑步,汗珠滴落,阳光射入
5 2秒 快速剪辑,手表、跑步、数据、心率,快速切换,节奏感强
6 2秒 特写镜头,手表的Logo,背景虚化,专业产品摄影质感

关键技巧:

  • 产品展示:多用特写和微距
  • 使用场景:结合实际使用环境
  • 节奏控制:前慢后快,最后收尾
  • 质感强调:金属、科技、光泽

30秒旅行Vlog

需求:

  • 主题:巴黎之旅
  • 时长:30秒
  • 风格:浪漫、唯美、vlog风格

镜头脚本:

镜头 时长 提示词
1 3秒 无人机俯拍镜头,巴黎城市全景,埃菲尔铁塔矗立中心,蓝天白云,清晨阳光,4K
2 2秒 低角度仰拍镜头,埃菲尔铁塔的钢铁结构,透空的天空,蓝白色调
3 3秒 跟随镜头,年轻女性穿着白色连衣裙,在香榭丽舍大道上行走,阳光透过树叶洒下斑驳光影
4 2秒 手持镜头,街角的咖啡店,露天咖啡座,人们轻松交谈
5 3秒 特写镜头,法式牛角包和咖啡杯,热气腾腾,晨光照射
6 3秒 过肩镜头,女性在卢浮宫前,背对镜头,看着玻璃金字塔
7 3秒 慢动作镜头,塞纳河畔,鸽子起飞,慢动作展示翅膀扇动,金色夕阳
8 3秒 特写镜头,女性微笑的脸庞,头发被微风吹起,背景是模糊的塞纳河
9 3秒 拉远镜头,从女性拉远到塞纳河全景,游船缓缓驶过,夕阳西下
10 5秒 固定镜头,埃菲尔铁塔夜晚亮灯,闪烁,浪漫的夜景,字幕:Paris, Je t'aime

关键技巧:

  • 开场震撼:无人机大景
  • 细节丰富:美食、建筑、人物
  • 节奏变化:正常-慢动作-正常
  • 情感递进:兴奋-享受-浪漫-感动
  • 结尾升华:夜景+文字

写在最后

AI视频创作是技术与艺术的结合。掌握了这些进阶技巧,你就能:

  • 精准控制视频效果
  • 讲述完整的故事
  • 创作电影级作品
  • 实现商业价值

但我发现有几个心法特别重要:

少即是多
不要在一个提示词里塞太多内容。专注于一个核心目标,其他的作为辅助元素。

迭代优化
不要期望一次完美。生成-检查-调整-再生成,这是必经之路。

学习经典
大量观看经典电影,分析镜头运用。AI视频创作的本质是对传统电影语言的再现。

建立素材库
整理自己满意的提示词和镜头,形成个人素材库。未来可以快速复用。

实践为王
理论再多,不如动手一试。每周至少完成一个完整的短片项目。

工具再强大,最终的创造力还是来自于你——那个有故事要讲的创作者。