一小时做一支 90 秒 AI 短剧
使用 2026 年的工具链,从一句故事到一支带 30+ 镜头、角色一致的 90 秒短剧的完整工作流,全程不到 1 小时。
网上多数所谓"AI 短片"教程做出来的是 15-30 秒、单角色的小片段,然后就收工了。那不是短剧—那是动态情绪板。
真正的短剧需要:
- 完整的叙事弧(铺垫 → 冲突 → 解决)
- 多个角度的镜头
- 从头到尾看起来都是同一个人的角色
- 合理的节奏
- 生产级完成度(无水印、无脏字幕、无 AI 痕迹)
本指南讲的是如何用 2026 年的工具链,在一小时内做完上面所有事。
我们用一个真实样例:一支 90 秒短剧《孟婆嫌我烦》,是一位创作者在 Juying 上 60 分钟做完的。成片有 30+ 镜头,主角全程身份一致,并在亚洲短视频平台上拿到了爆款。
下面就是当时用的那套工作流。
开始之前:你需要什么
工具:
- 一个支持跨镜头角色一致性的 AI 视频平台。本指南用 Juying,原理通用。
- 一个用于剧本生成的 LLM。Claude 或 GPT-4 都行。许多 AI 视频平台已经把这步集成进去了。
- 主角的一张参考图(真人照、AI 生成肖像或手绘均可)。
时间预算:总共 60 分钟。
难度:新手。无需 AI 视频经验。
第 1 步:故事点子(1 分钟)
从一句话开始。就一句。
《孟婆》的种子句是:
"孟婆,那位在阴间发忘川汤的女神,被一个一直叽叽喳喳的灵魂烦得不行。"
到这就行。这一阶段不要过度规划,结构是第 2 步的事。
约束条件:选一个所需角色不超过 2-3 个且能塞进 60-90 秒的故事。多数爆款短剧只有一两个主角、一个清晰冲突、一个利落收尾。
如果卡壳了,三种适合 AI 短片的故事原型:
- 反应型:发生一件事,角色强烈反应,反转收尾(《孟婆》就是这种)。
- 误会型:A 以为 B 在做 X,B 实际在做 Y,揭晓。
- 升级型:小事不断重复,越来越糟,达到高潮。
第 2 步:生成剧本(5 分钟)
把你那一句话的点子喂给 LLM,用这套提示词:
Write a 90-second short drama script based on this idea:
[your one-sentence idea]
Requirements:
- 8-12 scenes, each scene 6-10 seconds
- Specify camera framing for each scene (close-up, medium, wide, etc.)
- Specify lighting and mood
- Include 2-3 lines of dialogue or voiceover where appropriate
- Build a clear arc: setup, conflict, resolution
- End with a memorable beat输出会是一份结构化剧本。审一遍,调整节奏,把无聊的场次替换成更强的拍点。不要太较真—短剧剧本本来就需要反复改。
《孟婆》里 LLM 给了 11 个场次,作者保留了 9 个,砍掉 2 个不出力的。
第 3 步:锁定主角(5 分钟)
这是大多数工作流跳过、然后后面付出代价的一步。
把一张主角的优质参考图上传到 AI 视频平台。这张参考图应当是:
- 高分辨率(1024×1024 起)
- 正面或 3/4 侧脸
- 光线均匀(脸上不要有重阴影)
- 单角色清晰构图(画面中没有其他人脸)
平台会处理这张参考图并生成一个角色资产—一般 30-90 秒。资产生成完,未来所有引用此角色的生成都会用这份锁定的身份。
为什么这步重要:没有角色锁,到第 6 镜你就在看另一个人了。有角色锁,第 30 镜还是第 1 镜里的那个角色。
如果你的平台不支持持久化角色资产,这就是多镜头 AI 短剧的失败点。
《孟婆》的参考图是一张 AI 生成的肖像:一位身着红袍、严肃中带慈祥的老妇人。5 分钟上传、处理、锁定。
第 4 步:自动生成分镜(15 分钟)
现代 AI 视频平台会带分镜规划器。把剧本 + 锁好的角色喂进去,它会逐镜生成包含以下要素的分镜:
- 画面框(特写、中景、全景)
- 镜头运动(静止、推进、平移、跟拍)
- 灯光设置
- 角色姿态 / 表情
- 时间码(这一镜的起止)
如果平台没有自动分镜,你也可以手写每个镜头的 prompt。手写的话给自己留 15-20 分钟。
好的分镜能避免新手常见的"每个镜头看起来都一样"问题。镜头要敢变:特写和中景、全景交替;用推进或跟拍加运动;不要每一场都用平视角。
《孟婆》的分镜在 9 个场次里铺了 30+ 个镜头—包括灵魂的反应特写、汤碗的手部细节、阴间环境的全景、透过蒸汽的主观镜头。
第 5 步:生成镜头(30 分钟)
这一步耗时最长,但大部分是空闲时间—平台在并行跑。
点生成。走开。30 分钟后回来。
背后发生的事:
- 30+ 镜头并行排队(如果平台支持的话;串行的话会慢得多)
- 每个镜头都用你锁好的角色 embedding
- 自动生成的 negative prompt 抑制常见漂移模式
- 事后一致性校验对漂移过大的镜头自动重生
如果你的平台没有并行生成或专属算力,这一步可能要几个小时而不是几十分钟。这就是 60 分钟工作流和"做一天"工作流的区别。
《孟婆》这一步用了 28 分钟—30 个镜头,全部并行,全部一致。
第 6 步:组装(3 分钟)
多数现代 AI 视频平台会自动出一份粗剪—按分镜顺序把所有镜头串起来。
过一遍粗剪,重点看:
- 节奏问题(某个镜头停太久,某个剪点过快)
- 连戏错误(光线跳变、角色姿态不接戏)
- 有没有漂移漏过去的镜头
真正的连戏问题,单镜重生。节奏问题,在平台编辑器里裁切或延长。
《孟婆》这步重生了两个镜头,结尾镜头剪掉 1 秒,总共 3 分钟。
第 7 步:字幕擦除 + 超分(5 分钟)
生成的 AI 视频通常会有些细微瑕疵:小段错乱文本、类似水印的元素、偶发异常。智能擦除工具能清掉这些而不破坏底层画面。
然后做超分。4K 输出比 1080p 看起来更专业,特别是在大屏现代设备上播放短视频。
这两步在集成型平台里都已内建。如果用的是分散工具,这一步要 15-30 分钟而不是 5 分钟。
第 8 步:最后润色(1 分钟)
加上:
- 片头卡(开头 1-2 秒)
- 片尾卡 + 署名 / 账号(结尾 1 秒)
- 合适的背景音乐(多数平台自带音乐选择)
- 字幕轨道,便于平台兼容
《孟婆》的最后一笔:一张中文片头卡,加一个署名作者和 Juying 的水印。
总时间核对
| 步骤 | 时间 |
|---|---|
| 1. 故事点子 | 1 分钟 |
| 2. 剧本生成 | 5 分钟 |
| 3. 角色锁定 | 5 分钟 |
| 4. 分镜 | 15 分钟 |
| 5. 生成镜头 | 30 分钟(大多空闲) |
| 6. 组装 | 3 分钟 |
| 7. 字幕擦除 + 超分 | 5 分钟 |
| 8. 最后润色 | 1 分钟 |
| 合计 | ~65 分钟 |
第 5 步的 30 分钟基本是空闲。开干然后走开的话,有效操作时间大约 35 分钟。
提升画质的几个技巧
选对参考图。参考图差 = 角色锁定差。模糊或光线奇怪的参考图会让每一镜都跟着踩雷。值得花 5 分钟挑一张对的。
大胆变化构图。新手什么都用平视中景。老手会用特写、低角度、高角度、跟拍。镜头多样性才是电影感。
善用沉默。90 秒短剧不需要 90 秒台词,最好的短剧里有一半是沉默的反应戏。
动手前先看真短片。抖音和 YouTube Shorts 上随便搜"短片",第一页就有不少电影感很强的作品。直接学他们的节奏。
不要和模型死磕。如果剧本要做 AI 难做的事,简化它。顺着模型擅长的来。
常见问题
这个工作流能不能处理多角色?
可以。在第 3 步开头锁 2-3 个角色,prompt 里按名字引用。注意:两个角色同框且特征相近时(同性别、同年龄段、同族裔),同框镜头里大约 10% 会出现身份串台,需要人工补救一遍。
这套对更长的视频(5 分钟以上)有用吗?
理论上可以,但:成本线性增长,超过 ~3 分钟的叙事连贯性目前真的很难。我们见过创作者把三段 90 秒拼成 5 分钟一集。纯 5 分钟端到端能做,但比 90 秒费力得多。
如果我画不出来也拍不到参考图怎么办?
用图像 AI 生成一张(Midjourney、DALL-E、Stable Diffusion)。挑最贴合你脑中角色形象的那张,作为视频步骤的参考图。
我的平台没有角色锁,还能做吗?
能做,但预计要花 3-5 倍的时间在一致性修复上。变通方案:
- 角色描述用一字不差的同一段提示词
- 每个镜头都带参考图
- 每个镜头出 3 版,挑最一致的那版
- 预计大约 30% 的镜头会因漂移过明显需要重生
对叙事类作品来说,换一个原生支持角色一致性的工具通常更划算。
整套要花多少 credits / 钱?
因平台而异。在 Juying 上,一支 90 秒、30 镜头的项目通常用 200-400 credits,免费档(500 credits/月)就够,Pro($49/月含 3000 credits)几乎可以忽略不计。
按片计费的平台上,根据时长和画质设置不同,一般每个项目 $5-30。
没人会告诉你的事
60 分钟工作流是真的,但多数新手第一次做要 3-4 小时。慢的不是 AI,是:
- 剧本写太久(先随便写出来,后面再迭代)
- 选了一张糟糕的参考图(花 5 分钟找一张对的)
- 跳过分镜(每个镜头都成了"中景平视",结果观感很平)
- 什么都重生(只重生最差的 10%,剩下的别管)
做完 2-3 个项目,工作流就压到 1 小时以内。做完 5 个项目,能压到 40 分钟。
试试这个工作流
Juying 端到端支持上面整套工作流,提供免费档。如果你用这个工作流做出了什么作品,欢迎给我们看看。