
刚才忽然想到一个事。
我最近一直在用 AI,写文章、做图、想视频、搭网站。用得越多,越明显感觉到一件事:很多人以为 AI 很神,其实不是。
你让它凭空给你一个好东西,大概率是撞运气。
这话我自己也踩过很多次。
一开始用 AI 生图的时候,总觉得只要把脑子里的画面说出来,它就应该能懂。比如“电影感一点”“高级一点”“真实一点”“不要太假”。这些话我们平时跟人沟通好像能用,但丢给 AI,其实很虚。
因为它不知道你说的高级是哪种高级。
是奢侈品广告那种高级,还是纪录片那种高级?
是干净的高级,还是破旧但有质感的高级?
是暖色,还是冷色?
是正脸,还是背影?
是 35mm 的环境感,还是 85mm 的压缩感?
你不说清楚,它只能猜。
AI 最容易给你的,不是答案。
是一个看起来像答案的平均值。
而 AI 最可怕的地方就是,它猜得还挺像那么回事。
它会给你一个看起来完成度还不错的东西。光影有,构图有,情绪也有一点。你第一眼看会觉得可以,但多看几眼就会发现,它不是你想要的。
它只是一个平均答案。

现在我越来越觉得,想让 AI 生成一个好东西,最重要的不是你会不会写一个很长很复杂的提示词,而是你能不能给它一个清楚的参考。
这个参考可以是文字。
也可以是图片。
也可以是视频。
甚至可以是一段你自己的表达,一张你拍过的照片,一个你喜欢的镜头,一种颜色,一种光线,一种节奏。
总之,不能只靠一句“你帮我弄高级一点”。
这不行。
跟人沟通都不一定行,跟 AI 更不行。
我以前拍片子的时候,也经常遇到这种情况。甲方说想要“大气一点”,说想要“有质感一点”,说想要“年轻一点但不要太跳”。这些词本身都没错,但它们太大了。
真正能推进事情的,永远不是这些形容词。
而是参考。

“像这个片子的开头,但节奏慢一点。”
“像这张照片的光,但人物不要这么摆。”
“像这个镜头的运动方式,但场景换成桂林。”
一旦有了参考,沟通就落地了。
AI 也是一样。
你不给它参考,它就只能从全网平均审美里捞一个东西给你。那个东西可能不差,但大概率不属于你。
这也是我最近做 AI 视频最大的感受。

AI 视频现在看起来很猛,好像一句话就能生成一个镜头。但真做起来你会发现,最难的不是让它动起来,而是让它按你的意思动。
你想要它慢慢推过去。
它给你乱晃。
你想要它保持人物一致。
它给你换脸。
你想要它像纪录片一样克制。
它给你一个广告片。
你想要它有情绪。
它给你堆特效。
所以到最后,问题不在 AI,而在我们自己有没有把想法讲清楚。
讲清楚不是写一堆废话。
是知道自己要什么。
这其实挺残酷的。
因为很多时候,我们以为自己脑子里有画面,其实没有。我们只是有一个模糊的感觉。等真的要把它说出来、找参考、拆镜头、写指令的时候,才发现自己也没想明白。
你模糊,它就模糊。
你清楚,它才有可能清楚。
AI 有时候不是创作工具。
它像一面镜子。
所以我现在越来越不相信那种“万能提示词”。不是说提示词没用,而是提示词只是最后那一步。真正重要的是前面的判断:你要什么,不要什么,参考是什么,限制是什么,标准是什么。
一个好的 AI 指令,应该至少有几个东西。
主体是什么。
场景在哪里。
光线是什么。
构图是什么。
情绪是什么。
不要什么。
参考什么。

这几个东西越清楚,结果越不容易跑偏。
当然,也不是写得越多越好。写太多,AI 也会抓不住重点。关键是要给它方向,不是给它一堆形容词。
这点跟拍摄很像。
导演在现场不是说“你们演高级一点”。
而是说,你从这里走到那里,别看镜头,手先碰一下杯子,停半秒,再抬头。
越具体,越自由。
听起来矛盾,但是真的。
指令越具体,AI 反而越有机会生成你想要的东西。因为它终于不用猜了。
我现在用 AI,越来越像在带一个很聪明但没有生活经验的助理。它能力很强,速度很快,什么都懂一点,但它不知道我真正想要什么。
我要做的,不是求它灵光一现。
而是把我脑子里的东西,尽量翻译成它能执行的东西。
这可能就是以后很重要的一种能力。
不是会用 AI。
而是会指挥 AI。
再准确一点,是会把自己的感觉翻译给 AI。
这件事对我这种做影像的人,其实特别重要。因为我们脑子里很多东西本来就是感觉,是光,是节奏,是温度,是空间,是一个人站在那里那个瞬间的状态。
这些东西不翻译出来,AI 不会懂。
它只会给你一个“看起来不错”的东西。
但看起来不错,离真正想要,还有很远。