氛圍創作技巧教學：將您的感受轉化為 AI 影片提示詞

腦海中那幅畫面，清晰可見。為什麼 AI 總是無法將它拍出來？

大多數時候，並非模型辜負了你，而是你與模型之間少了一位翻譯。

你一定看過這類 AI 影片：面部精緻、肢體不會穿模，連光影都處理得當。但你看完後心裡只有一句平淡的「喔」，然後直接滑過。少了什麼？你試圖用「氛圍感」、「電影感」、「質感」等詞彙來描述，但當你把這些字詞輸進提示詞時，它們卻失效了。經過二十多次重寫，你的點數也在盲目重抽中燒光了。

這份指南有兩個目的。首先，它將介紹一種名為「氛圍創作」（Vibe Creating）的方法，教你如何將無法言喻的感受，轉化為模型能確實執行的語言。其次，它提供了一套無需複雜設定的流程，讓你能在十分鐘內完成第一次測試，產出充滿「那種感覺」的影片。

什麼是「氛圍創作」，為什麼它能修復你的提示詞？

氛圍創作的核心在於：描述你想要的「情緒結果」，並透過一套方法將其轉化為達成該結果的具體電影語言。你只需要負責「我想呈現什麼感覺」，而它會負責「該如何拍攝」。

如果你覺得這個說法很眼熟，那是刻意為之的。2025 年初，Andrej Karpathy 提出了「氛圍編碼」（vibe coding）的概念，描述了一種不再逐行寫程式，而是向模型描述意圖並讓其生成實作的工作流（Vibe coding, Wikipedia，2025 年 2 月）。這個詞迅速傳播，甚至被柯林斯字典選為年度詞彙。氛圍創作將同樣的思維轉移到影片製作上。你不再需要微觀管理焦距，而是直接描述你想傳達的體驗。

以下是導致大多數提示詞失敗的陷阱。當你希望場景有「危險感」時，會直覺地輸入「危險氛圍」。模型接收到五個抽象詞，便給了你危險的元素：機器人、槍、陰暗的天空。所有素材都有了，但你卻毫無感覺。因為這組詞彙太抽象，無法指向任何具體的視覺機制。

氛圍創作不會急於生成。它會先推敲出究竟是什麼創造了危險的感受，然後將提示詞寫成「有質感的影像」，而非參數清單。這種區別正是方法的精髓，後文將透過五個實戰案例來詳細說明。

氛圍創作案例 1：如何將「危險」轉化為鏡頭語言

以一支病毒式 AI 短片的開場為例：一個機器人牛仔在喪屍小鎮漫步。劇情雖僅有一句話，但你的心跳卻隨著鏡頭起伏。第一個鏡頭將槍口貼近鏡頭，你的潛意識立刻接收到一個訊號：你現在處於危險之中。

若你嘗試重現該場景，輸入「危險氛圍」，得到的只會是充滿危險道具卻毫無壓迫感的畫面。

將同樣的意圖交給「氛圍創作」，它會同步處理三個關鍵因素：

鎖定眼睛於槍管，將背景模糊化。這是「淺景深」在發揮作用。
讓你感覺自己正跪著，仰視著一支指向你的槍。這是「低角度」在發揮作用。
將槍管推至螢幕邊緣，直逼眼前。這是「廣角鏡頭扭曲」在發揮作用。

這就是關鍵動作。最終寫入提示詞的不是「淺景深、低角度、廣角扭曲」（這是機械技巧），而是這些機制所創造的「感受性影像」。氛圍創作將專業手法翻譯成模型與人類都能瞬間理解的事物。當三種效果同時觸發，你的潛意識會認定「我很危險」，而理性思維則會覺得「這鏡頭拍得真棒」。

這就是氛圍的本質。資訊透過潛意識通道傳遞，繞過你的邏輯批判。氛圍創作就是建立該通道的翻譯官。你說出想要的，它負責規劃如何拍攝。

氛圍創作案例 2：一座刻意營造「違和感」的花園

再來挑戰更難的情緒。當我打開生成器時，腦海中是這樣的畫面：

一位銀髮女孩穿著水晶薄紗裙，站在北歐木屋前，背後是燃燒般的夕陽天空。每一幀都很美，但某種細微的訊號在暗示這裡不安全。

我真的不知道如何人造出「不安全感」。氛圍創作將其表達為一種配方：美麗 + 30% 恐怖谷效應 + 儀式感道具 + 窺視感的鏡頭 + 不協調的光源 = 童話外殼下的邪惡。

配方中的每一個詞，都是能在提示詞中生效的參數。唯一的問題是，當你坐下來創作時，能否即時回想、描述並讓模型理解。如果不行，這正是氛圍創作要為你解決的任務。它能捕捉那句模糊的描述，並為你寫下「配方」。輸出內容如下：

注意鏡頭從未展示怪物的本體，僅展示了眼睛、一條肢體以及搖曳的陰影。這種克制是「不安全感」的精準轉換。這也比渲染一個完整的生物容易得多，這就是它能生成得如此乾淨的原因之一。

氛圍創作案例 3：讓 AI 影片擁有「電影預告片」質感

把下一個案例發給學過電影的朋友，隱去來源，他們很可能會猜這是一部芭蕾舞電影的預告片。這是一次未經剪輯的生成結果，沒有修飾，沒有調色。

意圖是「給我在劇院後台呈現電影級質感」。當你把「預告片質感」交給氛圍創作時，它的邏輯如下：

後台開場並非炫技，而是敘事策略。從昏暗雜亂的後台推向明亮的舞台，是一條《黑天鵝》與《紅菱豔》都使用過的視角路徑。走向舞台本身就是一種宿命的隱喻。模型不僅是在渲染畫面，而是在渲染「調度」。

三個變數必須同時準確：地板反射的角度、陰影的方向，以及動作中微妙的延遲感。任何一個環節出錯，夢幻感就會瞬間崩塌成監視器畫面。

男女主角對視的那一幀，運用了荷里活標準的「愛情發生時刻」模板：側面背光勾勒輪廓、背景燈泡融化成散景、淺焦將世界推開，只剩兩人。這證明了一件事：這些模型的能力上限已經達到預告片水準。限制你的從來不是模型，而是提示詞。

氛圍創作案例 4：將「孤獨」轉化為影像

這是一個單一的抽象詞，而觀看它是如何被拆解的，是氛圍創作中最有價值的部分。影片是一名宇航員在未知星球上，回憶地球生活快樂片段的場景。你感覺自己彷彿與她同在。如何做到？

氛圍創作拒絕直接渲染「孤獨」這個詞。它會自動將抽象概念擴展為一系列具體選擇。以下是轉換表：

你說的詞	它轉換的具體內容
孤獨	強烈的比例反差：渺小的人面對巨大的漂浮物，凸顯人類在巨物前的微不足道
孤獨	灰藍色、低飽和度的荒原，殘酷而乾淨的地平線，環境本身就在訴說「這裡空無一人」
孤獨	一隻手試圖觸摸光束，因為孤獨者即便面對由光組成的幻象，也渴望連結
孤獨	光影中的回憶都是人類連結：母親的手、奔跑的孩子、澆花的祖母
孤獨	記憶渲染成溫暖的金色，現實則是冰冷的灰色，以色溫呈現情緒的兩極
孤獨	最後一幀：她獨自站在正中央，面向鏡頭

這個方法掌握了一個寫作課會教、但沒人記得用的道理：孤獨不是空虛，孤獨是仍記得溫暖的模樣。你給它一個詞，它回饋一套真正承載該詞彙的影像結構。

氛圍創作案例 5：證明的關鍵——A/B 測試

此時可能會有人反駁：如果我寫出一份專業的提示詞，還需要這個嗎？以下是受控測試，結果是本指南最有力的證據。

A 組輸入：一份完全生產級的鏡頭列表（Shot List）。標註鏡頭尺寸、鏡頭移動、時間碼、聲音設計等，應有盡有。三組鏡頭涵蓋一個小女孩在雨中巷弄猶豫、跳進水坑、水花四濺、最後爆發大笑的過程。文件本身足以交給專業電影劇組執行。

Shot 1: 雨中記憶 (設置) (00:00 – 00:03) | 時長：3秒 鏡頭尺寸： 遠景 → 全景 鏡頭移動： 固定鏡位，固定焦點。 視覺： 雨剛停。冷色調薄霧飄散。鵝卵石路面佈滿水坑，倒映著兩側風化的磚牆與青苔。畫面邊緣，一雙對腳來說過大的黃色雨鞋緩緩入鏡。女孩在水坑邊緣停下，低頭凝視表面巨大的倒影。 聲音： 雨後潮濕空洞的風聲；屋簷的滴水聲；橡膠靴在濕石面上摩擦的細微聲。 Shot 2: 跳躍前的對峙 (猶豫特寫) (00:03 – 00:08) | 時長：5秒 (核心情緒點) 鏡頭尺寸： 極端特寫 → 特寫 鏡頭移動： 極慢的推近 (「緩慢呼吸」節奏)，對焦於她的臉部與眼睛。 視覺： 鏡頭鎖定女孩臉頰。眉頭緊鎖，目光在水坑與過大的雨鞋間來回遊移。輕咬下唇，因緊張而微微皺鼻。深吸一口氣——整張臉精緻地呈現出內心掙扎：「我想跳……但我不敢。」 鏡頭舒緩延伸，彷彿時間靜止。 聲音： 環境風聲淡出至真空般的寂靜，僅剩急促的呼吸聲與舌尖擦過嘴唇的聲音。第8秒末，一聲低沉的心跳重擊響起。 VFX註記： 超精細面部紋理渲染（SSS皮膚著色器）；皮下微血管反應；眼睛反射水坑光影；雨滴滑落髮絲的物理模擬。 Shot 3: 爆發與回響 (反應) (00:08 – 00:15) | 時長：7秒 鏡頭尺寸： 低角度遠景 → 固定中景 鏡頭移動： 動作爆發瞬間，鏡頭外彈並鎖定固定位置。 視覺： 心跳聲響起，女孩臉上的猶豫瞬間褪去。眼神堅定。雙腳併攏跳入水坑。慢動作攝影中，水花噴濺成無數晶瑩剔透的水滴，像鑽石般破碎。背景中，一隻打盹的橘貓被驚醒——毛髮豎立，狼狽跳上牆頭。鏡頭切回中景：女孩站在石徑上的水花殘餘中，抬頭仰望——那一刻，她的臉爆發出燦爛、純粹、清澈的笑容，眼角閃爍著淚光。 聲音： 沉重的爆發水聲；貓的尖叫聲；女孩無拘無束的笑聲。

A 組結果：濕漉漉的鵝卵石、薄霧、倒影全部出現了。技術參數執行到位，但兩件事崩潰了：

「雨鞋緩緩入鏡」被字面解讀成一雙空蕩蕩的雨鞋孤零零地立在巷子裡，背後的霧中才出現人影。原本想要溫馨童趣，卻變成了恐怖片開場。
情緒弧線瓦解。女孩的臉只呈現了淚水。猶豫、決心、爆發、笑聲的層次消失了。

B 組輸入：同樣的鏡頭列表，交給「氛圍創作」進行重寫。它不會增加東西，而是去除雜訊。其邏輯大致為：這份文件寫得過於機械執行化，但底下隱含了完整的情緒敘事，適合進行翻譯。保留：接近水坑的三段節奏、內心鬥爭、爆發。刪除：低價值的技術術語、鏡頭尺寸、時間碼。保留：真正具備情緒權重的細節（黃雨鞋、濕石、跳躍、橘貓、笑聲與淚光）。將聲音設計轉化為自然體驗語言。重寫如下：

雨剛停。冰冷的薄霧在舊巷中繚繞，鵝卵石路面水坑倒映著斑駁的牆壁。一雙特大號黃色雨鞋緩緩入鏡。女孩走到最大的水坑前停下，低下頭，凝視著水中搖曳的倒影。空氣中僅有雨後的空靈風聲、屋簷的滴答聲，以及靴子摩擦濕石的細微聲。她盯著水坑，低頭看了看鞋，眉頭緊鎖，嘴唇緊閉，彷彿在進行一場與自己的嚴肅童年對決。她明顯想跳，卻在最後一刻遲疑了。呼吸變得急促，周圍的一切彷彿淡去，只剩下那種緊張與期待——那是離跳躍只差一口氣、勇氣卻稍顯不足的感覺。下一秒，決心湧上。她併攏雙腳躍入坑中。水花向天空爆發，化作耀眼的光之碎片。身旁一隻打盹的橘貓被驚醒，狼狽地竄上高牆。水花落定，女孩站在殘餘的水漬中，抬起頭，爆發出清澈、燦爛、毫無防備的笑聲，眼眶微微濕潤，彷彿雨後的世界被她雙手點亮。

沒有一個技術術語。但你讀完後，場景已經在腦海中播放。模型也是這樣讀的。

B 組結果：戴著髮辮、穿綠雨衣黃雨鞋的女孩，在水坑前停下，特寫捕捉到緊鎖眉頭的猶豫，隨後雙腳落下，水花噴濺，牆上的貓被嚇跑，女孩抬頭爆發出閃著淚光的笑容。情緒弧線完整保留。

對比表：

維度	A 組：執行型鏡頭列表	B 組：氛圍創作重寫
提示詞形式	堆砌尺寸、移動、時間碼	一段呼吸感的情緒敘事
模型讀到的	一半是雜訊	全部是影像與情緒
典型錯誤	空雨鞋詭異地站在巷中	無
情緒弧線	崩塌為模糊的「悲傷」	猶豫、爆發、釋放，三個層次完整
關鍵細節	丟失	橘貓與淚光均保留

教訓很直接：技術細節並沒有幫上忙，反而因為過多模型必須過濾的「雜訊」而造成了負面影響。

如何開始你的第一次氛圍創作專案（三步驟）

你不需要學習任何提示詞工程。整個工作流只有三步。

第一步：教 AI 助手這項技能。 複製文章底部的「氛圍創作技能」（Vibe Creating Skill），貼進你使用的任何 AI 助手（Claude、GPT 或 TRAE 等）。不需要安裝或設定，它讀一次就會了。

第二步：用平實語言描述感受。 任何詞都可以：一個詞（如「自由」）、一句話（如「想要《愛x死x機器人》開場的那種能量」），或模糊的情緒（如「今天看到夕陽，突然想拍點東西，說不上來是什麼」）。這項技能會自動歸類你的情緒歸屬，必要時問你一兩個問題，然後為你產出包含鏡頭、光影、色溫、節奏、道具、風格參考的完整提示詞。

第三步：在能運行的模型上生成。 複製提示詞，貼進 Seedance 2.0 影片模型中進行生成。

whole process of vibe creating.png

關於生成平台的選擇，這比想像中重要。本指南中的範例皆使用 Atlas Cloud 上的 Seedance 2.0。Seedance 2.0 是字節跳動的音視訊模型，能根據文字與圖片輸入生成長達 15 秒同步影片。它適合此流程的原因：

臉部穩定且表情連貫：這是氛圍型影片的成敗關鍵。畫面氛圍再好，只要臉部變形，瞬間崩塌。
全球直連：無需排隊，隨時捕捉靈感。
模型豐富：單一 API 金鑰背後支援超過 300 個模型，便於進行不同模型對比，或整合進現有工作流。

一分鐘後，那幅只存在於你腦海中、從未對人解釋過的畫面，第一次出現在螢幕上。

氛圍創作技能（複製並使用）

這是最實用的部分。將以下代碼塊貼入 AI 助手，它即可執行整套方法。

plaintext
1---
2name: vibe-creating-prompt
3description: 判斷用戶輸入是否適合氛圍創作（Vibe Creating）。若適合，將單鏡頭、多鏡頭描述、情感場景轉換為更優秀的影片提示詞，同時保留對話、旁白、音樂、音效等強約束。不適用於長對話同步敘事、純工業執行列表或 UI 教學。
4---
5
6# 氛圍創作技能 (Vibe Creating Skill)
7
8## 概述
9目標是提煉用戶意圖，確保模型能掌握視覺中心、情緒方向與體驗連續性。優先考慮創意意圖、情感價值、核心意象與視覺統一。淡化低價值的技術參數與執行語言。
10
11## 快速啟動
12接收輸入後執行三步驟：
131. 判斷是否適用氛圍創作 (VC)。
142. 判斷處理方式：原樣通過、輕度提煉、完整重寫、先詢問，或提供 VC 版本。
153. 資訊不足時先詢問，僅問完成動作必要的資訊，切勿為了分類而審問。
16
17## 場景與表達判斷
18優先使用場景判斷 (S) 確認 VC 適配性，再使用表達判斷 (E) 決定處理方式。資訊密度檢查 (I) 優先級最高：若缺失關鍵錨點，必須先問。
19
20### S1: 原生適配 VC
21- E1 (接近 VC 表達)：預設完整重寫；若文案已成熟，改為輕度提煉或原樣通過。
22- E2 (混合表達)：預設輕度提煉後重寫，保留有效結構、敘事順序與情緒漸進。
23- E3 (精準控制表達)：視為 VC 可翻譯對象，切勿因它是執行格式而拒絕，刪除低價值技術控制，轉譯為自然視覺語言。
24
25### S2: 部分適配 VC
26- E1: 預設輕度提煉，若已可用則通過。
27- E2: 提供選擇，詢問用戶是否需要 VC 版本。
28- E3: 預設保留原意，並溫和提示可提供 VC 重寫。
29
30### S3: 低適配 VC
31- E1: 保持原樣，不強制 VC。
32- E2: 僅極小幅度清理，除非明確要求，否則不風格化。
33- E3: 保持原樣，解釋該需求更適合傳統分鏡流而非 VC。
34
35### 四大硬性規則
36- 資訊不足先問：無論多適配，若無視覺錨點、主體動作或風格指引，先問。
37- 用戶強約束優先：用戶明確要求的對話、音樂、鏡頭序號、格式均不得刪除。
38- 多鏡頭保留結構：若表達的是連貫體驗，不強行壓縮為單一段落；除非明確要求，否則不自動添加序號。
39- 精準控制不等於低適配：先看場景目標，再決定是否翻譯。
40
41## 互動原則
42不暴露分類標籤。輸出格式固定為四部分：判斷、處理方式、結果、註記（若有）。
43- 判斷：簡述是否適合 VC、原稿是否可用、資訊是否充足。
44- 處理方式：pass through / light distill / full rewrite / ask first / keep as is / optional VC version。
45- 結果：重寫後的提示詞或提問。
46- 註記：說明去除了哪些技術參數，或提醒用戶可隨時要求保留特定設定。

關於氛圍創作的常見問題

追隨這份指南需要懂提示詞工程嗎？

不需要。氛圍創作的目的就是讓你用平常話描述感受，剩下的翻譯工作由技能包代勞。

為什麼詳細的鏡頭列表反而輸給簡單的提示詞？

因為細節列表中有大量模型必須克服的「雜訊」。鏡頭尺寸和時間碼無法承載情緒，甚至會因為模型誤解而導致崩壞。氛圍創作只保留核心的情緒弧線與具象細節，模型得到的是純粹的感受。

氛圍創作與氛圍編碼（Vibe Coding）是一樣的嗎？

它們是親戚，不是同一個東西。氛圍編碼是關於「描述意圖來生成程式」；氛圍創作則是「描述意圖來生成影片」。兩者都是將努力方向從「如何做」轉向「我想要什麼結果」。

流程需要多久？

從第一次嘗試開始，全程大約十分鐘。貼上技能包、描述感覺、獲得提示詞，然後渲染。大部分時間花在生成上，而非設定上。

結語

阻礙你想像力與螢幕之間隔閡的，從來不是模型。這些工具的上限早已達到電影級品質。阻礙你的，是你心中的感覺與模型能理解的語言之間的鴻溝。

氛圍創作彌合了這道鴻溝。你命名感覺，它編寫鏡頭。文中提到的五個案例——將危險轉化為鏡頭移動、營造不安全感、預告片級調度、孤獨的意象化，以及擊敗規格清單的重寫——歸根究底都是同一個動作：描寫觀眾該有什麼「感覺」，而不是描寫該用什麼鏡頭。

貼上技能包，描述你一直想拍的畫面，並在 Atlas Cloud 上進行生成吧。折扣窗口將於 6 月 15 日關閉，現在正是親眼看見腦中畫面第一次躍上螢幕的絕佳時機。這幾天，試著讓你的想像力擺脫「技術規格」的枷鎖，去捕捉那些讓你心跳加速、讓你感到不安或讓你沉浸其中的瞬間。當你不再糾結於「光圈值」或「焦距」，而是開始描述「陽光斜射在舊書頁上的那種寂靜」，你會發現 AI 的回應不僅僅是影像的生成，更是一種共鳴。

返回列表

為什麼你的 AI 影片看起來不錯，卻感覺毫無靈魂：AI 氛圍營造技巧指南

什麼是「氛圍創作」，為什麼它能修復你的提示詞？

氛圍創作案例 1：如何將「危險」轉化為鏡頭語言

氛圍創作案例 2：一座刻意營造「違和感」的花園

氛圍創作案例 3：讓 AI 影片擁有「電影預告片」質感

氛圍創作案例 4：將「孤獨」轉化為影像

氛圍創作案例 5：證明的關鍵——A/B 測試

如何開始你的第一次氛圍創作專案（三步驟）

氛圍創作技能（複製並使用）

關於氛圍創作的常見問題

追隨這份指南需要懂提示詞工程嗎？

為什麼詳細的鏡頭列表反而輸給簡單的提示詞？

氛圍創作與氛圍編碼（Vibe Coding）是一樣的嗎？

流程需要多久？

結語

最新模型

MiniMax H3 Text-to-Video

MiniMax H3 Image-to-Video

MiniMax H3 Reference-to-Video

Reve 2.1 Remix

一個 API，暢享全模態 AI。