Das Bild in deinem Kopf, das du so klar vor dir siehst. Warum weigert sich die KI immer wieder, es auf den Bildschirm zu bringen?
Meistens liegt es nicht daran, dass das Modell versagt. Es fehlt etwas zwischen dir und dem Modell: ein Übersetzer.
Du kennst diese Art von KI-Videos bereits. Das Gesicht ist scharf, die Gliedmaßen verschmelzen nicht ineinander, die Beleuchtung ist sogar durchdacht. Du siehst es dir an, deine einzige Reaktion ist ein flaches „Hm“, und du scrollst weiter. Etwas fehlt. Du suchst nach Worten wie „Atmosphäre“, „filmisch“ oder „Textur“, aber in dem Moment, in dem du sie in einen Prompt tippst, hören sie auf zu funktionieren. Nach zwanzig Versuchen hast du deine Credits verbrannt, während du auf bessere Ergebnisse gehofft hast.
Dieser Guide leistet zwei Dinge: Erstens zeigt er dir eine Methode namens „Vibe Creating“, die das Gefühl, das du nicht benennen kannst, in eine Sprache übersetzt, mit der ein Modell tatsächlich arbeiten kann. Zweitens bietet er dir eine Methode ohne Einrichtungsaufwand, um das selbst zu testen und dein erstes Video mit genau diesem „Gefühl“ in unter zehn Minuten zu erstellen.
Was ist Vibe Creating und warum verbessert es deine Prompts?
Vibe Creating ist die Praxis, das gewünschte emotionale Ergebnis zu beschreiben und es durch eine Methode in die konkreten filmischen Entscheidungen übersetzen zu lassen, die dieses Gefühl erzeugen. Du bestimmst das „Was ich fühlen will“. Die Methode kümmert sich um das „Wie man das dreht“.
Wenn dir die Formulierung bekannt vorkommt, ist das Absicht. Anfang 2025 prägte Andrej Karpathy den Begriff „Vibe Coding“, um einen Workflow zu beschreiben, bei dem man aufhört, Code Zeile für Zeile zu schreiben, und stattdessen die Absicht gegenüber einem Modell beschreibt, das dann die Implementierung generiert (Vibe coding, Wikipedia, Februar 2025). Der Begriff verbreitete sich so schnell, dass Collins ihn zum Wort des Jahres kürte. Vibe Creating überträgt diesen Wandel auf Video. Du hörst auf, Brennweiten mikrozumanagen, und beginnst, das Erlebnis zu beschreiben.
Hier ist die Falle, in die die meisten Prompts tappen. Wenn du willst, dass eine Szene gefährlich wirkt, tippst du instinktiv „gefährliche Atmosphäre“. Das Modell erhält fünf abstrakte Wörter und liefert dir die Zutaten der Gefahr: einen Roboter, eine Waffe, einen dunklen Himmel. Alle Zutaten sind da, und du fühlst: nichts. Der Ausdruck war zu abstrakt, um auf einen spezifischen visuellen Mechanismus zu zeigen.
Vibe Creating generiert nicht sofort. Zuerst wird erarbeitet, was das Gefühl der Gefahr tatsächlich erzeugt, dann wird der Prompt als „gefühltes Bild“ geschrieben, nicht als Parameterliste. Dieser Unterschied ist die ganze Methode. Der Rest dieses Tutorials führt dich durch fünf echte Beispiele.
Vibe Creating Tutorial Fall 1: Wie „Gefahr“ zur Kamerabewegung wird
Beginnen wir mit dem Eröffnungsbild eines viralen KI-Kurzfilms: ein Roboter-Cowboy, der durch eine Zombie-Stadt wandert. Die Handlung passt in einen Satz, aber dein Puls beschleunigt sich mit der Kamera. Die erste Einstellung platziert einen Pistolenlauf direkt vor die Linse, und dein Unterbewusstsein empfängt eine einzige Botschaft: Du bist jetzt in Gefahr.
Du versuchst, die Szene nachzubauen. Tippe „gefährliche Atmosphäre“ und du erhältst die Requisiten der Gefahr ohne das Grauen.
Vibe Creating analysiert drei Dinge gleichzeitig:
- Fixiere das Auge auf den Pistolenlauf und verschwimme den Hintergrund. Das ist die Aufgabe einer geringen Schärfentiefe.
- Gib dem Zuschauer das Gefühl, zu knien und zu einer Waffe aufzublicken, die auf ihn gerichtet ist. Das ist die Aufgabe einer niedrigen Kameraperspektive (Low Angle).
- Schiebe den Lauf fast aus dem Bild und direkt in dein Gesicht. Das ist die Aufgabe einer leichten Weitwinkelverzerrung.
Das ist der entscheidende Punkt. Was letztlich in den Prompt wandert, ist nicht „geringe Schärfentiefe, Low Angle, Weitwinkelverzerrung“. Das sind die technischen Mechanismen. Was geschrieben wird, ist das gefühlte Bild, das diese Mechanismen erzeugen. Vibe Creating übersetzt professionelle Technik in etwas, das sowohl ein Modell als auch ein Mensch sofort begreift. Drei Effekte greifen ineinander, dein Unterbewusstsein registriert „Du bist in Gefahr“, und dein bewusster Verstand denkt nur: „Was für eine großartige Aufnahme.“
Das ist das Wesen von Atmosphäre. Die Information reist durch den Kanal des Unterbewusstseins und umgeht deine Vernunft. Vibe Creating ist der Übersetzer, der diesen Kanal baut. Du sagst, was du willst. Er erarbeitet, wie man es filmt.
Vibe Creating Tutorial Fall 2: Ein Garten, der absichtlich „falsch“ wirkt
Ein schwierigeres Gefühl. Das war alles, was in meinem Kopf war, als ich den Generator öffnete:
Ein Mädchen mit silbernem Haar in einem Kleid aus Kristallgaze, das in einem Garten vor einer nordischen Holzhütte unter einem brennenden Sonnenuntergangshimmel steht. Jedes Bild ist wunderschön, doch etwas signalisiert leise, dass es nicht sicher ist.
Ich wusste ehrlich nicht, wie man „unsicher“ erzeugt. Vibe Creating drückt es als eine Art Rezept aus: Schönheit + 30 % Uncanny Valley + rituelle Requisiten + voyeuristische Kamera + unpassende Lichtquelle = das Böse unter einer märchenhaften Fassade.
Jeder Begriff in diesem Rezept ist ein Parameter, der in einem Prompt sofort funktioniert. Das einzige Problem ist, ob du ihn abrufen, beschreiben und das Modell dazu bringen kannst, ihn zu verstehen, in dem Moment, in dem du dich hinsetzt. Wenn nicht, ist das genau die Aufgabe, die dir Vibe Creating abnimmt. Es schnappt sich diesen vagen Satz und schreibt das Rezept für dich.
Beachte, wie die Kamera niemals den Körper des Monsters zeigt, sondern nur die Augen, ein Gliedmaß und die schwankenden Schatten. Diese Zurückhaltung ist eine bewusste Übersetzung von „unsicher“. Sie ist für ein Modell auch viel einfacher zu rendern als eine komplette Kreatur, was mit ein Grund dafür ist, dass das Ergebnis so sauber ist.
Vibe Creating Tutorial Fall 3: KI-Video wie einen Kinotrailer wirken lassen
Zeige das nächste Beispiel einem Filmkenner, ohne die Quelle zu nennen, und er wird wahrscheinlich auf den Trailer eines Ballettfilms tippen. Es ist eine einzige, ungeschnittene Generierung. Keine Bearbeitung, kein Color Grading.
Die Absicht war: „Gib mir Trailer-Textur“ für eine junge Tänzerin hinter den Kulissen eines Theaters, das kurz vor der Show lebendig wird. Wenn du „Trailer-Textur“ an Vibe Creating übergibst, läuft die Logik so:
Die Eröffnung hinter den Kulissen ist kein Selbstzweck, sondern eine Erzählstrategie. Der Weg aus dem dunklen, unordentlichen Backstage-Bereich zur beleuchteten Bühne wurde sowohl in „Black Swan“ als auch in „The Red Shoes“ genutzt. Der Weg zur Bühne ist selbst eine Metapher für das Schicksal. Das Modell rendert nicht nur das Bild, es rendert das Block-Design.
Drei Variablen müssen gleichzeitig stimmen: der Winkel der Bodenreflexion, die Richtung der Schatten und die subtile Verzögerung in der Bewegung. Wenn nur eine falsch ist, zerfällt die traumartige Qualität zu Aufnahmen einer Überwachungskamera.
Der Moment, in dem sich die Blicke treffen, nutzt Hollywoods Standardvorlage für „der Moment, in dem Liebe entsteht“: seitliches Gegenlicht, das ihre Konturen nachzeichnet, Hintergrundlampen, die zu Bokeh verschmelzen, geringe Schärfentiefe, die die Welt wegdrängt, bis nur noch zwei Menschen bleiben. Es beweist eines: Die Leistungsgrenze dieser Modelle erreicht bereits Kinotrailer-Niveau. Was dich zurückhält, war nie das Modell. Es ist der Prompt.
Vibe Creating Tutorial Fall 4: „Einsamkeit“ in Bilder übersetzen
Dies ist ein einzelnes abstraktes Wort, und zu beobachten, wie es entpackt wird, ist der nützlichste Teil dieses Tutorials. Der Clip zeigt eine Astronautin auf einem fremden Planeten, die sich an glückliche Fragmente ihres Lebens auf der Erde erinnert. Du fühlst dich, als stündest du neben ihr. Wie?
Vibe Creating weigert sich, das Wort „einsam“ einfach nur zu rendern. Es entpackt die Abstraktion automatisch in eine Kette konkreter Entscheidungen. Hier ist die Übersetzungstabelle:
| Was du gesagt hast | Was es dazu übersetzt hat |
|---|---|
| Einsam | Ein gewaltiger Größenkontrast: eine winzige Person vor einem riesigen schwebenden Objekt; die eigene Bedeutungslosigkeit vor etwas Enormem |
| Einsam | Ein graublaues, kontrastarmes Ödland mit einem grausam sauberen Horizont – eine Umgebung, die selbst „hier ist niemand“ schreit |
| Einsam | Eine Hand, die versucht, Lichtstrahlen zu berühren, weil Einsame selbst in Dingen, die nur aus Licht bestehen, nach Verbindung suchen |
| Einsam | Jede Erinnerung im Licht ist menschliche Verbindung: eine mütterliche Hand, ein rennendes Kind, eine Großmutter beim Blumen gießen |
| Einsam | Erinnerung in warmem Gold, Realität in kaltem Grau; Farbtemperatur als die zwei Enden einer Emotion |
| Einsam | Der letzte Frame: Sie steht allein in der Mitte, den Blick direkt in die Kamera |
Die Methode versteht etwas, das jeder Schreibkurs lehrt, aber niemand zu nutzen weiß: Einsamkeit ist nicht Leere. Einsamkeit ist, sich noch daran zu erinnern, wie Wärme aussah. Du gibst ein Wort. Es gibt eine Struktur aus Bildern zurück, die dieses Wort tatsächlich trägt.
Vibe Creating Tutorial Fall 5: Der A/B-Test, der den Punkt beweist
An dieser Stelle kommt ein berechtigter Einwand: Wenn ich einfach einen professionelleren Prompt schreibe, brauche ich das dann überhaupt? Hier ist der kontrollierte Test, und das Ergebnis ist der stärkste Beweis in diesem Tutorial.
Eingabe Gruppe A. Eine produktionsreife Shotlist. Einstellungsgrößen definiert, Kamerabewegungen spezifiziert, Zeitcodes, Sounddesign, alles. Drei Einstellungen: ein kleines Mädchen in einer verregneten Gasse zögert, springt in eine Pfütze, Wasser explodiert, sie bricht in Lachen aus. Auf dem Papier ist die Geschichte vollständig und das Dokument könnte direkt an ein Filmteam gehen.
Ergebnis Gruppe A. Das nasse Kopfsteinpflaster, der Nebel, die Reflexionen – alles war da. Die technischen Parameter wurden ausgeführt. Aber zwei Dinge scheiterten:
- Die Anweisung „ein Paar Gummistiefel kommt langsam ins Bild“ wurde buchstäblich als ein Paar leerer Stiefel gerendert, die allein in der Gasse stehen, während eine Gestalt durch den Nebel dahinter treibt. Die Shotlist wollte „gemütlich und kindlich“. Das Ergebnis war der Beginn eines Horrorfilms.
- Der emotionale Bogen löste sich auf. Das Gesicht des Mädchens zeigte nur Tränen. Der Fortschritt von Zögern, Entschlossenheit, Ausbruch und Lachen war verschwunden.
Eingabe Gruppe B. Dieselbe Shotlist, Vibe Creating zur Überarbeitung gegeben. Die Methode fügt nichts hinzu. Sie entfernt Rauschen. Ihre Logik: Dieses Dokument ist im reinen Ausführungsstil geschrieben, aber darunter liegt eine vollständige emotionale Erzählung. Behalte den Dreiklang: Annäherung an die Pfütze, innerer Kampf, plötzlicher Ausbruch. Lösche die technischen Begriffe, Einstellungsgrößen und Zeitcodes. Behalte Details mit emotionalem Gewicht: gelbe Stiefel, nasser Stein, Sprung, die erschrockene Katze, Lachen und feuchte Augen. Übersetze das Sounddesign in natürliche, erfahrungsbasierte Sprache. Der überarbeitete Prompt liest sich so:
Es hat gerade aufgehört zu regnen. Kalter Nebel zieht noch durch die alte Gasse, Pfützen bedecken den Kopfsteinpflasterweg und spiegeln die verwitterten, mit Moos bewachsenen Mauern wider. Ein Paar viel zu große, leuchtend gelbe Gummistiefel tritt langsam ins Bild. Ein kleines Mädchen nähert sich vorsichtig der größten Pfütze und hält inne, senkt den Kopf und starrt auf die zitternde Spiegelung unter ihr. Die Luft ist erfüllt vom hohlen Klang des Windes, dem gelegentlichen Tropfen von den Dachrinnen und dem leisen Quietschen ihrer Stiefel auf dem nassen Stein. Sie starrt in die Pfütze, dann auf ihre Stiefel, die Augenbrauen fest zusammengezogen, die Lippen leicht gepresst – als stünde sie in einem feierlichen, kindlichen Duell mit sich selbst. Sie will springen, zögert aber im letzten Moment. Ihr Atem wird flach und schnell, und alles um sie herum scheint plötzlich zu verblassen, bis nur noch diese angespannte Erwartung bleibt – das Gefühl, nur einen Atemzug vom Sprung entfernt zu sein, kurz davor, den Mut zu finden. Im nächsten Moment flutet Entschlossenheit durch sie. Sie schlägt beide Füße zusammen und springt in die Pfütze. Das Wasser explodiert gen Himmel, zersplittert in helle Lichtsplitter. Neben ihr schreckt eine orangefarbene Katze, die döste, panisch auf und flüchtet auf eine höhere Mauer. Als der Spritzer abklingt, steht das Mädchen inmitten der verstreuten Wassertropfen auf dem Stein, hebt den Kopf und bricht in Lachen aus – klar, brillant, völlig ungehemmt –, ihre Augen glänzen leicht vor Tränen, als wäre die regengewaschene Welt gerade durch ihre eigenen Hände erleuchtet worden.
Kein einziger technischer Begriff. Aber während du es gelesen hast, hat sich die Szene bereits in deinem Kopf abgespielt. Das Modell liest es genauso.
Ergebnis Gruppe B. Ein kleines Mädchen mit Zöpfen in gelben Stiefeln, das an der Pfütze anhält, eine Nahaufnahme des Zögerns mit gerunzelten Brauen, dann das Aufschlagen, das Wasser, die aufgeschreckte Katze, das Lachen mit feuchten Augen. Der emotionale Bogen blieb intakt.
| Dimension | Gruppe A: Technische Shotlist | Gruppe B: Vibe Creating Rewrite |
|---|---|---|
| Prompt-Form | Vollgepackt mit Technik-Jargon | Eine atmende emotionale Erzählung |
| Lesart des Modells | Die Hälfte ist Rauschen | Alles ist Bild und Emotion |
| Fehlerbild | Leere Stiefel stehen gruselig in der Gasse | Keines |
| Emotionaler Bogen | Kollabiert zu vagem „Traurig“ | Zögern, Ausbruch, Erlösung – alles da |
| Details | Verloren | Katze und feuchte Augen blieben erhalten |
Die Lektion ist klar: Mehr technische Details halfen nicht. Sie schadeten, weil das Modell durch das Rauschen kämpfen musste.
Wie du dein erstes Vibe Creating-Projekt in drei Schritten startest
Du musst kein Prompt-Engineering lernen. Der gesamte Workflow besteht aus drei Schritten.
Schritt 1: Lehre deinen KI-Assistenten den Skill. Kopiere den vollständigen „Vibe Creating Skill“ am Ende dieses Artikels und füge ihn in deinen bevorzugten KI-Assistenten ein. Claude Code, Codex oder jeder Chat-Bot funktionieren. Keine Installation, keine Konfiguration. Er liest ihn einmal und kennt ihn.
Schritt 2: Beschreibe das Gefühl in einfachen Worten. Alles funktioniert. Ein Wort, wie „Freiheit“. Ein Satz, wie „Ich will diese Energie vom Intro von Love Death and Robots“. Oder eine vage Stimmung, wie „Habe heute den Sonnenuntergang gesehen und wollte plötzlich etwas filmen, kann nicht sagen was“. Der Skill bestimmt die atmosphärische Kategorie und erstellt für dich den perfekten Prompt: Kamera, Licht, Farbe, Tempo, Requisiten, Referenzstil.
Schritt 3: Rendere es dort, wo es wirklich läuft. Kopiere den Prompt, füge ihn in ein Videomodell wie Seedance 2.0 ein und generiere.
Die Beispielvideos in diesem Tutorial wurden mit Seedance 2.0 auf Atlas Cloud generiert. Seedance 2.0 ist das Audio-Video-Modell von ByteDance, das bis zu 15 Sekunden synchronisiertes Filmmaterial aus Text- und Bildeingaben erzeugt. Es passt perfekt, weil Gesichter stabil bleiben und Emotionen halten – genau das, wo ein „Vibe“-Video steht oder fällt.
Der vollständige Vibe Creating Skill (kopieren und nutzen)
plaintext1--- 2name: vibe-creating-prompt 3description: Entscheide, ob eine






