Was bislang professionelle Kamerateams, Motion-Designer und Post-Production erforderte, wird nun in Sekunden von einem neuen KI-Modell umgesetzt. Mit Veo 2, Googles jüngster Entwicklung im Bereich der generativen Videotechnologie, können Abonnent:innen von Gemini Advanced sowie Google One AI Premium kurze, visuell hochwertige Clips direkt aus Textbeschreibungen generieren. Ein Beispiel, das Google auf X teilt, macht das Potenzial greifbar.

Dive into video creation with @GeminiApp — rolling out today.

Transform text prompts into cinematic 8-second videos with Veo 2 in Gemini Advanced. Select Veo 2 from the model dropdown menu to get started.

Prompt: Write the word “GOOGLE” out of skydiving parachutes opening up pic.twitter.com/IHTmhELUut

— Google (@Google) April 15, 2025

Veo 2 steht ab sofort weltweit für zahlende User zur Verfügung und ist direkt im Dropdown-Menü der Gemini App auswählbar. Parallel dazu verkündet Google Labs die Einführung von Whisk Animate – einem neuen Feature, das es Nutzer:innen ermöglicht, generierte Bilder in animierte Clips zu verwandeln. Allerdings ist es bislang Usern außerhalb der EU vorbehalten; wann ein globaler Roll-out stattfindet, bleibt abzuwarten.

Whisk Animate is now available globally to Google One AI premium subscribers!

With Veo 2, turn your Whisk-generated images into vivid eight-second animated clips – perfect for reimagining your images in different styles or bringing new ideas to life. pic.twitter.com/j7GZ3rZ7sh

— Google Labs (@GoogleLabs) April 15, 2025

Beide Anwendungen basieren auf Veo 2 und bieten unterschiedliche Einstiegspunkte in die KI-gestützte Videoerstellung: einerseits prompt-basiert via Gemini, andererseits visuell-bildbasiert via Whisk. Zwei Tools, zwei kreative Workflows – beide mit Veo 2 im Herzen. Doch was genau steckt hinter dem Veo-2-Modell, das Google CEO Sundar Pichai als „big leap forward for video gen“ bezeichnet? Und wie positioniert sich Google im Wettbewerb mit Adobe, OpenAI und weiteren Akteur:innen im zunehmend dynamischen Markt für generative Videotechnologie?

Google und generative KI-Suche:
Müssen wir SEO völlig neu denken?

© Google via Canva

Von der Vision zum Video: Was Veo 2 leisten kann

Veo 2 ist Googles neuestes High-End-Videomodell für generative Künstliche Intelligenz und ab sofort über Gemini Advanced verfügbar – Googles KI-Angebot für zahlende Nutzer:innen.

1/ Today, Veo 2, our state-of-the-art video model, is rolling out to Gemini Advanced + Whisk!

You can create 8s, high-res videos from text prompts in @GeminiApp with fluid character movement + lifelike scenes across a range of styles. Tip: the more detailed your description, the… pic.twitter.com/bcGNIOWzrr

— Sundar Pichai (@sundarpichai) April 15, 2025

In Kombination mit der ebenfalls KI-gestützten Bildplattform Whisk können Nutzer:innen somit nicht nur Text-to-Video-Generierung nutzen, sondern auch Bilder in kurze, animierte Clips verwandeln.

2/ Plus, you can try Veo 2 using Whisk from @GoogleLabs.

Just input images, blend them together, and – now – “animate” to bring your creation to life. Here’s a claymation of Jeffree joining me mid-innings:) Available for all Google One AI Premium subscribers today. pic.twitter.com/5oAG5Q6rxl

— Sundar Pichai (@sundarpichai) April 15, 2025

Die Ergebnisse sind auf bis zu acht Sekunden begrenzt, aber in puncto Qualität und Stilvarianten lässt Veo 2 aufhorchen: Flüssige Bewegungen, realitätsnahe Szenen und eine gute physikalische Logik der Animationen machen es möglich, dass Charaktere glaubwürdig handeln – egal ob als Claymation-Figur oder in realistischer Umgebung. Wer bereits ein Google One AI Premium-Abo hat, kann Veo 2 direkt im Gemini-Menü auswählen. Das Modell versteht laut Google nicht nur Bewegung, sondern auch kreative Details in Prompts immer besser – was insbesondere im Marketing-Kontext eine entscheidende Rolle spielt. Denn: Je präziser die Eingabe, desto filmreifer das Ergebnis.

Noch nicht in Europa, aber schon im Rennen

Whisk Animate ist bisher nur außerhalb der EU verfügbar. Der internationale Roll-out folgt damit einem bekannten Google-Muster – schnell, ambitioniert, aber nicht synchron mit europäischen Datenschutzstandards. Für Nutzer:innen in Europa heißt das vorerst: abwarten, während andere bereits experimentieren. Dennoch positioniert sich Veo 2 klar als ernstzunehmender Gegenpol zu anderen Schwergewichten der KI-Videogenerierung – etwa Adobe Firefly oder OpenAIs Sora. Beide gelten als maßgebliche Treiber:innen im Rennen um die Zukunft von KI-generierten Bewegtbildern, verfolgen aber unterschiedliche Ansätze. In einem Übersichtsartikel stellen wir dir beide Modelle vor.

Adobe Firefly oder OpenAI Sora?
Das beste KI-Tool für deine Videos

Startbildschirm von Adobe Firefly, © Adobe via Canva

Adobe hat kürzlich ein neues Firefly Videomodell vorgestellt – aktuell noch im Betastadium, aber mit einem starken Fokus auf kreative Kontrolle, stilistische Vielfalt und professionelle Workflows.

Auf Threads ansehen

Die hauseigene Forschungsabteilung bezeichnet Firefly Video bereits als „breakthrough“ für Creator. Der Fokus liegt dabei klar auf professionellen Design und Content Teams, die generative KI gezielt in bestehende Workflows integrieren wollen – etwa im Zusammenspiel mit Tools wie Premiere Pro oder After Effects. Adobe verfolgt damit einen produktionsnahen Ansatz, der sich deutlich vom kreativen Explorationsraum bei Google Labs unterscheidet.

OpenAIs Sora wiederum bleibt vorerst ein faszinierendes Versprechen: Die Anfang des Jahres veröffentlichten Demovideos sorgten für enorme Aufmerksamkeit in der Tech-Community. Ein öffentlicher Zugang zum Modell steht bislang jedoch aus. Zwar beeindruckt Sora mit realitätsnahen Sequenzen und komplexen Szenenkompositionen, doch mangels Transparenz bleibt es für viele Marktteilnehmer:innen aktuell eine Black Box.

Neben den großen Namen drängen auch kleinere, hochspezialisierte Anbieter:innen in den Markt: So etwa Evolving AI, deren Modell Kling 2.0 zuletzt mit besonders flüssigen Bewegungsabläufen und physikalisch stimmigen Simulationen für Aufsehen sorgte.

Auf Threads ansehen

Solche Entwicklungen zeigen: Der Wettbewerb wird nicht nur schneller, sondern auch vielfältiger – und fordert etablierte Akteur:innen zunehmend heraus.

Kurz, cineastisch, KI-generiert: Was Marketer jetzt über Videogenerierung wissen sollten

Für Content Teams, Marken und Agenturen zeichnet sich ein klarer Trend ab: Video-Content auf Basis von Text- und Bild-Inputs wird nicht nur leichter zugänglich, sondern zunehmend strategisch relevant. Tools wie Veo 2 und Whisk Animate könnten Produktionsprozesse beschleunigen, Social-Media-Formate transformieren und neue Wege der visuellen Kommunikation eröffnen – vorausgesetzt, regulatorische Hürden wie der eingeschränkte EU-Zugang werden mittelfristig überwunden. Besonders für das Marketing bedeutet das: Prompt-Kompetenz wird zur Schlüsselqualifikation. Google selbst empfiehlt Nutzer:innen, möglichst präzise und detailreiche Prompts zu formulieren. Denn je klarer die Anweisung, desto überzeugender das Ergebnis. Das verändert nicht nur kreative Prozesse, sondern auch die Art und Weise, wie Texte künftig gedacht und geschrieben werden – weg vom klassischen SEO-Text, hin zum durchdachten KI-Skript.

Ob ein Fallschirmschriftzug oder eine surreale Traumlandschaft: Veo 2 demonstriert, wie nah wir der KI-gestützten Videorevolution bereits sind – zumindest technisch. Die hohe Qualität, die Geschwindigkeit der Umsetzung und die stilistische Bandbreite setzen neue Maßstäbe für digitales Storytelling. Und Google bringt sich mit Gemini, Veo 2 und Whisk klar in Stellung: als kreative Infrastruktur für eine Zukunft, in der aus Ideen bewegte Bilder werden – in Sekunden statt in Produktionszyklen.

Blog

Leave a Reply

Your email address will not be published. Required fields are marked *