Basierend auf dem Text-Encoder von Gemma 2 stellte Google ein neues KI-Bildgenerierungsmodell vor. Lumina-Image 2.0 vereint die KI-Kernkompetenzen der offenen KI-Modelle von Gemma, für die Google im Sommer 2024 die Modellvarianten von Gemma 2 für Entwickler:innen und Researcher launchte, mit der für auf das Visuelle ausgerichtete AI-Learning-Modell von FLUX.

Check out Lumina-Image 2.0 an efficient, unified, and transparent image generative model built with Gemma 2’s text encoder and FLUX’s VAE pic.twitter.com/rELXwSAGNh

— Google AI Developers (@googleaidevs) February 10, 2025

Mithilfe dieses neuen multilingualen Modells können Developer die KI-Bildgenerierung weiter optimieren. Die ersten Ergebnisse zeigt der Google AI Developers Account im X Post. Über die Entwickler:innenplattform Hugging Face können Interessierte auf Lumina-Image 2.0 von Alpha-VLLM zugreifen.

It’s a great example of how vision models, and more, can be built on top of Gemma 2’s text encoder. pic.twitter.com/0jAl8ALCbl

— Google AI Developers (@googleaidevs) February 10, 2025

Dabei dient Gemma 2 als Text-Encoder, während FLUX den Variational Autoencoder, also ein generatives KI-Modell zum Reorganisieren von Input-Daten und Ausgeben von möglichen Variablen – was bei Bildern besonders wichtig ist. Der KI-Bildgenerator FLUX von Black Forest Labs sorgte 2024 für viel Aufsehen und hat inzwischen den Funktionsumfang deutlich optimiert.

Viraler KI-Bildgenerator FLUX stellt 1.1 [pro] vor:

Schneller, besser, günstiger

© Black Forest Labs via Canva

Blog

Leave a Reply

Your email address will not be published. Required fields are marked *