Es sind gute Nachrichten, die DALL-E von OpenAI für alle parat hat, die über das Tool gern mithilfe von KI Bilder erstellen. Denn diese Bilder können inzwischen einfach mit Text-Prompts verändert werden. Das dürfte sich als hilfreiches Update erweisen, weil die ersten Ergebnisse von KI-Bildgenerierungs-Tools oft noch nicht genau den Vorstellungen der Prompter entsprechen. So wird mit einem kurzen Prompt der Gesichtsausdruck im Bild unmittelbar verändert, wie der App Researcher Saadh Jawwadh auf X zeigt.

You can now edit images with text prompts in DALL·E

This tool is also available in the mobile and web ChatGPT apps as well as the dedicated DALL·E site. pic.twitter.com/yvandN2gJC

— Saadh Jawwadh (@SaadhJawwadh) April 2, 2024

Auch ChatGPT ermöglicht die DALL-E-Bildbearbeitung

Die Inpainting genannte Funktion von DALL-E 3 ist für ChatGPT User ebenfalls verfügbar. Die Bearbeitung erfolgt auch dort über einen Pinselstrich, der den Bereich markiert, welcher angepasst werden soll. Mit einem Prompt können die Nutzer:innen dann die Anpassung beschreiben. Diese wird direkt ins Bild integriert – allerdings nicht immer ganz gemäß dem Prompt, wie der KI-Experte Jens Polomski auf LinkedIn anführt. Er kann die Funktion bereits nutzen und demonstriert in seinem Post, wie sie funktioniert und welche Schwachstellen sie noch hat.

Obwohl diese Bildbearbeitungsfuntion zur simplen Erstellung und Anpassung von KI-generierten Visuals hilfreich ist, stellt sie nur ein Update aufseiten von OpenAI dar. Denn andere Unternehmen haben solche Editing Features längst integriert. Midjourney bietet eine ähnliche Funktion, Meta arbeitet an Emu Edit, das ebenfalls mit Texteingaben funktioniert, und Adobe hat 2023 mit dem Project Stardust bereits eine facettenreiche Bildbearbeitung vorgestellt, während mit dem neuen GenStudio und Firefly-Funktionen umso mehr KI-Bildbearbeitung ermöglicht werden. Allein die Funktion Structure Reference dürfte in diesem Kontext vielen Creatorn und Marketern helfen.

Adobe Firefly, Structure Reference, © Swantje Schemmerling (eigene Aufnahme)

Die experimentelle Technologie namens DragGAN wiederum – entwickelt vom Max Planck Institute for Informatics, dem Saarbrücken Research Center for Visual Computing, Interaction and AI, dem MIT, der University of Pennsylvania und Googles AR/VR Team – lässt User Bilder an ausgewählten Stellen in Sekundenschnelle verändern und sogar Positionsänderungen vornehmen. Im Beitrag findest du noch mehr Hinweise auf KI-Bildbearbeitungs-Tools von Canva, Microsoft und Co.

DALL-E 3 ist inzwischen für viele Nutzer:innen umfassend verfügbar. Auch die noch jungen Copilot Apps für Android und iOS haben DALL-E 3 Support erhalten.

DALL-E 3 ist da und kommt zu ChatGPT
– endlich KI-Bilder genau wie im Text

© OpenAI

Technologie

Leave a Reply

Your email address will not be published. Required fields are marked *