Für AI Startups könnte es künftig immer schwerer werden, User für ihre Tools und Features zu generieren. Denn die großen Tech Player wie Microsoft, Google, Meta und Co. sowie etablierte AI-Unternehmen wie OpenAI und Runway kommen mit immer neuen und immer öfter direkt auf relevanten Plattformen integrierten Lösungen daher. Die Möglichkeit, auf LinkedIn mithilfe des Microsoft Designer Tools unmittelbar bei der Erstellung eines Newsletters ein KI-Titelbild zu generieren, ist dabei nur ein Beispiel für die im Kreationsprozess nützlichen Neuerungen.
Neue AI Features und bahnbrechende KI-Visuals – von Microsoft bis Runway
Die Tech-Expertin Lia Haberman, deren Substack Newsletter „ICYMI“ auf der „Best Newsletters of 2023“-List von Buffer gelandet ist, berichtet auf Threads von der neuen Funktion auf LinkedIn. Während wir selbst im Test noch nicht darauf zugreifen können, kann Haberman mithilfe des seit Sommer 2023 auf LinkedIn integrierten KI-Design-Tools Microsoft Designer direkt ein AI-Titelbild für ihren Newsletter kreieren. Für die LinkedIn Newsletter führte Microsoft Anfang 2023 diverse Updates wie Tagging-Optionen, Abonnement-Links und dergleichen ein; jetzt kommt noch mehr Support für den visuellen Bereich.
Lia Haberman schreibt, dass diese Art der KI-Tool-Integration [in Arbeitsprozesse auf großen Plattformen] AI Startups, die ähnliche Lösungen bieten, vor Probleme stellen könnte. Microsoft ist einer der Konzerne, die – nicht zuletzt aufgrund der engen Kooperation mit OpenAI – diverse KI-Funktionen in die eigenen Lösungen integrieren möchten. So wurde der Microsoft Designer als Unterstützung für die Umsetzung von Ideen in Designs in kurzer Zeit bereitgestellt.
Microsoft Designer can help turn your ideas into stunning designs, lightning fast, with AI. https://t.co/YaH0yDHPJc pic.twitter.com/HsqfJ9oqy2
— Yusuf Mehdi (@yusuf_i_mehdi) April 27, 2023
Design-Kreation im neuen Microsoft Designer, © Microsoft
Der Microsoft Designer setzt auf DALL-E 3 Support. Diesen bietet unter anderem auch Microsofts umfassende KI-Assistenz Copilot (zuvor Bing Chat), für die der Tech-Konzern kürzlich eine dedizierte App gelauncht hat.
Copilot App von Microsoft ist da:
DALL-E 3 und GPT-4 Support
Derzeit gibt es im AI-Kosmos jedoch noch weitere Entwicklungen für KI-Visuals, die Creatorn und Marketern mehr Spielraum für visuelles Storytelling ermöglichen.
Runway lässt dich Bilder bewegen, Meta und Berkeley verwandeln Audio in KI-Avatare
Im Kontext der KI-Features gibt es beinahe täglich Updates zu berichten. Schon seit einiger Zeit arbeitet Runway an immer neuen Funktionen, um KI-generierte Videos zu erstellen. Dazu gehört unter anderem die Option, allein mit Texteingaben Videos zu kreieren (etwa mit Gen-2).
Take control with advanced prompting for Text to Video.
Learn how with today’s Runway Academy. pic.twitter.com/geN1wy8On4
— Runway (@runwayml) January 5, 2024
Runway ermöglicht dank Gen-2 aber inzwischen sogar Bewegungsdarstellung ursprünglich unbewegter Bilder – die dann quasi zum Video avancieren. Dafür hat das Unternehmen Motion Brush entwickelt.
evolving.ai zeigt auf Threads ein konkretes Beispiel.
Das Zusammenspiel von Sprache, auch gesprochener, und KI-Produkten wird derweil von Meta und der Universität Berkeley auf ein anderes Level gehoben. Die Forscher:innen stellten KI-basierte Gestiken bei künstlich erstellten Avataren vor, die einzig auf Audioaufnahmen basieren.
Fotorealistische Gesten, KI-generiert auf Grundlage von Audiodateien, © Meta Reality Labs Research, University of California, Berkeley
Der KI-Experte Jens Polomski ordnet diese Entwicklung in einem ausführlichen Post auf LinkedIn ein.
Google, OpenAI und Co. sorgen für immer neue Potentiale im KI-Markt
Die KI-Landschaft entwickelt sich rasant, wer sich digital links und rechts umschaut, wird zahlreiche hilfreiche Tools und Features auch für die eigenen Prozesse entdecken. Für eine Vielzahl von Usern wird aber insbesondere die Einbettung von Funktionen in Dienste und auf Plattformen, die sie ohnehin nutzen, von Belang sein. Denn dann müssen diese keine Extraanmeldungen vornehmen, sich nicht eigens mit bestimmten Tools beschäftigen und können noch schneller kreieren und interagieren. Das ist der Gedanke hinter Microsofts Copilot App.
Google wiederum möchte mit Duet AI (vor allem im Business-Kontext) und dem KI-Bot Bard (als Pendant zu ChatGPT) sowie dem neuen mächtigen KI-System Gemini die Integration verschiedener AI Tools in den Alltag von Millionen oder gar Milliarden von Menschen vorantreiben. Kürzlich stellte das Unternehmen sogar eine Bard-Wunschliste für 2024 zusammen. Schon jetzt haben User unter anderem die Möglichkeit, den Bot in Kombination mit Diensten wie Maps, YouTube, Drive und Gmail zu nutzen. 2024 soll Bard Advanced mit Gemini Ultra noch komplexere Aufgaben lösen können.
Von den jüngsten KI-Updates profitieren aber nicht allein Nutzer:innen. Auch Creator von eigens erstellten und für andere hilfreichen GPTs können sich dank des für diese Woche angekündigten GPT Store Launches von OpenAI auf Monetarisierungs- und Verbreitungsmöglichkeiten freuen.