OpenAI: sCMs für schnellere Visual-Kreation, Journalismus-Push und Verstoß gegen das Copyright?

Für das inzwischen weltbekannte KI-Unternehmen OpenAI kommen derzeit umfassende Produktentwicklungen und heftige Kritik zusammen. Die Company stellte unter der Woche diverse relevante Updates für User vor, startete eine Kooperation mit dem Lenfest Institute of Journalism und Microsoft für die Förderung des Lokaljournalismus und setzte zwei neue Personen in der Führungsriege ein. Doch besonders die Kritik eines ehemaligen Angestellten sorgt für Furore: Er gibt gegenüber der New York Times an, das Unternehmen habe das Copyright für das Training von KI-Modellen vielfach verletzt. So resümiert Suchir Balaji:

This is not a sustainable model for the internet ecosystem as a whole.

Zwischen Vorwürfen und ganz großen Updates: OpenAI als branchentreibende Brand

Suchir Balaji war einige Jahre lang als AI Researcher für OpenAI aktiv und hat das Unternehmen im Sommer verlassen. Im Beitrag von NYT-Reporter und KI-Experte Cade Metz wird erläutert, dass er erst spät realisiert habe, inwieweit OpenAI das Urheber:innrecht viele Creator und Medien missachten könnte, um KI-Modelle zu trainieren. Er sei zu dem Schluss gekommen, Dienste wie ChatGPT würden das Internet als ökonomischen und fairen Raum bedrohen. Auch deshalb habe der das Unternehmen verlassen.

Former OpenAI researcher who helped gather data for what became ChatGPT says the company broke copyright law: https://t.co/p2VUXyQZQW

— Cade Metz (@CadeMetz) October 23, 2024

Balaji wirft dem Unternehmen vor, bei der Datengenerierung nicht ausreichend differenziert zu haben. Zunächst habe man Projekte wie Rechercheprojekte für die Wissenschaft behandelt. Dabei sei die Übernahme diverser Daten vergleichsweise unproblematisch gewesen, da sie keinen konkreten kommerziellen Zweck untergeordnet gewesen sei. Das habe sich geändert, als OpenAI mit ChatGPT-Abonnements etc. vor allem kommerzielle Ziele zu verfolgen begann. Nun widerspricht das Unternehmen Vorwürfen wie jenen von Suchir Balaji, die nicht zum ersten Mal auftauchen. Auch die New York Times selbst zählt zu den Entitäten, die bereits wegen Copyright-Verstößen gegen OpenAI klagten. Und bei der Datengrundlage für das KI-Videogenerierungsmodell Sora könnten YouTube-Videos von Creatorn ohne deren Zustimmung genutzt worden sein.

OpenAI aber sieht die Nutzung öffentlich verfügbarer Daten unter dem US-Prinzip des Fair Use und rechtlicher Präzedenzfälle als lauter an. Dabei wird besonders die Veränderung von Inhalten und Kontexten durch KI-Modelle hervorgehoben. Allerdings erklärt Balaji gegenüber der NYT:

There are occasionally circumstances where an output looks like an input. A vast majority of things generated by a ChatGPT or an image generation system do not draw heavily from a particular piece of content.

Nur eine umfassende Regulierung könne diese Probleme zwischen Rechtehalter:innen an Werken und Unternehmen, die KI-Modelle trainieren, lösen. Alternativ gibt es vielfach auch Lizenzvereinbarungen zwischen Plattformen und Tech-Unternehmen, die die Datennutzung legitimieren sollen.

sCMs für schnellere Bildgenerierung: Wieder ein neues Modell

Gerade die Aussage zu den Ähnlichkeiten von Output und Input passt gut zu einer neuen Entwicklung von OpenAI. Das Unternehmen stellte kürzlich die sogenannten sCMs vor. Dabei handelt es sich um Consistency Models, die die Visual-Generierung vereinfachen und beschleunigen sollen, besonders im Vergleich zu den bewährten Diffusion Models.

Introducing sCMs: our latest consistency models with a simplified formulation, improved training stability, and scalability.

sCMs generate samples comparable to leading diffusion models but require only two sampling steps. https://t.co/rHHSE95sjo

— OpenAI (@OpenAI) October 23, 2024

Anders als Diffusion Models benötigen die sCMs nur zwei Sampling-Schritte. Diffusion Models fügen Bilddateien, vereinfacht gesagt, Noise hinzu, eine Art visuelles Rauschen, das die Bilder zuerst deskonstruiert und eine Datenbasis auf Grundlage der Eingangsdaten schafft. Im umgekehrten Prozess, auch Denoising genannt, wird wieder ein Visual generiert, das den Eingangsdaten stark ähnelt. Es geht also um eine Art Variantenmodell. Mit dem Prozess gehen aber Probleme einher, wie OpenAI anmerkt:

[…] Current sampling approaches of diffusion models often require dozens to hundreds of sequential steps to generate a single sample, which limits their efficiency and scalability for real-time applications. Various distillation techniques have been developed to accelerate sampling, but they often come with limitations, such as high computational costs, complex training, and reduced sample quality […].

Deshalb bietet das Unternehmen mit sCMs neue Consistency Models, die bald schlichtweg schneller Content erstellen sollen können. Auch die Skalierung für große Datensets soll dann einfacher umzusetzen sein. Noch besteht jedoch die Hürde, dass die Modelle auf Diffusion Models als Lehrmodellen basieren und daher hinsichtlich der Qualität des Outputs noch nicht auf dem gewünschten Level sind.

Noch mehr Details zum neuen Modelltyp kannst du im Blog Post nachlesen. Möglicherweise können sCMs Creator und Unternehmen bald ebenso bei der Arbeit unterstützen wie die ChatGPT Apps und das neue Coworking Tool Canvas.

Endlich ChatGPT Windows Desktop App und ein Canvas Update

© OpenAI via Canva

Neue Tools und neue Pläne für OpenAI und die User

In der Tech-Welt vergeht kaum eine Woche ohne große Neuankündigung vonseiten OpenAIs. Jüngst wurde beispielsweise verkündet, dass zwei neue Personen zur Führungsriege dazustoßen. Scott Schools wird Chief Compliance Officer, Dr. Ronnie Chatterji wird Chief Economist.

We’re also excited to soon welcome Scott Schools as Chief Compliance Officer.

Scott will work closely with teams across OpenAI & collaborate with our Board of Directors, strengthening our efforts to thoughtfully drive & navigate the evolving landscape. https://t.co/On3P25bhlQ

— OpenAI Newsroom (@OpenAINewsroom) October 22, 2024

We’re excited to soon welcome Dr. Ronnie Chatterji as our first Chief Economist.

As Chief Economist, Dr. Chatterji will help build on our ongoing efforts to responsibly advance AI that benefits communities around the world. https://t.co/nMyQ3dMD2P

— OpenAI Newsroom (@OpenAINewsroom) October 22, 2024

Diese Neuigkeiten kommen direkt nach der Bekanntgabe zum Start des Lenfest Institute AI Collaborative and Fellowship Programs. Damit können Publisher wie Chicago Public Media, The Minnesota Star Tribune, Newsday (Long Island, New York), The Philadelphia Inquirer und The Seattle Times Finanzierungen erhalten und gleichzeitig den Einsatz von generativer KI für den Publishing-Alltag erproben.

We’re partnering with @LenfestInst and @Microsoft to explore how AI can drive innovation and business sustainability in local journalism through the Lenfest AI Collaborative and Fellowship. https://t.co/iPT6ZpLCtB

— OpenAI Newsroom (@OpenAINewsroom) October 22, 2024

Für Journalist:innen und User in Deutschland dürfte derzeit aber von größerem Interesse sein, dass der Advanced Voice Mode für ChatGPT endlich auch in der EU ausgerollt wird (für Plus User zunächst).

ChatGPT:

Advanced Voice Mode mit Emotionserkennung auch in Deutschland

October 24, 2024 Blog

OpenAI: sCMs für schnellere Visual-Kreation, Journalismus-Push und Verstoß gegen das Copyright?

Zwischen Vorwürfen und ganz großen Updates: OpenAI als branchentreibende Brand

sCMs für schnellere Bildgenerierung: Wieder ein neues Modell

Endlich ChatGPT Windows Desktop App und ein Canvas Update

Neue Tools und neue Pläne für OpenAI und die User

ChatGPT:

Advanced Voice Mode mit Emotionserkennung auch in Deutschland

Leave a Reply Cancel reply