Chiphersteller Nvidia soll für das KI-Training heimlich Unmengen an Videos genutzt haben – unter anderem von YouTube und Netflix. Das geht aus internen Dokumenten des Unternehmens hervor. Mitarbeiter haben sich in puncto Urheberrecht jedoch Bedenken geäußert. 

Nvidia soll heimlich große Mengen an Videos von YouTube, Netflix und Co. für das KI-Training genutzt haben. Das geht aus einem Bericht von 404 Media unter Berufung auf interne Dokumente hervor. Die Operation hat demnach unter dem Codenamen „Cosmos“ stattgefunden.

KI-Training: Nvidia nutzt heimlich YouTube- und Netflix-Videos

Dem Bericht zufolge wurden Nvidia-Mitarbeiter via Slack und per E-Mail dazu angewiesen, mithilfe von automatisierter Programme, Millionen Videos zu downloaden. Ming-Yu Liu, Vizepräsident der Forschungsabteilung von Nvidia und Leiter des Cosmos-Projekts, hätte im Mai 2024 dazu in einer E-Mail geschrieben:

Wir sind dabei, die v1-Datenpipeline fertig zu stellen und die notwendigen Rechenressourcen zu sichern, um eine Videodatenfabrik zu bauen, die pro Tag Trainingsdaten im Wert einer menschlichen Lebenserfahrung liefern kann.

Laut einem ehemaligen Angestellten, der anonym bleiben wollte, habe Nvidia seine Mitarbeiter dazu aufgefordert, unter anderem Videos von Netflix und nutzergenerierte Videos von YouTube zu scrapen.

Diese und weiter Videoinhalten seien anschließend genutzt worden, um ein KI-System für Nvidias Omniverse 3D-Weltgenerator, „digitale menschliche“ Produkte und selbstfahrende Autosystem zu trainieren. Das Projekt wurde bis dato noch nicht für die Öffentlichkeit freigegeben.

Urheberrecht: Nvidia-Mitarbeiter äußern Bedenken

Den internen Nachrichten zufolge hätten einige Nvidia-Mitarbeiter Bedenken hinsichtlich des Vorgehens geäußert. Sie sollen vor allem die ethische Verwendung hinsichtlich des Urheberrechts kritisiert haben. Die verantwortlichen Projektmanager hätten diese Bedenken laut 404 Media jedoch abgetan.

Vielmehr habe eine „umfassende Genehmigung“ der Führungsetage vorgelegen. Nvidia soll wiederum erklärt haben, dass das Projekt „in voller Übereinstimmung mit dem Wortlaut und dem Geist des Urheberrechtgesetzes“ stünde. Demnach seien lediglich Ausdrucksformen, nicht aber Fakten oder Ideen geschützt.

Der Bericht kommt zu einer Zeit, in der das Thema KI-Training und Urheberrecht eine immer größere Rolle spielt. Reddit hatte kürzlich etwa zahlreiche Suchmaschinen blockiert, damit diese nicht ihre KI-Systeme mit entsprechenden Foreninhalten trainieren können. Reddit-Content wird seither lediglich auf Google angezeigt, da das Unternemen dafür bezahlt.

Auch interessant: 

Überwachung durch KI: Deutschland braucht ein Beschäftigtendatenschutzgesetz
Viel Unklarheit: AI Act tritt in Kraft – und ändert erstmal gar nichts
Dollar oder Daten: Was ist eigentlich Pay or Okay?
Neue Mindestgeschwindigkeit: „Recht auf schnelles Internet“ soll ausgebaut werden

Der Beitrag Nvidia: Heimliches KI-Training mit Videos im Wert eines Menschenlebens pro Tag von Fabian Peters erschien zuerst auf BASIC thinking. Folge uns auch auf Facebook, Twitter und Instagram.

Blog

Leave a Reply

Your email address will not be published. Required fields are marked *