Googles große AI-Wette wird aller Voraussicht nach schon bald um zentrale Möglichkeiten ergänzt, die der Alphabet-Tochter im Wettbewerb mit OpenAI, Meta und Co. einen enormen Vorteil verschaffen könnten. Im KI-Kontext lieferte Google zuletzt unter anderem automatisch erstellte Assets in mehr Märkten für Google Ads, ein immenses Update für den KI-Bot Google Bard – inklusive Bilder-Upload und Maps-Verknüpfung – sowie die aufsehenerregende Möglichkeit, KI-Bilder direkt in der Suchleiste zu generieren. Jetzt offenbart ein Leak, dass Google mit dem fortschrittlichen KI-Tool Stubbs für Furore sorgen und mit dem umfassenden Einsatz des AI-Modells Gemini die Leistungsfähigkeit all der eigenen KI-Lösungen deutlich optimieren könnte.
Google mit Mega-KI-Update:
AI-Bilder direkt in Suchleiste generieren und ungeahnter Prompting Hack
Google Stubbs: Tool für die MakerSuite revolutioniert App-Erstellung
Eine der geplanten KI-Neuheiten Googles nennt sich Stubbs. Davon berichtet der Entwickler Bedros Pamboukian auf Medium. Er bezieht sich auf einen Leak Googles und erklärt, dass Stubbs ein Tool ist, das direkt in Googles MakerSuite integriert werden soll. Dabei handelt es sich um eine Plattform, die Entwickler:innen Raum gibt, um mithilfe generativer KI Prototypen zu erstellen.
Pamboukian schreibt, dass Stubbs die Erstellung von App-Prototypen über Prompts erlauben. Dabei muss kein Code eingesetzt werden. In der MakerSuite können die User Stubbs aber nicht nur erstellen, sondern auch optimieren und direkt launchen. Zudem sollen die Nutzer:innen die Stubbs anderer Entwickler:innen einsehen können. Der Autor des Beitrags stützt seine Beobachtung mithilfe von Screenshots aus dem Stubbs Interface.
Eine offizielle Angabe zum Test oder gar zu einem Roll-out-Datum für das Tool Stubbs gibt es vonseiten Googles bisher nicht. Wird das Tool aber ausgerollt, könnte es den App-Kreationsprozess stark verändern und Entwickler:innen mehr Spielraum für ihre App-Ideen bieten. Auch Apple plant nach Informationen von Marc Gurman und Bloomberg, generative KI-Lösungen für die Developer-Umgebung Xcode zu optimieren. Das würde Entwickler:innen ebenfalls dabei unterstützen, neue Apps zu kreieren. OpenAI wiederum lieferte zuletzt einige Updates für Developer und wird am 6. November beim DevDay weitere verkünden.
Gemini soll GPT-4 übertrumpfen: Trainiert mit YouTube-Transkripten?
In seinem Bericht bezieht sich Bedros Pamboukian auch Googles KI-Modell Gemini. An Gemini sollen mehrere hundert Mitarbeiter:innen arbeiten. Google CEO Sundar Pichai erklärte kürzlich:
[…] Using the computational resources of Google, they’re focused on building more capable systems, safely and responsibly. This includes our next-generation foundation model, Gemini, which is still in training. Gemini was created from the ground up to be multimodal, highly efficient at tool and API integrations and built to enable future innovations, like memory and planning. While still early, we’re already seeing impressive multimodal capabilities not seen in prior models. Once fine-tuned and rigorously tested for safety, Gemini will be available at various sizes and capabilities, just like PaLM 2.
Das KI-Modell stellt einer Art LLM-Kombination dar und soll deutlich mehr Parameter nutzen als PaLM 2 und auch die vergleichbaren Modelle von OpenAI. Nach Angaben von Demis Hassabis, Gründer und Chef von Google DeepMind, sollen die Fähigkeiten des Modells gar die von OpenAIs GPT-4 übertreffen. Davon berichtet der AI-Experte Rowan Cheung auf X. Er gibt auch an, dass es Spekulationen gebe, nach denen Gemini schon Ende 2023 umfassend ausgerollt werden könnte. Zudem könnte Google das Modell im von Pichai erwähnten Training mit diversen Daten, auch aus YouTube-Transkripten, gefüttert haben.
If Google really did train Gemini on all their data (including YouTube transcripts), Q4 of 2023 is going to get crazy in the world of AI.
The leak of Stubbs shows Google has plenty of other AI tricks up its sleeve.https://t.co/jsA2y8FUGp
— Rowan Cheung (@rowancheung) October 25, 2023
Diese Spekulationen sind bis dato unbestätigt. Allerdings könnte Gemini bald tatsächlich YouTube, die Suche, den Assistant und weitere Google-Dienste optimieren. Schon jetzt haben erste, ungenannte, Unternehmen Zugriff auf das Modell erhalten, das PaLM 2 ablösen soll. Ein gradueller Roll-out in mehr und mehr Tools ist vorstellbar. Die KI-Expertin Dr. Marie Haynes gibt auf X eine Aussage Pichais wieder, nach der Gemini 2024 mehr Dienste unterstützen soll.
Some quotes re Gemini and also SGE.
Will hopefully write this up tomorrow or you can just read my notes in this Google Doc. https://t.co/R1k65nyygz pic.twitter.com/P2PuRDpxow
— Marie Haynes (@Marie_Haynes) October 24, 2023
Ob das Modell tatsächlich basierend auf einem enorm umfassenden Spektrum an Google-Daten trainiert wurde, wird der Öffentlichkeit aller Voraussicht nach nicht mitgeteilt. Sollte Google für das Training aber auf einen Großteil der Datenbasis und beispielsweise Videotranskripte mit enorm viel Know-how zugreifen, würde das die Fähigkeiten – auch im Multimodalitätskontext, der für den Einsatz verschiedener AI-Tools so wichtig ist – optimieren.
Im jüngsten Quartalsbericht erklärte Alphabet nicht nur ein Umsatzplus von elf Prozent (der Umsatz stieg Year Over Year auf 76,7 Milliarden US-Dollar), sondern auch, dass die wichtigen Geschäftsbereiche Search, YouTube, die Cloud und Pixel von KI-Innovationen unterstützt werden – in Zukunft noch mehr. So sagte Sundar Pichai:
I’m pleased with our financial results and our product momentum this quarter, with AIdriven innovations across Search, YouTube, Cloud, our Pixel devices and more. We’re continuing to focus on making AI more helpful for everyone; there’s exciting progress and lots more to come.
Google gibt ersten Zugriff:
Gemini AI soll mit GPT-4 konkurrieren
© FLY:D – Unsplash