Nachdem Google erst kürzlich die Version Gemini Advanced vorgestellt hat, welche den Zugang zu dem neuen und leistungsstärksten KI-Modell, Gemini Ultra 1.0, eröffnet, kommt schon jetzt die nächste Neuerung für das mächtige KI-Modell. Sundar Pichai, CEO von Google, und Demis Hassabis, CEO von Google DeepMind, haben kürzlich auf dem Unternehmens-Blog das Update von Gemini angekündigt. Gemini 1.5 und Gemini 1.5 Pro bauen auf den Erfolg der vorigen Version auf und und ermöglichen auch eine signifikante Weiterentwicklung des Chatbots Gemini, der unter dem Namen Bard bekannt war, bevor er vor Kurzem in Gemini umbenannt wurde.
Here’s a fun demo of long-context understanding. First, we asked the model to find 3 amusing moments in the 402-page pdf transcription of the iconic Apollo 11 mission. Then we uploaded a simple drawing of a boot and it identified the moment we had in mind: Neil’s one small step! pic.twitter.com/mx8id3cqSi
— Demis Hassabis (@demishassabis) February 15, 2024
Gemini 1.5 kann 1 Million Token verarbeiten
Gemini 1.5 Pro besitzt ein immenses Kontextfenster, welches eine Million Token verarbeiten kann. Dies stellt einen gewaltigen Sprung gegenüber den 128.000 Token von OpenAIs GPT-4 und den 32.000 Token des aktuellen Gemini Pro dar. Die Erweiterung des Kontextfensters ermöglicht es, ein breiteres Spektrum an Informationen gleichzeitig zu berücksichtigen – von Text über Bilder bis hin zu Videos, Audio und Code. Laut Hassabis kann Gemini 1.5 Pro eine Stunde Video, elf Stunden Audio, Codes mit über 30.000 Zeilen oder mehr als 700.000 Wörter verarbeiten und analysieren.
This means 1.5 Pro can process vast amounts of information in one go — including 1 hour of video, 11 hours of audio, codebases with over 30,000 lines of code or over 700,000 words. In our research, we’ve also successfully tested up to 10 million tokens.
In December, we launched Gemini 1.0 Pro. Today, we’re introducing Gemini 1.5 Pro!
This next-gen model uses a Mixture-of-Experts (MoE) approach for more efficient training & higher-quality responses. Gemini 1.5 Pro, our mid-sized model, will soon come standard with a… pic.twitter.com/m2BNufHd8C
— Sundar Pichai (@sundarpichai) February 15, 2024
Gemini 1.5 Pro zeichnet sich durch den Einsatz einer Mixture of Experts (MoE)-Technik aus, die Effizienz durch die selektive Ausführung von Modellteilen bei Anfragen steigert. Dieser Ansatz verspricht eine schnellere Nutzung für Anwender:innen.
In einem aktuellen Video zeigt Google, wie beispielsweise ein Stummfilm von Gemini 1.5 Pro analysiert werden kann und wie das System spezifische Anfragen beantwortet.
Verfügbarkeit und Preise
Google hat Gemini 1.5 Pro bereits für Entwickler:innen und Unternehmensnutzer:innen als begrenzte Preview zum Testen zur Verfügung gestellt und plant, es bald auch Privatnutzer:innen anzubieten. Laut Demis Hassabis wird Gemini 1.5 Pro zunächst mit einem Standardkontextfenster von 128.000 Token eingeführt werden. Nutzer:innen können dann aus verschiedenen Preisstufen wählen.
We’ll introduce 1.5 Pro with a standard 128,000 token context window when the model is ready for a wider release. Coming soon, we plan to introduce pricing tiers that start at the standard 128,000 context window and scale up to 1 million tokens, as we improve the model.
Obwohl die Kosten für Gemini 1.5 Pro noch nicht bekannt sind, kann angenommen werden, dass diese Technologie auch Teil von Googles neuem Premiumangebot, Google One AI Premium, werden könnte.