Google und die KI-Tochter DeepMind haben die nächste Generation ihres gemeinsamen KI-Modells vorgestellt: Gemini 2.0. Der Suchmaschinen-Riese will mit Gemini 2.0 die Ära der KI-Agenten einläuten und beschriebt das neue Modell als ein System, das nicht nur Informationen verarbeiten, sondern auch eigenständig Aktionen ausführen kann.

Mit der Neuveröffentlichung will Google neue Möglichkeiten für den Einsatz von künstlicher Intelligenz in unterschiedlichen Bereichen schaffen.

Multimodale Funktionen und Agenten

Gemini 2.0 kombiniert Eingaben aus Text, Video, Bildern und Audio und kann selbst nicht nur Text sondern auch Inhalte wie Bilder und Sprache generieren. Google zufolge bietet das Modell Verbesserungen in der Verarbeitungsgeschwindigkeit und eine flexiblere Nutzung von Werkzeugen wie der Google-Suche und benutzerdefinierten Funktionen.

Ein Highlight ist Gemini 2.0 Flash, ein experimentelles Modell, das erste Entwickler bereits getestet haben. Es unterstützt die Steuerung von Werkzeugen und ermöglicht komplexere Aufgaben wie Planung und Problemlösung. Prototypen wie „Project Astra“ (ein KI-Assistent), „Project Mariner“ (eine Browser-Unterstützung) und „Jules“ (ein Entwickler-Tool) zeigen mögliche Einsatzbereiche.

Project Astra: Ein Prototyp, der als universeller KI-Assistent dienen soll. Verbesserungen betreffen unter anderem die Dialogfähigkeit in mehreren Sprachen, die Nutzung von Google-Diensten und eine personalisierte Speicherfunktion.
Project Mariner: Eine Anwendung, die Nutzern im Browser helfen soll, komplexe Aufgaben zu bewältigen. Die KI kann auf Bildschirminhalte wie Texte, Bilder und Formulare zugreifen und Aufgaben wie das Ausfüllen von Formularen übernehmen.
Jules: Ein Werkzeug für Softwareentwickler, das Aufgaben im GitHub-Workflow bearbeiten und ausführen kann.

Verfügbar über die Gemini-App

Google betont, dass Sicherheit und Ethik bei der Entwicklung von Gemini 2.0 im Vordergrund standen. So wurden Maßnahmen zur Datensicherheit, zur Verhinderung eines missbräuchlichen Einsatzes und zur zuverlässigen Informationsverarbeitung implementiert. Entwickler können erste Versionen über die Gemini-API bereits testen, eine breitere Verfügbarkeit ist für Anfang 2025 geplant, dann soll das neue Modell auch über die kürzlich veröffentlichte Gemini-App angeboten werden.

‎Google Gemini (Kostenlos+, App Store) →

Blog

Leave a Reply

Your email address will not be published. Required fields are marked *