Beim KI-Unternehmen OpenAI folgt ein Update dem nächsten. Nach dem großen Roll-out des Agents Deep Research für ChatGPT wurde dieses Feature bereits überarbeitet und ist inzwischen für noch mehr User verfügbar. Auch die Dokumentensuche, die via Deep Research möglich ist, wird in der Assistants API des Unternehmens optimiert. Doch für deutlich mehr User dürfte das jüngste Update für den Advanced Voice Mode von Interesse sein, welches kostenfreien Support durch das hochleistungsfähige Modell GPT-4o mini ermöglicht. Auf diese Art von Anpassung reagiert indes die Konkurrenz von Microsoft: Auch der Copilot erhält mehr Möglichkeiten für Free User.
Noch bessere Konversationen im Advanced Voice Mode von ChatGPT: Mehr Optionen für Plus und Pro User
Via X gab OpenAI bekannt, dass auch User ohne kostenpflichtiges Abonnement künftig auf den Advanced Voice Mode mit GPT-4o mini als Modell im Hintergrund zugreifen können. Damit erhalten sie State-of-the-Art-Sprach-Support bei der Konversation mit ChatGPT – einige Monate vor dem geplanten Launch von GPT-4.5 und GPT-5. Außerdem soll das mini-Modell dafür sorgen, dass die tiefgreifenden Konversationen, welche menschenähnlich verlaufen sollen, kosteneffizienter sind.
Mit dem Advanced Voice Mode können User ein Gespräch mit ChatGPT führen und favorisierte Stimmen auswählen. Plus User können sogar mit einem fünf Mal höheren Limit auf die Konversationsoption mit GPT-4o mini zugreifen. Außerdem haben sie die Option, das Video- und Screen Sharing im Advanced Voice Mode zu nutzen. Für Pro User gibt es im Voice Mode gar keine Limits, beim Video- und Screen Sharing höhere als im Plus-Bereich.
Plus users will continue to have access to Advanced Voice powered by 4o with the existing daily rate limit, which is more than 5x the free limit, as well as access to video and screensharing in Advanced Voice.
And Pro users will continue to have unlimited access to Advanced…
— OpenAI (@OpenAI) February 25, 2025
Nicht nur OpenAI möchte Free Usern mehr Möglichkeiten zur facettenreichen KI-Nutzung bieten. Auch Microsoft, das eng mit dem Unternehmen zusammenarbeitet, liefert ein Update für den Einsatz der Features Voice und Think Deeper. Diese erinnern an OpenAIs Lösungen und werden vom OpenAI-modell o1 unterstützt. Beide sind für Copilot User jetzt kostenfrei und unlimitiert nutzbar.
Read more: https://t.co/osWhsOof2C
— Yusuf Mehdi (@yusuf_i_mehdi) February 25, 2025
Deep Research: Roll-out komplett, Fähigkeiten verbessert
Zu Beginn des Monats startete OpenAI den Roll-out des neuen Agents Deep Research. Mit nur einem Prompt findet und analysiert Deep Research bei ChatGPT hunderte Online-Quellen für umfassende Reports in Minuten. Auch kann der Agent dank o3 diverse Formate durchsuchen. Jetzt ist der Roll-out des Agents für diverse User-Gruppen abgeschlossen. Plus, Team, Enterprise und Edu User erhalten zehn Anfragen pro Monat, Pro User 120. Über die veröffentlichte Deep Research System Card können Interessierte überdies ermitteln, wie genau das Unternehmen den Agent trainiert und optimiert.
Rollout complete https://t.co/8yQgDJEPBc
— OpenAI (@OpenAI) February 26, 2025
Wer mit Deep Research – Features gleichen Namens gibt es ebenso von Google und Perplexity – arbeitet, kann fortan sogar auf noch bessere Fähigkeiten des Agents bauen. Denn OpenAI erklärt, dass der Agent jetzt für den Output auch eingebettete Bilder mit Zitaten ermöglicht, während das Verständnis von hochgeladenen Dokumenten verbessert, die Referenzen auf diese optimiert werden.
Since the initial launch, we’ve made some improvements to deep research:
Embedded images with citations in the output
Better at understanding and referencing uploaded files
— OpenAI (@OpenAI) February 25, 2025
Passend zum optimierten Verständnis von Dokumenteninhalten hat OpenAI für die Agents API den Support zur Dokumentensuche mit den Modellen o3-mini und o1 bereitgestellt. Dank der Reasoning Models können Entwickler:innen eigene Agents kreieren, die wichtige Details aus Dokumenten extrahieren können.
We’ve added support for file search with o3-mini and o1 in the Assistants API. You can create assistants to access and retrieve information from documents, which these reasoning models are particularly adept at.
https://t.co/gVCoWxC8RE
— OpenAI Developers (@OpenAIDevs) February 25, 2025
Derweil entwickeln die diversen Tech Player der Branche immer neue Funktionen und Tools, auf die sich die Digitalszene stützen kann. Dazu zählen unter anderem xAIs Grok 3 als optimierte KI-Bot, Claude 3.7 von Anthropic und Perplexitys Browser für die agentische Suche.
