Googles große ChatGPT-Konkurrenz Bard heißt jetzt Gemini, Meta führt KI-Label ein, Apple plant eine große AI-Offensive und während OpenAI GPTs in den ChatGPT Chat integriert, arbeitet ByteDance an der Chatbot Building Platform Coze. Das Jahr 2024 hat schon jetzt viele Updates und Entwicklungen aus der Welt der Künstlichen Intelligenz für die User parat. Im Laufe des Jahres werden noch zahlreiche weitere Features und Systeme vorgestellt werden.
Dabei werden sich diese an einigen AI-Trends orientieren. Drei dieser Trends hat Microsoft, der Tech-Konzern, der so eng mit OpenAI zusammenarbeitet und nicht zuletzt mit Copilot stark auf eine umfassende KI-Integration baut, kürzlich vorgestellt. Wir werfen einen Blick auf diese Trends und liefern weiterführende Hinweise darauf, wo sie sich in der Digitalwelt abzeichnen.
AI made large strides last year, but what’s in store for 2024?
Explore three trends that will help make it a more accessible assistant for everyday tasks: https://t.co/VCBm1kbHSr
— Microsoft (@Microsoft) February 12, 2024
Microsofts AI-Trends to watch: SLMs, Multimodalität und KI in der Wissenschaft
Auf dem offiziellen Microsoft Blog stellt Vanessa Ho drei grundlegende Trends aus der Sicht des Tech-Konzerns vor. Dazu zählt der Aufstieg von SLMs, Small Language Models. Auch diese stützen sich noch auf einige Milliarden Parameter (allerdings deutlich weniger als bei LLMs [Large Language Models] wie etwa Googles PaLM 2). Sebastian Bubeck, der für Microsoft die Machine Learning Foundations Group leitet, erklärt den Vorteil der SLMs. Sie seien oft günstiger und zugänglicher als größere Modelle und könnten für spezifische Zwecke eingesetzt werden, bei denen sie mit viel Power relevante Ergebnisse hervorbringen könnten. In diesem Kontext hat Microsoft selbst die SLMs Phi und Orca entwickelt. Phi-2 soll ein anderes SLM, Googles Gemini Nano 2, sogar in Sachen Performance ausstechen. Dieses Modell, das der Account AI Revolution auf YouTube etwas detaillierter darstellt, ist insbesondere für Forscher:innen relevant, kann aber in bestimmten Kontexten auch für Alltagszwecke eingesetzt werden.
Andere SLMs stellen etwa Mixtral und DistilBERT dar, eine kompaktere Version von BERT. SLMs sollen im Forschungs- und Business-Kontext als effiziente und kostengünstige Lösungen integriert werden. Gemini Nano etwa soll KI-Aufgaben auf dem Smartphone, wie Googles Pixel 8 Pro, unterstützen.
Magic Compose—powered by Google AI—rewrites drafted messages in various styles on #Pixel6 and newer.¹ Now messages can be extra concise, professional, or even poetic. And for #Pixel8 Pro, this happens on-device with Gemini Nano.
More #FeatureDrop² info: https://t.co/IExQjJKX2j pic.twitter.com/CLjvR9MzHp
— Made by Google (@madebygoogle) February 4, 2024
Googles Gemini-System baut ebenfalls auf die Multimodalität von KI – das ist der zweite große Trend, den Vanessa Ho nennt. Die Fähigkeiten multimodaler KI zeigt Google im Video zu Gemini.
Microsoft selbst betont die multimodalen Anwendungsoptionen im Kontext des Copilot-Modells, das kürzlich eine Reihe neuer Features erhielt.
5 billion chats, 5 billion images created. Today marks exactly one year since our entry into AI-powered experiences, and we’re celebrating with exciting updates to @MSFTCopilot. Learn more about what’s new: https://t.co/dS1T1EuTYW
— Microsoft (@Microsoft) February 7, 2024
Zudem unterstützt multimodale AI auch den Microsoft Designer und hilft unter anderem dabei, natürlich klingende Stimmen bei Text-Readern zu integrieren, was hörbeeinträchtigten Menschen helfen kann. Insgesamt kann der multimodale Ansatz menschlichere Konversationen und Interaktionen ermöglichen. Das bietet nicht zuletzt OpenAI, zum Beispiel seit der Einführung der Image und Voice Conversations.
Voice mode and image inputs are now in ChatGPT. Starting to feel like the interface to a real AI: https://t.co/LVBDfYvLfq
— Greg Brockman (@gdb) September 25, 2023
Multimodale AI Features können in den verschiedensten Kontexten Relevanz erlangen.
AR glasses with multimodal AI nets funding from Pokémon Go creator https://t.co/fV6tjr3Iui
— TechCrunch (@TechCrunch) February 8, 2024
Auch der KI-Experte Jens Polomski erklärte mir, dass er Multimodalität als eines der größten Trendthemen im Bereich KI ansieht. Außerdem sieht er Open Source-Modelle als besonders relevant an; und diese können immerhin auch bei der Entwicklung von SLMs und multimodalen Modellen unterstützen.
Mehr wissenschaftliche Entdeckungen dank AI
Der dritte große AI-Trend von Microsoft betrifft die Wissenschaft. Laut Vanessa Ho und Chris Bishop, Director des A14Science Teams von Microsoft Research, werden KI-Lösungen die wissenschaftlichen Entdeckungen künftig revolutionieren. Das kann sich auf Wetterprognosen, Durchbrüche bei medizinischen Behandlungen oder etwa Fortschritte in der Landwirtschaft beziehen.
Dr. Keith Channon von Caristo Diagnostics erklärt beispielsweise im NVIDIA AI Podcast, wie eine KI-gestützte Lösung zur Erkennung von Koronarentzündungen in Herz-CT-Scans beitragen kann. Im vergangenen Jahr hat Google zusammen mit dem Berkeley Lab Graph Networks for Materials Exploration (GNoME) vorgestellt, eine KI-Lösung, die bei der Entdeckung von über 2,2 Millionen neuer Kristalle geholfen hat, welche für die Entwicklung neuer Technologien für Batterien, Computer etc. genutzt werden können. Die Technologie der GNoME Predictions wurde bereits für die Forschung zur Verfügung gestellt. Im Post dazu heißt es abschließend:
Our research – and that of collaborators at the Berkeley Lab, Google Research, and teams around the world — shows the potential to use AI to guide materials discovery, experimentation, and synthesis. We hope that GNoME together with other AI tools can help revolutionize materials discovery today and shape the future of the field.
Darüber hinaus berichtete die Financial Times im Herbst vergangenen Jahres über eine Optimierung der Brustkrebserkennung auf der Grundlage von KI-Lösungen.
AI boosts breast cancer detection rates, new research shows https://t.co/XyZLmvuU8Q
— Financial Times (@FT) November 16, 2023
Die Wissenschaft, das Marketing und viele andere Lebensbereiche können 2024 und darüber hinaus von der rasanten Entwicklung von KI profitieren – sofern diese KI ethisch und sicher eingesetzt wird. Wir dürfen gespannt auf neue Entwicklungen und Lösungen hoffen. Die Möglichkeiten sind scheinbar unbegrenzt. So ist und bleibt KI ein Trendthema in diversen Bereichen unserer digitalisierten Welt.