Das "Omnimodel" soll wesentlich flotter sein als GPT-4 und verbindet Computersehen mit Spracherkennung und realistischer Stimmerzeugung

Am 13. Mai 2024 präsentierte OpenAI im Rahmen des "Spring Update" das neue KI-Modell GPT-4o. Mira Murati, Technikchefin von OpenAI, betonte dabei das Ziel, die Nutzung der eigenen Tools für möglichst viele Anwender zu erleichtern und die "Reibung zu reduzieren". Neben der Vorstellung einer Desktop-Version von ChatGPT stand vor allem das neue "Flaggschiff-Modell" GPT-4o im Mittelpunkt.

ChatGPT Desktop mit neuem UI

Erstmals gibt es eine offizielle Desktop-Umsetzung von ChatGPT, die es Nutzern erleichtern soll, das Webtool auf PCs und Laptops zu verwenden. Gleichzeitig wurde das User Interface überarbeitet, um die Bedienung auf allen Plattformen zu vereinfachen.

GPT-4o, das "Omnimodell"

GPT-4o, das neue "Omnimodell" von OpenAI, bietet Künstliche Intelligenz auf dem Level von GPT-4, ist jedoch wesentlich schneller und effizienter. Es kombiniert Fähigkeiten in Computersehen, Spracherkennung und -ausgabe sowie im Textbereich. OpenAI spricht von einem "Omnimodell", was das "o" im Namen erklärt. Ziel ist es, die Zusammenarbeit natürlicher und schneller zu gestalten. Nutzer können Screenshots, Fotos oder Dokumente hochladen und mit der KI darüber sprechen. Die Erinnerungsfunktion soll dabei kohärentere Unterhaltungen ermöglichen, und die KI kann Daten und Diagramme zuverlässig analysieren.

Ein von OpenAI gepostetes Demovideo.

Mehr für Gratisnutzer

Die verbesserte Performance von GPT-4o soll vor allem den Gratisnutzern zugutekommen, die nun Zugriff auf fortgeschrittene Werkzeuge erhalten, die bisher nur zahlenden Nutzern zur Verfügung standen. Dies könnte jedoch auch als Anreiz dienen, mehr Nutzer zu zahlenden Kunden zu machen, da diese ein höheres Ratelimit genießen.

Sicherheit und Effizienz

Bei der Bereitstellung von GPT-4o legt OpenAI großen Wert auf Sicherheit und arbeitet mit Stakeholdern aus Wirtschaft, Politik und Zivilgesellschaft zusammen. Über die Programmierschnittstelle soll GPT-4o doppelt so schnell und nur halb so teuer sein wie das bisher mächtigste Modell, GPT-4 Turbo. Die Verbesserungen sollen sich in allen 50 unterstützten Sprachen niederschlagen und eine natürlichere, emotional unterlegte Sprachausgabe bieten.

Beeindruckende Live-Demos

Während der Präsentation zeigten Mark Chen, "Head of Frontiers Research", und Barret Zoph, "Head of Post-Training", beeindruckende Live-Demos. GPT-4o gab Tipps zur Bewältigung von Nervosität, erzählte eine Gutenachtgeschichte mit emotionaler Stimme und löste eine handschriftlich notierte lineare Gleichung. Zudem analysierte die KI Python-Codes und fungierte als Liveübersetzer für eine englisch-italienische Konversation.

Das "nächste große Ding" kommt "bald"

Trotz kleinerer technischer Probleme während der Live-Demos konnte GPT-4o insgesamt beeindrucken. Mira Murati kündigte an, dass OpenAI neben dem baldigen Rollout von GPT-4o in den nächsten Wochen auch schon bald das "nächste große Ding" vorstellen werde.

GPT-4o markiert einen bedeutenden Fortschritt in der KI-Entwicklung und verspricht, die Art und Weise, wie wir mit Maschinen interagieren, weiter zu revolutionieren.

Share this article
The link has been copied!