AGI & Frontier-Modelle
OpenAI bringt drei neue Sprach-KIs: Live-Übersetzung in 70+ Sprachen und Echtzeit-Untertitel
OpenAI hat am 7.5. drei neue Audio-Modelle für seine Programmierschnittstelle veröffentlicht: GPT-Realtime-2 für sprechende KI-Agenten am Telefon oder im Service-Chat, GPT-Realtime-Translate für Live-Übersetzung in mehr als 70 Sprachen und GPT-Realtime-Whisper für Echtzeit-Transkription und Untertitel. Die Modelle reagieren in der Demo praktisch verzögerungsfrei und sollen Callcenter, Konferenzsysteme und Barrierefreiheits-Tools betreiben. Damit verschärft sich der Wettbewerb mit Spezialisten wie ElevenLabs, dessen Stimm-KI gerade auf 500 Mio. Dollar Jahresumsatz geklettert ist. Wer in der EU lebt, wird die Technik bald in Service-Hotlines, simultanen Untertiteln auf Streaming-Plattformen und Live-Dolmetschen in Behörden hören.
Quelle: OpenAI
KI-Agenten
Anthropic lässt Claude träumen: KI-Agenten lernen über Nacht aus eigenen Fehlern
Auf seiner Entwicklerkonferenz „Code with Claude“ hat Anthropic, das Unternehmen hinter dem Chatbot Claude, am 6.5. eine neue Funktion namens „Dreaming“ vorgestellt. Zwischen den Arbeitseinsätzen sichtet eine zweite KI-Instanz alte Sitzungen, sucht wiederkehrende Muster und schreibt daraus „Playbooks“, die der Agent beim nächsten Mal nutzt – ohne dass das eigentliche KI-Modell verändert wird. Erste Kunden melden klare Effekte: Die Rechtssoftware Harvey berichtet von einer rund sechsmal höheren Erledigungsquote, der Medizinanbieter Wisedocs halbierte die Bearbeitungszeit pro Dokument. Für Unternehmen heißt das: KI-Agenten werden mit jedem Tag im Einsatz besser, ohne dass jemand neu trainieren muss – und damit ein Stück verlässlicher für echte Produktionsaufgaben.
Quelle: VentureBeat
Industrie & Markt
Apple öffnet iOS 27: Nutzer dürfen Claude oder Gemini statt ChatGPT als Standard-KI wählen
Wie Bloomberg am 5.5. berichtet, will Apple in iOS 27, iPadOS 27 und macOS 27 (Herbst 2026) erstmals zulassen, dass Nutzer eine andere KI als Standard hinter „Apple Intelligence“ setzen – etwa Googles Gemini oder Anthropics Claude statt ChatGPT. Möglich macht das eine neue Schnittstelle namens „Extensions“, die Schreib-, Bild- und Siri-Funktionen an die jeweilige Wunsch-KI weiterreicht. Apple hat zugleich einen Vertrag mit Google geschlossen, um eine Gemini-Variante als eigene Siri-Basis einzusetzen. Für die KI-Hersteller wird das iPhone damit zum offenen Schaufenster – für Apple-Nutzer in Europa heißt es: keine ChatGPT-Pflicht mehr, sondern echte Wahl.
Quelle: Bloomberg
Codex zieht in Chrome ein: OpenAIs Programmier-KI testet Web-Apps direkt im Browser
OpenAI hat am 7.5. eine Chrome-Erweiterung für Codex veröffentlicht – seine spezialisierte KI fürs Programmieren. Codex kann jetzt parallel in mehreren Tabs Web-Apps testen, Inhalte aus geöffneten Seiten als Kontext nutzen und die Entwicklerwerkzeuge des Browsers selbst bedienen, ohne dass der Nutzer die Kontrolle abgibt. Laut OpenAI hat Codex inzwischen über vier Millionen wöchentliche Nutzer – achtmal so viele wie Anfang 2026. Für Web-Entwickler in Europa und den USA verlagert sich damit ein wachsender Teil der Routinearbeit in den Browser, der Mensch wird vom Tipper zum Reviewer.
Quelle: MacRumors
Snap und Perplexity beerdigen 400-Mio.-Dollar-Deal – KI-Suche wandert nicht in Snapchat ein
Snap hat in seinem Quartalsbericht am 6.5. das Aus für die im November 2025 angekündigte 400-Millionen-Dollar-Partnerschaft mit Perplexity bestätigt. Das KI-Suchsystem von Perplexity sollte fest in den Chat von Snapchat eingebaut werden – die beiden Unternehmen kamen aber nicht auf einen gemeinsamen Roll-out. Snaps Umsatzprognose für 2026 enthält jetzt keinen Beitrag mehr aus dem Deal; Perplexity bleibt nur noch Werbekunde. Das Beispiel zeigt: Auch im KI-Boom platzen Mega-Deals, wenn Plattform und KI-Anbieter sich nicht auf das gemeinsame Produkt einigen können.
Quelle: Engadget
Regulierung & Sicherheit
ChatGPT führt „Trusted Contact“ ein: Vertrauensperson wird bei Suizidgefahr automatisch alarmiert
OpenAI hat am 7.5. die optionale Funktion „Trusted Contact“ in ChatGPT freigeschaltet. Volljährige Nutzer können eine Vertrauensperson hinterlegen, an die ChatGPT in akuten Krisen einen Hinweis schickt – per E-Mail, SMS oder In-App-Nachricht – ohne den Gesprächsinhalt mitzusenden. Die Funktion folgt auf die Eltern-Aufsicht für Teenager-Konten vom September und reagiert auf wachsenden politischen Druck nach mehreren Suiziden, in denen Chatbots eine Rolle spielten. Damit bekommt KI-Sicherheit erstmals eine konkrete soziale Ebene: nicht Filter im Modell, sondern eine echte Person, die kontaktiert wird.
Quelle: TechCrunch