Kuratiert: wenige, aber handfeste Entwicklungen rund um KI-Agenten, Open-Source-Modelle und Safety-Forschung.
KI-Agenten
OpenAI rüstet Codex auf: Desktop-Steuerung im Hintergrund, Memory (Preview) und 111 Integrationen
Laut TechCrunch kann OpenAIs Codex nun im Hintergrund auf dem Mac laufen und Apps öffnen sowie mit einem Cursor klicken und tippen, während mehrere Agenten parallel arbeiten können, ohne die laufende Nutzerarbeit zu stören. Neu sind außerdem ein In-App-Browser (zunächst für Web-Apps/Localhost), die Preview-Funktion "Memory" zum Erinnern an frühere Arbeitssitzungen und eine Bildgenerierung für Mockups und Produktkonzepte. OpenAI nennt zudem 111 Plug-in-Integrationen (u. a. CodeRabbit und GitLab Issues) und führt für ChatGPT Enterprise/Business eine Pay-as-you-go-Option ein.
Quelle: TechCrunch
OpenAI startet "Workspace Agents" für Unternehmen – mit Slack-, Salesforce- und Drive-Integrationen (gratis bis 6. Mai)
VentureBeat berichtet, dass OpenAI "Workspace Agents" als Nachfolger der Custom GPTs vorstellt, verfügbar u. a. für ChatGPT Business (20 US-Dollar pro Nutzer und Monat) sowie Enterprise, Edu und Teachers. Die Agents können direkt in Tools wie Slack, Google Drive, Microsoft Apps, Salesforce, Notion und Atlassian Rovo eingebunden werden und dort Aufgaben über mehrere Schritte ausführen. Laut OpenAI sind Workspace Agents bis zum 6. Mai 2026 kostenlos; anschließend soll ein credit-basiertes Preismodell greifen. Als Nächstes sind Trigger für automatische Starts, bessere Dashboards und mehr Aktionen in Business-Tools angekündigt – inklusive Support in Codex.
Quelle: VentureBeat
AGI & Frontier-Modelle
Google DeepMind veröffentlicht Gemma 4 als offene Modellfamilie (Apache 2.0) – Edge-Varianten mit 128K Kontext und 140+ Sprachen
Im Google Developers Blog stellt Google DeepMind Gemma 4 als neue Open-Model-Familie unter Apache-2.0-Lizenz vor, mit Fokus auf agentische Workflows direkt auf Geräten (Multi-Step-Planning, Offline-Code-Generation, Audio-/Bildverarbeitung). Genannt werden insbesondere Gemma 4 E2B und E4B mit 128K Kontextfenster sowie Support für über 140 Sprachen und visuelle Verarbeitung. Für die Distribution nennt Google u. a. Androids AICore Developer Preview (systemweite Einbindung), die Google AI Edge Gallery App sowie LiteRT-LM für Mobile/Desktop/Web/IoT (inkl. Raspberry Pi 5 und Qualcomm Dragonwing IQ8).
Quelle: Google Developers Blog
Industrie & Markt
Hugging Face: Open-Source-Ökosystem wächst rasant – 13 Mio. Nutzer, >2 Mio. Modelle, aber starke Download-Konzentration
Hugging Face berichtet im "State of Open Source" (Spring 2026), dass die Plattform 2025 auf 13 Millionen Nutzer, mehr als 2 Millionen öffentliche Modelle und über 500.000 öffentliche Datasets gewachsen ist. Gleichzeitig ist die Nutzung stark konzentriert: Rund die Hälfte der Modelle hat weniger als 200 Downloads, während die Top-200-Modelle (0,01% aller Modelle) 49,6% aller Downloads ausmachen. Der Beitrag hebt außerdem hervor, dass chinesische Modelle im letzten Jahr 41% der Downloads stellten und dass sich die Beitragsstruktur Richtung unabhängiger Entwickler verschoben hat.
Quelle: Hugging Face Blog
Regulierung & Sicherheit
Neuer Safety-Benchmark Uni-SafeBench (arXiv:2604.00547) testet Sicherheitsrisiken bei "unified" multimodalen Modellen
Auf der aktuellen cs.AI-Liste von arXiv wird "Uni-SafeBench: A Safety Benchmark for Unified Multimodal Large Models" mit der arXiv-ID 2604.00547 geführt. Der Titel "Does Unification Come at a Cost?" deutet darauf hin, dass der Benchmark systematisch prüft, ob das Vereinheitlichen mehrerer Modalitäten in einem Modell Sicherheitsnachteile mit sich bringt. Als Themengebiete sind Artificial Intelligence (cs.AI) und Machine Learning (cs.LG) angegeben, die Autor:innenliste umfasst u. a. Zixiang Peng und Yongxiu Xu.
Quelle: arXiv (cs.AI current)