AGI & Frontier-Modelle
Nature: 18 „General Scales“ sollen KI-Evaluation erklärbarer machen und Benchmark-Sättigung umgehen
In Nature schlagen Forschende um Lexin Zhou und José Hernández-Orallo ein Set von 18 „General Scales“ vor, die nicht einzelne Aufgaben, sondern kognitive Fähigkeiten wie Abstraktion, kausales Schließen, Arbeitsgedächtnis und Instruktionsverständnis messen. Damit wollen sie die zunehmende Sättigung klassischer Benchmarks wie MMLU und SWE-Bench überwinden und KI-Fähigkeiten unabhängig von konkreten Tests vergleichen. In einer Erstauswertung ordnen die Autor:innen u. a. GPT-5, Claude Opus 4 und Gemini 2.5 auf diesen Skalen ein und zeigen, dass Modelle mit ähnlichem Benchmark-Score deutlich unterschiedliche Profile haben. Ziel ist ein Rahmen, der Entwickler:innen, Regulierer:innen und Forschenden hilft, Fortschritt, Schwächen und Risiken nachvollziehbar zu bewerten.
Quelle: Nature
KI-Agenten
Microsoft Copilot Studio macht „Computer use“-Automatisierung im Mai 2026 allgemein verfügbar – 13 LLMs und 1.800 Connectors
Microsoft kündigt an, die „Computer use“-Automatisierung in Copilot Studio im Mai 2026 allgemein verfügbar zu machen – Agenten können damit eigenständig Desktop- und Web-Anwendungen über UI bedienen, wenn keine API verfügbar ist. Copilot Studio unterstützt dafür 13 LLMs, über 1.800 Connectors und bindet zusätzlich MCP-Server sowie autonome Agenten aus Drittdiensten wie Salesforce, ServiceNow, Adobe, Workday und GitHub ein. Die Plattform rückt damit nah an die am 1. Mai startende Agent-365-Control-Plane von Microsoft, die Agenten mit Identity, Governance und Shadow-AI-Erkennung kommerziell verwaltet.
Quelle: Microsoft Copilot Blog
Cloudflare und Stripe starten „Stripe Projects“: KI-Agenten legen eigenständig Cloudflare-Accounts an, kaufen Domains und deployen Apps
Cloudflare und Stripe haben am 29. April 2026 das offene Protokoll „Stripe Projects“ in Open Beta gestartet: KI-Agenten können nach einmaligem Stripe-Login autonom einen Cloudflare-Account einrichten, kostenpflichtige Services abonnieren, eine Domain kaufen, API-Token ziehen und Code in die Produktion deployen. Das Protokoll setzt auf OAuth/OIDC und Payment-Tokenisierung (Kreditkartendaten wandern nicht über den Agenten) und setzt standardmäßig eine Ausgabengrenze von 100 USD pro Monat und Anbieter. Initial unterstützte Provider neben Cloudflare sind Vercel, Supabase, Clerk, PostHog, Sentry, PlanetScale und Inngest; Cloudflare legt zudem 100.000 USD Guthaben für neue, über Stripe Atlas gegründete Startups drauf.
Quelle: Cloudflare Blog
Mistral startet Workflows als Orchestration-Layer für Enterprise-AI – gebaut auf Temporal und bereits Millionen Ausführungen pro Tag
Mistral AI hat Workflows als produktionsreife Orchestration-Schicht in Public Preview gestartet – aufgebaut auf Temporals durable-execution-Engine und laut Mistral schon heute mit Millionen täglicher Ausführungen im Einsatz. Die Architektur trennt Orchestrierung von Ausführung: Die Orchestrierung läuft in Mistrals Cloud, die Ausführung kann nah an den sensiblen Daten der Kund:innen bleiben – ein Plus für regulierte Branchen wie Logistik, Finanzdienstleister und KYC. Workflows adressiert ausdrücklich Developer (Python-SDK v3.0, OpenTelemetry, MCP-Server) und ist ein zentrales Element in Mistrals dreistufigem Enterprise-Stack aus Forge (Custom-Modelltraining), Workflows (Orchestrierung) und Vibe (Coding-Agent). Laut CEO Arthur Mensch liegt die Umsatz-Run-Rate inzwischen bei über 400 Mio. USD (zuvor 20 Mio.); der angekündigte Launch dient der Ambition, 2026 über 1 Mrd. USD ARR zu erreichen.
Quelle: VentureBeat
Industrie & Markt
China blockiert Metas 2-Milliarden-USD-Übernahme von Manus – Streit um „general-purpose“ KI-Agenten eskaliert
Chinas staatliche Planungsbehörde NDRC hat am 27. April 2026 Metas angekündigte Übernahme des in Singapur ansässigen, ursprünglich chinesisch gegründeten KI-Startups Manus für 2 Mrd. USD offiziell blockiert. Manus hat sich auf General-Purpose-KI-Agenten für Büro- und Automatisierungsaufgaben spezialisiert und expandiert stark im asiatisch-pazifischen Raum. Peking begründet den Schritt mit nationalen Sicherheits- und Investitionsregeln und fordert Meta auf, den Deal rückgängig zu machen – ein deutliches Signal, dass China den Abfluss heimisch geprägter KI-Technologie an US-Konzerne stoppen will. Der Fall erhöht die Unsicherheit für weitere grenzüberschreitende KI-Transaktionen.
Quelle: CNBC
Cadence und NVIDIA bauen AI-Agenten für Chipdesign – Millennium M2000 kombiniert Blackwell-GPUs mit Cadence Palladium Z3
Cadence und NVIDIA haben ihre Allianz um KI-Agenten für das Chipdesign ausgeweitet – Cadence integriert NVIDIA NIM-Microservices und Nemotron-Modelle in seine Cerebrus-Tools und seine AI-Plattform JedAI. Herzstück ist die neue Millennium-M2000-Emulations-Plattform, die NVIDIAs Blackwell-GPUs mit Cadence’ Palladium Z3 Enterprise Emulation System kombiniert, um Chip-Verifikation und Software-Bring-up deutlich zu beschleunigen. Laut CEO Anirudh Devgan sollen agentische KI-Workflows die Produktivität beim Schaltungsdesign „zehnfach“ steigern, mit Fokus auf Timing, Power und Platzierung. Die Partner adressieren damit direkt den Engpass bei Design-Engineers im Zeitalter immer größerer, KI-zentrierter Chips.
Quelle: Reuters