KI-News 2.5.2026: Mistral 3.5, Agent 365 & Meta AI

AGI & Frontier-Modelle

Mistral veröffentlicht Medium 3.5 als Open-Weight-Flaggschiff – 128B dicht, 256K Kontext und remote Vibe-Coding-Agenten

Mistral AI hat am 27. April 2026 Mistral Medium 3.5 als neues Flaggschiff-Modell in der Public Preview veröffentlicht – ein dichtes 128-Milliarden-Parameter-Modell mit 256K-Kontextfenster, das Instruktionsbefolgung, Reasoning und Coding in einem einzigen Gewichtsatz vereint. Die Gewichte sind unter einer modifizierten MIT-Lizenz verfügbar, das Modell läuft laut Mistral selbst gehostet auf bereits vier GPUs, der Vision-Encoder wurde von Grund auf für variable Bildgrößen trainiert, und der Reasoning-Aufwand ist pro Request konfigurierbar. Parallel führt Mistral in Vibe CLI und Le Chat remote Cloud-Coding-Agenten ein, die parallel im Hintergrund arbeiten, sowie den neuen „Work“-Modus in Le Chat (Preview) für komplexe, werkzeugübergreifende Multi-Step-Aufgaben.

Quelle: Mistral AI

KI-Training & Forschung

Microsoft Foundry Labs: MAI-Transcribe-1 mit 3,9 % WER (FLEURS) und Harrier-oss-v1 Embeddings bis 74,3 (MTEB v2)

Microsoft hat im April-Update von Foundry Labs mehrere neue Modelle hervorgehoben: MAI-Transcribe-1 erreicht 3,9 % durchschnittliche Word Error Rate auf dem FLEURS-Benchmark (25 Sprachen), soll rund 50 % geringere GPU-Kosten als führende Alternativen haben und liefert 2,5× Batch-Transkriptions-Speed gegenüber dem bisherigen Azure-Fast-Angebot. Zusätzlich stellt Microsoft Harrier-oss-v1 als multilinguales Embedding-Modell vor und nennt MTEB-v2-Scores von 66,5 (270 M), 69,0 (0,6 B) und 74,3 (27 B) bei Unterstützung für 94 Sprachen und bis zu 32.768 Tokens Kontext. Ebenfalls erwähnt: Phi-4-Reasoning-Vision-15B mit 88,2 % auf ScreenSpot_v2 und 83,3 % auf ChartQA.

Quelle: Microsoft Community Hub

KI-Agenten

Microsoft Agent 365 ist allgemein verfügbar: 15 USD pro User/Monat, neue Shadow-AI-Erkennung und Integration mit AWS Bedrock sowie Google Gemini Enterprise

Microsoft hat Agent 365 am 1. Mai 2026 als kommerzielle Control Plane für Enterprise-KI-Agenten allgemein verfügbar gemacht – zum Preis von 15 USD pro User und Monat, standalone oder in Microsoft 365 E7. Die Plattform erweitert Observability, Governance und Security auf Agenten mit eigenen Credentials; neue Previews decken ‚Shadow AI‘ und unmanaged Agents über Microsoft Defender und Intune auf (Beispiele: OpenClaw, GitHub Copilot CLI, Claude Code) und synchronisieren das Agent Registry über AWS Bedrock AgentCore und Googles Gemini Enterprise Agent Platform hinweg. Ab Juni 2026 sollen Policy-Controls folgen; außerdem angekündigt sind Entra Network Controls für Copilot-Studio- und lokale Agents sowie Windows 365 for Agents (Public Preview, zunächst nur USA). Ökosystempartner bei Launch sind unter anderem Genspark, Zensai, Egnyte, Zendesk, Kasisto, Kore und n8n.

Quelle: Microsoft Security Blog

Microsoft Agent Framework 1.0 ist da: produktionsreife Multi-Agent-Orchestrierung für .NET und Python (MIT-Lizenz)

Microsoft hat Agent Framework 1.0 als produktionsreifes Open-Source-SDK (MIT) für .NET und Python veröffentlicht. Laut Microsoft unterstützt es Multi-Agent-Orchestrierung, Middleware-Hooks, graphbasierte Workflows sowie Memory-Integrationen (z. B. Redis, Neo4j) und arbeitet mit mehreren Modell-Anbietern (u. a. Microsoft Foundry/Azure OpenAI, OpenAI, Anthropic Claude, Amazon Bedrock, Google Gemini, Ollama). Als zentrale Bausteine für Interoperabilität nennt Microsoft die Protokolle MCP (Model Context Protocol) und A2A (Agent-to-Agent; 1.0 „coming soon“).

Quelle: Microsoft DevBlogs

Industrie & Markt

Meta: Business AI führt 10 Millionen Gespräche pro Woche – über 8 Millionen Werbetreibende nutzen GenAI-Tools

Meta hat am 30. April 2026 erstmals konkrete Nutzungszahlen zu seiner Business AI veröffentlicht: Die Tools führen Ende März rund 10 Millionen Gespräche pro Woche, ein Sprung von nur 1 Million zu Jahresbeginn; die Beta wurde zuletzt in den USA, EMEA, APAC und LATAM ausgerollt. Über 8 Millionen Werbetreibende nutzen inzwischen mindestens eines der GenAI-Werbetools, besonders stark angenommen in KMU, und Werbetreibende mit dem Video-Generierungs-Feature sehen laut Meta mehr als 3 % höhere Conversion-Raten in Tests. Mark Zuckerberg bestätigte, dass die Business-AI-Tools in WhatsApp und Messenger „derzeit für die meisten Unternehmen kostenlos“ sind und Meta mittelfristig „an einem längerfristigen Monetarisierungsmodell“ arbeiten will.

Quelle: TechCrunch

Regulierung & Sicherheit

arXiv: AISafetyBenchExplorer katalogisiert 195 AI-Safety-Benchmarks und zeigt starke Fragmentierung

Das Paper „AISafetyBenchExplorer“ beschreibt einen Katalog von 195 AI-Safety-Benchmarks (2018–2026) inklusive Metadaten zu Benchmarks, Metriken und Repo-Aktivität. Die Autor:innen berichten u. a., dass 94/195 Benchmarks mittlere Komplexität haben und nur 7 als „Popular“ eingestuft werden; außerdem seien 165/195 Benchmarks englischsprachig, 137/195 GitHub-Repositories „stale“ und 96/195 Hugging-Face-Datasets „stale“. Ziel ist, Benchmark-Auswahl und Messpraxis zu standardisieren, weil Labels wie „Accuracy“ oder „F1“ laut Paper oft unterschiedliche Bewertungsregeln und Threat-Models verdecken.

Quelle: arXiv