Stand: 29.4.2026. Kuratierte, verifizierte Meldungen mit Primärquellen.

AGI & Frontier-Modelle

OpenAI beschreibt GPT‑5.5: neues Frontier-Modell mit erweitertem Safety-Testing und Safeguards

OpenAI positioniert GPT‑5.5 als Modell für komplexe reale Arbeit: Code schreiben, online recherchieren, Informationen analysieren sowie Dokumente und Tabellen erstellen. Laut System Card wurde GPT‑5.5 vor dem Rollout durch die vollständige Suite an Predeployment-Safety-Evaluations inkl. Preparedness Framework getestet, mit gezieltem Red-Teaming u. a. für Cybersecurity- und Biologie-Risiken sowie Feedback von fast 200 Early-Access-Partnern. OpenAI behandelt die Safety-Ergebnisse von GPT‑5.5 als starke Proxys für GPT‑5.5 Pro (gleiches Underlying-Modell, Pro nutzt paralleles Test-Time-Compute). Die System Card wurde am 24. April 2026 aktualisiert, um zusätzliche Safeguards-Details für die API-Deployment von GPT‑5.5 und Pro aufzunehmen.

Quelle: OpenAI

KI-Agenten

Anthropic legt Leitplanken für Agenten fest: fünf Prinzipien für „trustworthy agents“

Anthropic beschreibt (9. April 2026), dass Agenten wie Claude Code und Claude Cowork eigenständig planen, handeln und Tools nutzen – und dadurch neue Risiken wie Prompt-Injection und Fehlinterpretationen der Nutzerabsicht entstehen. Als Rahmen nennt Anthropic fünf Prinzipien: menschliche Kontrolle, Alignment mit Werten/Erwartungen, sichere Interaktionen, Transparenz und Datenschutz. Als Produktbeispiele werden u. a. ein „Plan Mode“ zur Genehmigung ganzer Strategien und mehrschichtige Abwehrmechanismen gegen Angriffe erwähnt. Zudem fordert Anthropic gemeinsame Infrastruktur wie Benchmarks, Evidenz-Sharing und offene Standards (z. B. Model Context Protocol) für die Branche.

Quelle: Anthropic

NVIDIA stellt Agent Toolkit & OpenShell vor: Open-Source-Stack für Enterprise-Agenten mit AI‑Q-Blueprint

NVIDIA kündigt (16. März 2026) das NVIDIA Agent Toolkit als Open-Source-Plattform an, die u. a. die Laufzeitumgebung OpenShell für sichere, autonome Enterprise-AI-Agenten („Claws“) umfasst. Kernbaustein ist der AI‑Q Blueprint, der laut NVIDIA eine Hybrid-Architektur nutzt (Frontier-Modelle + Nemotron-Modelle) und damit die Query-Kosten halbieren kann. NVIDIA nennt Integrationspartner wie Adobe, Atlassian, Salesforce, SAP, Siemens und CrowdStrike sowie Sicherheitskooperationen u. a. mit Cisco, Google und Microsoft. Jensen Huang beschreibt das als Start einer „agentischen“ Evolution der Enterprise-Software.

Quelle: NVIDIA Newsroom

Anthropic erklärt Qualitätsprobleme bei Claude Code: drei Ursachen identifiziert und bis v2.1.116 behoben

Anthropic berichtet (23. April 2026), dass Qualitätsprobleme in Claude Code auf drei separate Änderungen zurückgingen und die API nicht betroffen war. Unter anderem wurde am 4. März der Standard-Reasoning-Effort für Sonnet 4.6/Opus 4.6 von „high“ auf „medium“ gesenkt (am 7. April wieder auf „high“/„xhigh“ zurückgestellt) sowie ein Caching-Bug (26. März) löschte Denk-History in inaktiven Sessions und wurde am 10. April in v2.1.101 gefixt. Zusätzlich führte eine System-Prompt-Anweisung vom 16. April zur Reduzierung der Verbosität (u. a. Wortlimits zwischen Tool-Calls) zu schlechterer Coding-Qualität und wurde am 20. April in v2.1.116 rückgängig gemacht. Anthropic kündigt stärkeres Testing, breitere Evals und kontrolliertere Rollouts an.

Quelle: Anthropic Engineering

KI-Training & Forschung

DeepMind bringt Gemini Robotics‑ER 1.6: besseres räumliches Reasoning, Multi-View-Verständnis und „Instrument Reading“

DeepMind stellt (14. April 2026) Gemini Robotics‑ER 1.6 als Upgrade seines Reasoning-first-Modells für Robotik vor und berichtet deutliche Fortschritte gegenüber Gemini Robotics‑ER 1.5 und Gemini 3.0 Flash in Aufgaben wie Pointing, Zählen, Erfolgsdetektion und Multi-View-Verständnis. Neu ist „Instrument Reading“ (z. B. Druckmessgeräte, Sichtgläser, Thermometer), entwickelt in Zusammenarbeit mit Boston Dynamics für Spot-Roboter in Industrieanlagen. Das Modell kann Tools wie Google Search, Code-Ausführung, Pointing sowie Vision-Language-Action-Modelle (VLAs) nutzen. Gemini Robotics‑ER 1.6 ist laut DeepMind über Gemini API und Google AI Studio verfügbar.

Quelle: Google DeepMind

Industrie & Markt

OpenAI startet „ChatGPT for Clinicians“ (USA): kostenlos für verifizierte Kliniker – mit Benchmark-Anspruch auf hohe medizinische Qualität

OpenAI führt am 22. April 2026 „ChatGPT for Clinicians“ ein, eine kostenlose Version für verifizierte US-Ärzte, Nurse Practitioners, Physician Assistants und Apotheker, die klinische Aufgaben wie Dokumentation, Recherche und Beratung unterstützen soll. Laut OpenAI übertrifft GPT‑5.4 in diesem Clinicians-Workspace die Basisversion von GPT‑5.4, andere OpenAI/externe Modelle sowie menschliche Ärzte auf HealthBench Professional; 99,6 % der 6.924 getesteten Gespräche wurden als sicher und genau bewertet. OpenAI beschreibt kontinuierliche Verbesserungen u. a. durch die Überprüfung von über 700.000 Antworten durch Physician Advisors. Außerdem verweist OpenAI auf eine AMA-Umfrage 2026, nach der 72 % der Ärzte KI nutzen (gegenüber 48 % im Vorjahr).

Quelle: OpenAI

DeepMind kooperiert mit Südkorea: AI Campus in Seoul und Zugang zu Modellen wie AlphaGenome, AlphaEvolve und WeatherNext

Google DeepMind kündigt am 27. April 2026 eine Partnerschaft mit dem südkoreanischen Ministerium für Wissenschaft und ICT (MSIT) an, um wissenschaftliche Durchbrüche u. a. in Life Sciences sowie Wetter/Klima zu beschleunigen. Geplant ist ein AI Campus in Seoul als Hub für Forscher (genannt werden u. a. Seoul National University und KAIST) mit Zugang zu Modellen wie AlphaEvolve (Gemini-gestützter Coding-Agent für Algorithmus-Optimierung), AlphaGenome (Analyse von DNA-Mutationen), AlphaFold sowie WeatherNext. Zusätzlich sollen Internships für Studierende gefördert und gemeinsam mit dem Korean AI Safety Institute (AISI) an AI-Sicherheit gearbeitet werden. DeepMind nennt außerdem Unterstützung für K‑Moonshot Missions und das neue National AI for Science Center (NAIS).

Quelle: Google DeepMind

Hugging Face: 13 Mio. Nutzer und 2 Mio. öffentliche Modelle – aber 0,01 % der Modelle stehen für knapp die Hälfte aller Downloads

Hugging Face berichtet (Spring 2026) von 13 Millionen Nutzern, über 2 Millionen öffentlichen Modellen und mehr als 500.000 Datensätzen; die Aktivität sei nahezu verdoppelt. In den Download-Daten habe China die USA überholt (41 % der Downloads), während unabhängige Entwickler ihren Anteil von 17 % auf 39 % steigerten. Gleichzeitig haben laut Bericht rund die Hälfte der Modelle weniger als 200 Downloads, während die Top‑200 Modelle (0,01 %) 49,6 % aller Downloads ausmachen. Als Trends nennt Hugging Face u. a. kleinere Modelle (Median 406 Mio. Parameter) sowie starkes Wachstum in Robotik-Datensätzen (von 1.145 auf 26.991).

Quelle: Hugging Face

Share this article
The link has been copied!