KI-Training & Forschung

Nature: „The AI Scientist“ schreibt Paper, führt Experimente aus – und kommt durch Peer Review

Laut Nature kann „The AI Scientist“ Ideen generieren, Code schreiben, Experimente ausführen und ein Manuskript inklusive Selbst-Review erstellen. Ein AI-generiertes Paper erhielt Reviewer-Scores 6/7/6 (Ø 6,33) und lag damit über dem Workshop-Akzeptanzschwellenwert; es rangierte in den Top 45 % der Einreichungen. Ein automatischer Reviewer sagte Akzeptanzentscheidungen mit 69 % balanced accuracy (vs. 66 % menschlich) voraus.

Quelle: Nature

DeepMind stellt AI Co-Clinician vor – übertrifft GPT-5.4 und Claude auf RxQA, 97 von 98 Fälle ohne kritischen Fehler

Google DeepMind hat am 30. April 2026 die Forschungsinitiative „AI Co-Clinician“ vorgestellt – ein System mit dualer Agenten-Architektur, in der ein Planner-Modul den patientenfacing Talker kontinuierlich auf sichere klinische Grenzen überwacht. Auf dem RxQA-Benchmark (OpenFDA-Arzneidaten, offene Fragen) übertrifft das System laut DeepMind andere Frontier-Modelle inklusive GPT-5.4 und Claude. In einer randomisierten Simulation mit 20 Szenarien erreichte der Co-Clinician Hausärzt:innen-Niveau oder besser in 68 von 140 Konsultations-Bereichen; bei 98 realistischen Primary-Care-Abfragen verzeichnete das System 97 Fälle ohne kritischen Fehler. Evaluierungen laufen mit Partnern in USA, Indien, Australien, Neuseeland, Singapur und den VAE.

Quelle: Google DeepMind

arXiv: Neuer Fairness-Benchmark vergleicht One-Step-Flow-Generatoren gegen SD3.5 und FLUX.1

Das Paper benchmarkt acht class-conditional Bildgeneratoren – unter anderem MeanFlow, iMF und SoFlow gegen Stable Diffusion 3.5 Large und FLUX.1-dev – unter kontrollierten Protokollen. Neu sind der OOD-Datensatz „reLAIONet“ (25.252 geprüfte Web-Bilder, 757 Klassen) und die Kompositmetrik MMHM, die FID, IS, CLIP und Pick balanciert. Ergebnis: One-Step-Modelle können bei Metriken mithalten, zeigen aber visuelle Artefakte; reine FID-Optimierung verschlechtert oft andere Qualitätsmaße.

Quelle: arXiv

Industrie & Markt

Samsung Q1-Zahlen: HBM-Mangel dauert „mindestens bis 2027“ – Halbleitersparte mit 36,1 Mrd. USD operativem Gewinn

In Samsungs vollem Q1-Bericht vom 30. April 2026 warnte Memory-Chef Kim Jaejune vor „signifikanten Engpässen“ über alle Speicherprodukte hinweg bis mindestens 2027 – Kunden buchen Kapazitäten bereits Jahre im Voraus. Samsungs Halbleitersparte meldete 53,7 Billionen Won (rund 36,1 Mrd. USD) operativen Gewinn und damit etwa 94 % des Quartalsgewinns, getrieben von explodierender AI-Memory-Nachfrage und Rekordumsätzen. Parallel verschieben Samsung und SK Hynix ihre Big-Tech-Kunden (u. a. AMD, Microsoft, Google) laut TrendForce zunehmend von Jahresverträgen auf Long-Term-Agreements über drei bis fünf Jahre. Analysten erwarten, dass sich die Enge vom HBM-Markt in den gesamten DRAM-Markt ausweitet.

Quelle: Tom's Hardware

China: Gerichte untersagen Kündigungen „um durch KI zu ersetzen“ – Präzedenzfall aus Hangzhou

Gerichte in Hangzhou (Yuhang District Court, bestätigt vom Intermediate People’s Court) haben entschieden, dass Entlassungen allein zum Zweck kostensparender KI-Automatisierung kein legaler Kündigungsgrund sind. In einem Fall wurde eine Gehaltskürzung von 25.000 auf 15.000 Yuan und die Versetzung einer Mitarbeiterin als Reaktion auf KI-Einsatz als unrechtmäßig eingestuft. Das Gericht veröffentlichte die typischen Fälle am 28. April und betonte, KI solle Arbeit „befreien“ und Beschäftigung fördern.

Quelle: The Business Times

Anthropic steigt zum 380-Mrd.-USD-Lager auf: Alphabet bestätigt 40-Mrd.-Commitment, Amazon schiebt bis 20 Mrd. nach

Alphabet hat seine Anthropic-Beteiligung weiter ausgebaut: 10 Mrd. USD fließen bei einer Bewertung von 350 Mrd. USD sofort, weitere 30 Mrd. sind an Performance-Meilensteine gekoppelt – Gesamtvolumen bis zu 40 Mrd. USD, bestätigt per WSJ, Bloomberg und Reuters zwischen 24. und 27. April 2026. Vier Tage zuvor hatte Amazon 5 Mrd. USD frisch investiert und bis zu 20 Mrd. weitere an kommerzielle Meilensteine gebunden. Hintergrund: Anthropics annualisierter Umsatz liegt laut Axios bei über 30 Mrd. USD, die Zahl der Kund:innen mit mehr als 1 Mio. USD Jahresausgabe hat sich binnen zwei Monaten verdoppelt. Der Sekundärmarkt handelt Anthropic-Anteile bereits bei 800 Mrd. USD oder mehr; ein IPO wird laut TechCrunch „so früh wie Oktober 2026“ diskutiert.

Quelle: Reuters

Regulierung & Sicherheit

Chinas Cyberspace Administration startet „Qinglang 2026“-Kampagne gegen KI-Missbrauch – neue Regeln für anthropomorphe Chatbots und digitale Avatare

China hat am 30. April 2026 die jährliche „Qinglang“-Kampagne gegen KI-Missbrauch gestartet, koordiniert von der Cyberspace Administration of China (CAC) zusammen mit dem Ministerium für Öffentliche Sicherheit; im Fokus stehen KI-gestützter Betrug, Deepfakes, Desinformation und Verstöße gegen Datenschutz und Urheberrecht. Die Kampagne baut auf einem deutlich erweiterten Regelwerk auf: Die am 10. April veröffentlichten Interim Measures for Anthropomorphic AI Interactive Services regeln Chatbots und KI-Companions und treten am 15. Juli 2026 in Kraft. Ergänzend lagen Draft-Regeln für digitale virtuelle Menschen (vom 3. April, Kommentierung bis 6. Mai) sowie eine April-Agenda zum Schutz persönlicher Daten in sieben Sektoren (u. a. Internetwerbung, Bildung, Gesundheit, Kriminaldatenhandel) bereits vor. Zeitgleich beschuldigte das Weiße Haus China in derselben Woche, „in industriellem Ausmaß“ KI-Know-how zu stehlen.

Quelle: The Next Web

Share this article
The link has been copied!