Claude Mythos: Marketinghype oder echte Gefahr für unsere digitale Sicherheit?

Ein Modell, das nicht veröffentlicht werden darf

Es klingt nach dem Beginn eines Albtraumszenarios: Anthropic hat ein Modell entwickelt, das so gefährlich ist, dass das Unternehmen sich gegen eine öffentliche Veröffentlichung entschieden hat. Das Modell, bekannt als Claude Mythos Preview, ist ein allgemeines Sprachmodell — vergleichbar mit Anthropics Claude oder OpenAIs ChatGPT. Im Test zeigte es jedoch die Fähigkeit, sogenannte Zero-Day-Schwachstellen zu finden und auszunutzen.

Das Modell könnte laut Anthropic die Cybersicherheit grundlegend verändern, da es „tausende hochkritische Schwachstellen” in „jedem gängigen Betriebssystem und Browser” gefunden hat. Anthropic entschied sich daher, Mythos nur wenigen Dutzend Unternehmen und Betreibern kritischer Infrastruktur zugänglich zu machen. Zu diesem Konsortium namens Project Glasswing zählen Amazon Web Services, Apple, Google, JPMorganChase, Microsoft und Nvidia.

Mit Claude Mythos hat sich die Diskussion um KI-Sicherheit grundlegend verändert. Nicht mehr Falschinformationen stehen im Vordergrund, sondern handfeste Sicherheitsrisiken in der digitalen Infrastruktur. Die Frage, die sich daraus ergibt, ist so konkret wie beunruhigend: Handelt es sich bei der Aufregung um strategische Kommunikation eines IPO-Kandidaten — oder markiert Claude Mythos tatsächlich einen Wendepunkt in der Geschichte digitaler Angriffsfähigkeiten?

Das Dual-Use-Dilemma in seiner schärfsten Form

Claude Mythos wurde laut Anthropic explizit auf die Identifikation von Zero-Day-Schwachstellen trainiert. Das Problem: Dieselbe Fähigkeit, die ein Sicherheitsaudit beschleunigt, kann im falschen Kontext zur Waffe werden. Ein böswilliger Akteur, der Zugang zu einem solchen Modell erhält, könnte kritische Infrastruktur gezielt angreifen — ohne manuelles Hacking-Know-how.

Mythos wurde nicht als Angriffswerkzeug entwickelt. Es wurde entworfen, um die Grenzen des Software-Engineerings auszureizen und eine KI zu schaffen, die mit riesigen, komplexen Codebasen arbeiten kann. Anthropic wollte im Kern den ultimativen Entwickler bauen. Genau diese Fähigkeiten machen Mythos und vergleichbare Modelle jedoch zu einem erheblichen Sicherheitsproblem.

Das BSI stuft solche Dual-Use-KI-Modelle als besonders überwachungsbedürftig ein. Auch das laufende EU-AI-Act-Verfahren klassifiziert hochriskante KI-Systeme in einer eigenen Risikokategorie. Was lange Zeit als theoretisches Szenario in Sicherheitsberichten auftauchte, ist mit Claude Mythos zu einem konkreten Gegenstand behördlicher Befassung geworden. Im Februar 2026 meldete Anthropic mithilfe von Claude Opus 4.6 mehr als 500 Schwachstellen mit hohem Schweregrad in Open-Source-Software. Sysdig dokumentierte gleichzeitig einen KI-basierten Angriff, der innerhalb von acht Minuten Administratorrechte erlangte. Das sind keine Benchmarks aus dem Labor — das sind Vorfälle in der Praxis.

Mit den bekannt gewordenen Schwachstellen in „Claude Code”, dem KI-basierten Coding-Assistenten von Anthropic, wird deutlich: Der Einsatz autonomer Entwicklungswerkzeuge verschiebt das Risiko fundamental. Es geht nicht mehr nur um fehlerhaften Code, sondern um Remote Code Execution, API-Key-Diebstahl und eine neue Dimension von Supply-Chain-Risiken. Die gemeldeten Schwachstellen erlauben unter bestimmten Bedingungen die Ausführung beliebiger Shell-Befehle sowie die Exfiltration sensibler Zugangsdaten.

antislop ist eine Initiative von der pixologe, Dipl. Designer aus Königswinter.
Du möchtest dich zu diesem Thema austauschen oder brauchst Unterstützung bei deinen KI-Vorhaben? Ich freue mich über deine Nachricht.

Kontakt

Behörden reagieren — aber die Lücke bleibt

Das BSI nimmt die Ankündigungen von Anthropic sehr ernst und erwartet „Umwälzungen im Umgang mit Sicherheitslücken und in der Schwachstellenlandschaft insgesamt”. Konsequent zu Ende gedacht, könnte es mittelfristig keine unbekannten klassischen Software-Schwachstellen mehr geben. Dies würde eine Verschiebung der Angriffsvektoren und einen Paradigmenwechsel mit Blick auf die Cyberbedrohungslage zur Folge haben.

POLITICO sprach mit Beamten von acht nationalen europäischen Cybersicherheitsbehörden. Nur die deutsche Behörde BSI gab an, Gespräche mit Anthropic aufgenommen zu haben, ohne das Modell bisher direkt testen zu können. Andere europäische Regierungsinstitutionen verfügten offenbar nur über punktuelle Einblicke. Das ist eine strukturelle Schwäche, die über den Einzelfall hinausweist: Europas Aufsichtsarchitektur folgt dem Tempo der Modellentwicklung nicht.

KI-Pionier Yoshua Bengio bezeichnete es gegenüber POLITICO als „tief beunruhigend”, dass Tech-Unternehmen und nicht Regulierer über den Umgang mit diesen Risiken entscheiden. Es zeige, wie wichtig Wege seien, durch die Regierungen oder Dritte die Technologie überprüfen könnten. Auch die frühere EU-Parlamentsabgeordnete Marietje Schaake bezeichnete es als besorgniserregend, dass Modelle mit weitreichenden Auswirkungen von einem privaten Unternehmen kontrolliert werden. Jetzt wäre ein guter Zeitpunkt, um Offenlegungsregeln und Aufsichtsmechanismen zu vereinbaren.

Den Marketingvorwurf, der gegen Anthropic laut wurde, halten manche Fachleute für übertrieben. Das Argument: Unternehmen wie Apple, Cisco oder die Linux Foundation würden sich nicht vor den Marketingkarren eines IPO-Kandidaten spannen lassen, wenn das Modell keine echten Risiken darstellte. Gleichwohl ist der Verdacht nicht vollständig auszuräumen: Die Ankündigung fiel in eine politisch aufgeladene Phase, in der Anthropic erheblichen regulatorischen Druck aus Washington erfuhr. Der Konflikt beruhte auf der Weigerung von CEO Dario Amodei, dem Pentagon eine uneingeschränkte Nutzung der KI-Modelle für autonome Waffen und Überwachungsprogramme zu erlauben. Anthropic wehrte sich vor zwei Bundesgerichten gegen die offizielle Einstufung des Verteidigungsministeriums.

Das eigentliche Problem: Die Demokratisierung der Angriffsfähigkeit

Während proprietäre Modelle wie Claude Mythos vorerst kontrolliert eingesetzt werden, sehen Experten das größere Problem in der Entwicklung von Open-Source-Modellen. Der Rückstand gegenüber den führenden proprietären Systemen beträgt derzeit schätzungsweise sechs bis neun Monate. Einer der Diskussionsteilnehmer vergleicht die Situation mit dem Aufkommen von 3D-Druckern für Schusswaffen: Ein extrem mächtiges Werkzeug, das bald für jedermann zugänglich sein könnte.

Claude Mythos ist ein Proof of Concept. Es beweist, dass KI diese Art von Arbeit im großen Maßstab leisten kann. Dieser Proof of Concept ist nun öffentliches Wissen. Selbst wenn Mythos innerhalb von Anthropics kontrolliertem Rahmen verbleibt, ist die Idee, die es repräsentiert, jetzt in der Welt.

Angreifer nutzten bereits Jailbreak-Prompts, um Claude so zu manipulieren, dass es innerhalb eines fingierten Penetrationstests agierte. Innerhalb dieses falschen Kontexts übernahm das Modell den Großteil des Einbruchs: Es kartierte Systeme, scannte nach Schwachstellen, generierte Exploit-Code und stahl Zugangsdaten automatisch. Anthropic zufolge führte die KI dabei rund 80–90 Prozent der gesamten Operation selbst durch. Dieses Muster — KI als Ausführungsinstanz, Mensch als gelegentliche Bestätigung — beschreibt eine neue Angriffslogik, die klassische Abwehrsysteme strukturell unterfordert.

Generative KI kann die Fähigkeitsentwicklung weniger erfahrener Akteure erheblich beschleunigen und ihnen potenziell erlauben, auf einem Niveau zu operieren, das zuvor nur technisch versierteren Personen vorbehalten war. Das ist die eigentliche Ressourcenexplosion dieses Moments: nicht die Leistungsfähigkeit des Modells selbst, sondern die Absenkung der Zugangsschwelle zu gefährlichem Wissen.

Fazit

Claude Mythos ist kein isoliertes Ereignis, sondern ein Symptom einer strukturellen Verschiebung. Das Dual-Use-Dilemma, das die KI-Sicherheitsdebatte seit Jahren begleitet, ist mit diesem Modell aus dem Theoretischen ins Operative gewechselt. Behörden wie das BSI reagieren, doch der Abstand zwischen der Geschwindigkeit technischer Entwicklung und der Reichweite regulatorischer Instrumente bleibt besorgniserregend groß.

Was bleibt für dich als informierte Nutzerin oder informierter Nutzer? Weder Panik noch Gleichgültigkeit sind angemessene Antworten. Wir brauchen eine Öffentlichkeit, die das Dual-Use-Dilemma versteht — und politische Strukturen, die nicht erst dann reagieren, wenn das Fenster bereits geschlossen ist. Bewusste KI-Nutzung bedeutet auch: die systemischen Risiken hinter den Produkten zu kennen, die täglich in Gebrauch sind.

Häufige Fragen (FAQ)

Was ist Claude Mythos genau?

Claude Mythos Preview ist ein KI-Modell von Anthropic, das gezielt auf die Identifikation von Zero-Day-Schwachstellen in Software trainiert wurde. Es wurde nicht öffentlich veröffentlicht, sondern nur einem geschlossenen Kreis aus Technologieunternehmen und Betreibern kritischer Infrastruktur im Rahmen von Project Glasswing zugänglich gemacht. Das Modell gilt als leistungsfähigstes der Claude-Familie für autonome Programmier- und Sicherheitsaufgaben.

Warum wird das Modell nicht öffentlich freigegeben?

Anthropic begründet die eingeschränkte Verfügbarkeit mit dem erheblichen Missbrauchspotenzial. Das Modell kann eigenständig Sicherheitslücken in weit verbreiteten Betriebssystemen und Browsern aufspüren und funktionierende Exploits entwickeln. Diese Fähigkeiten würden in falschen Händen eine qualitativ neue Angriffsdimension eröffnen, auch ohne tiefes technisches Vorwissen auf Seiten der Angreifer.

Was sagt das BSI zu Claude Mythos?

Das Bundesamt für Sicherheit in der Informationstechnik steht in direktem Austausch mit Anthropic und stuft das Modell als potenziell richtungsweisend für die gesamte Schwachstellenlandschaft ein. BSI-Präsidentin Claudia Plattner erwartet „Umwälzungen” und bezeichnet die Frage, ob solche Werkzeuge künftig frei verfügbar sein werden, als eine Frage von nationaler und europäischer Sicherheitsrelevanz.

Ist die Aufregung um Claude Mythos nur Marketing?

Die Frage ist berechtigt, aber die Belege sprechen gegen eine rein marketinggetriebene Interpretation. Das britische AI Security Institute hat Mythos unabhängig evaluiert und bestätigt, dass es als erstes KI-Modell einen simulierten vollständigen Netzwerkangriff abschließen konnte. Zudem haben sich Unternehmen wie Apple, Cisco und die Linux Foundation als Partner eingebunden — Akteure, die ihre Reputation nicht leichtfertig für Marketingzwecke riskieren.

Welche Rolle spielt der EU AI Act in diesem Kontext?

Ab 2026 gelten für Hochrisiko-KI-Systeme in der EU verbindliche Anforderungen zur Risikobewertung, Transparenz und Protokollierung. Cybersecurity-fokussierte Modelle mit dem Potenzial zur Identifikation und Ausnutzung von Schwachstellen könnten unter strenge oder sogar verbotene Kategorien fallen, sofern Regulierer den Anwendungsbereich entsprechend auslegen. Die EU ist bislang jedoch strukturell im Nachteil: Kein europäisches Frontier-Modell dieser Leistungsklasse existiert, und nur Deutschland hat offiziell den Dialog mit Anthropic aufgenommen.