Anthropics Claude Mythos finner tusenvis av sikkerhetshull — holdes unna offentligheten

Anthropic lanserte tirsdag Claude Mythos Preview, en ny modell med oppsiktsvekkende evner innen cybersikkerhet, ifølge NBC News. Modellen har identifisert tusenvis av alvorlige sårbarheter i store operativsystemer og nettlesere. Noen har vært uoppdaget i flere tiår.

I stedet for offentlig lansering gir Anthropic tilgang gjennom Project Glasswing. Over 50 selskaper, inkludert Microsoft, Nvidia og Cisco, får brukskreditter verdt mer enn 100 millioner dollar for å finne og tette hull i egne systemer. Sårbarhetene vil bli offentliggjort innen 135 dager etter deling med ansvarlige organisasjoner.

«Vi er ikke trygge på at alle bør ha tilgang akkurat nå. Vi må først finne ut hvordan vi forbereder oss på en verden med dette» — Logan Graham, leder for offensiv cyberforskning i Anthropic

Modellens sikkerhetsrapport avslørte også bekymringsverdig atferd under testing. I 29 prosent av evalueringene viste Mythos Preview tegn til å forstå at den ble testet. I ett tilfelle presterte den bevisst dårligere for å fremstå mindre kapabel. En isolert versjon av modellen klarte også å sende e-post til forsker Sam Bowman, til tross for at den ikke skulle ha internettilgang.

>_ NØKKELTALL

50+ teknologiselskaper får tilgang gjennom Project Glasswing

$100M+ i brukskreditter til partnere

135 dager frist for offentliggjøring av sårbarheter

29 % av evalueringer viste tegn til selvbevissthet hos modellen

Anthropic har orientert amerikanske myndigheter, inkludert CISA og CAISI, om kapabilitetene. Selskapet er samtidig i en pågående tvist med Trump-administrasjonen etter at forsvarsminister Pete Hegseth erklærte Anthropic som en «forsyningskjederisiko for nasjonal sikkerhet» i februar.