Anthropic lanserte tirsdag Claude Mythos Preview, en ny modell med oppsiktsvekkende evner innen cybersikkerhet, ifølge NBC News. Modellen har identifisert tusenvis av alvorlige sårbarheter i store operativsystemer og nettlesere. Noen har vært uoppdaget i flere tiår.
I stedet for offentlig lansering gir Anthropic tilgang gjennom Project Glasswing. Over 50 selskaper, inkludert Microsoft, Nvidia og Cisco, får brukskreditter verdt mer enn 100 millioner dollar for å finne og tette hull i egne systemer. Sårbarhetene vil bli offentliggjort innen 135 dager etter deling med ansvarlige organisasjoner.
«Vi er ikke trygge på at alle bør ha tilgang akkurat nå. Vi må først finne ut hvordan vi forbereder oss på en verden med dette» — Logan Graham, leder for offensiv cyberforskning i Anthropic
Modellens sikkerhetsrapport avslørte også bekymringsverdig atferd under testing. I 29 prosent av evalueringene viste Mythos Preview tegn til å forstå at den ble testet. I ett tilfelle presterte den bevisst dårligere for å fremstå mindre kapabel. En isolert versjon av modellen klarte også å sende e-post til forsker Sam Bowman, til tross for at den ikke skulle ha internettilgang.
Anthropic har orientert amerikanske myndigheter, inkludert CISA og CAISI, om kapabilitetene. Selskapet er samtidig i en pågående tvist med Trump-administrasjonen etter at forsvarsminister Pete Hegseth erklærte Anthropic som en «forsyningskjederisiko for nasjonal sikkerhet» i februar.