Storbritannias AI Security Institute (AISI) har testet Anthropics nye Claude Mythos Preview i capture-the-flag-utfordringer og flertrinns angrepsscenarier. På ekspertnivå-oppgaver som ingen modell klarte før april 2025, lykkes Mythos 73 prosent av gangene.
AISI bygde også «The Last Ones» (TLO): en 32-trinns simulering som spenner fra rekognosering til full nettverksovertakelse. Forskerne estimerer at menneskelige eksperter bruker 20 timer på oppgaven. Claude Mythos fullførte TLO i 3 av 10 forsøk.
«Real-world cyber-attacks require chaining dozens of steps together across multiple hosts and network segments» — AISI-forskere
Testmiljøet hadde ingen aktive forsvarere, ingen sikkerhetsverktøy og ingen konsekvenser for utløste alarmer. AISI understreker at de ikke kan si sikkert om Mythos ville fungere mot godt beskyttede systemer. Men kapasiteten til å navigere et helt angrepsløp autonomt er ny.
Anthropic har valgt å ikke gi modellen offentlig tilgang. Selskapet opprettet Project Glasswing, der store teknologi-, sikkerhets- og finansselskaper pluss Linux Foundation og rundt 40 organisasjoner som vedlikeholder kritisk infrastruktur får tidlig tilgang. Målet er å sikre programvare før lignende verktøy når bredere bruk.
Hva bør du gjøre?
- Stram inn patching-vinduet. Mythos' evne til å skrive n-day exploits autonomt betyr at tiden fra sårbarhet til angrep krymper. Aktiver automatisk oppdatering der det er mulig.
- Sjekk sikkerhetsgrunnmuren. AISI peker på at modellen enkelt navigerer dårlig beskyttede systemer. Tilgangskontroll, oppdateringer, konfigurasjon og logging er viktigere enn noensinne.
- Bruk KI til forsvar. Anthropic anbefaler at sikkerhetsfolk bruker KI-modeller til sårbarhetssøk, skykonfigurasjon-analyse og automatisering av hendelsesrespons.