En liten gruppe har brukt Anthropics Claude Mythos Preview regelmessig siden 7. april, modellen Anthropic selv har beskrevet som «for farlig til offentlig utgivelse», skriver Bloomberg. Medlemmene, flere aktive i samme private forum, fikk tilgang gjennom et testmiljø hos en tredjepart som jobber for Anthropic. Én av de involverte er ansatt hos underleverandøren, resten gjettet seg frem til URL-en basert på mønsteret Anthropic bruker for andre modellendepunkter.
Tilgangen startet samme dag som Anthropic annonserte Mythos som et lukket cyber-verktøy distribuert til 40 store selskaper, fra Apple til Google. Ifølge kildene har gruppa brukt Mythos til generelle oppgaver, ikke til å lete etter sårbarheter. Anthropic har tidligere omtalt Mythos som trent spesifikt for å finne nulldagshull i nettlesere og operativsystemer.
«Vi etterforsker en rapport som hevder uautorisert tilgang til Claude Mythos Preview gjennom ett av våre tredjepartsleverandør-miljøer. Vi har ingen indikasjoner på at Anthropics egne systemer er berørt.» — Anthropic, skriftlig uttalelse til Bloomberg
Hendelsen illustrerer en klassisk sikkerhetssvakhet: når en modell er «for farlig» til offentlig utgivelse, flyttes risikoen bare ned i leverandørkjeden. Selv om gruppa i dette tilfellet ikke brukte Mythos til angrep, viser episoden at URL-gjetting og løse tredjepartstilganger er nok til å omgå et «stengt» utrullingsopplegg. Det er også andre gang på en måned Anthropics Mythos-distribusjon havner i overskriftene av feil grunn.
Hva bør du gjøre?
- Sjekk om Mythos-endepunktet er eksponert i dine integrasjoner. Er du en av de 40 partnerne eller jobber via en slik, logg og begrens tilgangen strengt inntil Anthropic bekrefter at lekkasjeveien er tettet.
- Ikke stol på URL-obfuskering som sikkerhet. Gruppa gjettet seg frem basert på Anthropics mønster for andre modeller. Bruk autentisering, signerte tokens og IP-filter, ikke en hemmeligholdt sti.
- Revurder tredjepartstilganger til ikke-offentlige modeller. Hvis et «lukket» produkt er tilgjengelig for underleverandører uten stram gating, er «lukket» i praksis ikke lukket. Krev attestasjon og audit-log fra leverandører som administrerer test-miljøer.