Anthropic slipper Claude Fable 5: Mythos-modellen blir offentlig tilgjengelig

Anthropic slipper Claude Fable 5 til offentligheten, en nedtonet utgave av Claude Mythos, modellen selskapet tidligere holdt tilbake fordi den var for kraftig innen hacking og bioteknologi. Det melder CyberScoop. Fable 5 er ifølge Anthropic «samme underliggende modell» som Mythos, men svar på et smalt sett emner, blant annet cybersikkerhet og biologi, hentes fra den allerede offentlige Claude Opus 4.8 i stedet.

Forskjellen i kapasitet er målbar. På en test av ende-til-ende-exploits skåret Opus 4.8 i snitt 5 av 16, mot Mythos sine nær 10. Uten sikkerhetsmekanismer kan Opus 4.8 likevel reprodusere nesten 80 % av kjente sårbarheter i ekte åpen kildekode-prosjekter gitt en grov beskrivelse, og Anthropics safeguards skal kutte den raten til 1 %. Det er den vakten Fable 5 lener seg på.

Anthropic sier rød-team-testing ikke fant noen «universelle» jailbreak-teknikker, men presiserer ikke om delvise teknikker ble funnet. Selskapet endrer samtidig datalagringen: all brukertrafikk på Fable og Mythos beholdes i 30 dager, både på egne plattformer og hos tredjeparter. Anthropic sier dataene ikke brukes til å trene nye modeller.

For deg som bygger med Claude betyr det to ting. Du får tilgang til en svært kapabel modell, men classifierne er bevisst forsiktige, så også legitime forespørsler innen sikkerhet og biologi kan bli flagget og rutet til en svakere modell.

Hva bør du gjøre?

Forvent ruting, ikke avslag: sikkerhets- og biologi-spørsmål besvares av Opus 4.8, så bygger du sikkerhetsverktøy, test om svarkvaliteten holder for ditt bruk.

Regn med falske positiver: benigne forespørsler kan trigge classifierne. Logg hvilke prompter som blir rutet, så du kan justere formuleringene.
Ta høyde for 30 dagers datalagring på Fable- og Mythos-trafikk før du sender sensitive data gjennom modellen.