Sonnet 5 kan koste mer per oppgave enn Opus 4.8, tross lavere token-pris

Latent.Space sin AINews-gjennomgang av lanseringen 30. juni samler benchmark-tallene som ikke kom fram i selve lanseringsmeldingen. Anthropic satte listeprisen til 3 dollar input og 15 dollar output per million tokens, med en kampanjepris på 2 og 10 dollar fram til 31. august. Men Artificial Analysis målte at Sonnet 5 koster cirka 2,29 dollar per oppgave på deres Intelligence Index, altså omtrent dobbelt så mye som Sonnet 4.6 og rundt 15 prosent mer enn Opus 4.8.

Grunnen er verbositet. Modellen brukte i snitt cirka 69 000 output-tokens per oppgave, og på agent-benchmarkene AA-Briefcase og GDPval-AA tok den rundt 3x så mange runder som forgjengeren. På maks effort-nivå ble det opptil 6x flere runder enn på lav effort. For deg som bygger langvarige agent-looper betyr det at token-budsjettet ditt kan sprekke selv om prisskiltet ser billigere ut.

Simon Willison påpekte en ekstra kostnadsfelle: den nye tokenizeren gjør Sonnet 5 rundt 1,4x dyrere for engelsk tekst og 1,33x for spansk, mens forenklet kinesisk er omtrent uendret. Det forsterker gapet mellom listepris og faktisk regning når du sammenligner modeller på samme oppgave.

«Production people will be happy; personal wow-factor is low.» — @dejavucoder, sitert i Latent.Space

På ren kapabilitet er dette likevel et reelt løft. Sonnet 5 scorer 53 på Artificial Analysis Intelligence Index, 6 poeng over Sonnet 4.6, og lander på femteplass totalt, omtrent likt med GPT-5.5 på høy reasoning, men fortsatt bak Opus 4.7 og 4.8. Cursor målte 57 prosent på CursorBench mot 49 prosent for 4.6, og Cognition rapporterte at Sonnet 5 slår Opus 4.8 på deres FrontierCode Extended med 53,8 prosent.

Den andre historien er Fable 5 som aldri kom. Rykter i forkant koblet Sonnet 5-lanseringen til en ny-utgivelse av Anthropics kraftigere Fable-modell, angivelig bak et eget kreditt-system med identitetsverifisering. Da lanseringen kom uten Fable, tolket flere det som en trøste-utgivelse mens frontier-modellen holdes tilbake. «It's been 18 days since Fable 5 was banned», skrev Theo. Anthropic har ikke bekreftet noe av dette, så behandle det som spekulasjon bygd på app-streng-tolkning.

Én konkret oppside for agent-byggere: Cline framhevet at Sonnet 5 er mer motstandsdyktig mot prompt-injection-kapring, relevant hvis du kjører autonome terminal- eller browser-agenter uten manuell godkjenning.

Hva bør du gjøre?

Før du gjør Sonnet 5 til default-modell, kjør din egen eval på et representativt oppgavesett og mål kostnad per løst oppgave, ikke per token. Sammenlign totalregningen mot Opus 4.8, ikke bare listeprisen. Bruker du modellen i agent-looper, bør du sette et effort-tak, siden de nye nivåene (max, xhigh, high, medium, low) styrer antall runder direkte og maks kan koste 6x mer enn lav på samme oppgave.

På gjentakende kontekst er cache-rabatten verdt å utnytte. Cache-treff koster 0,30 dollar per million tokens, en rabatt på 90 prosent, og 5-minutters TTL passer tette agent-looper godt.