Dette er nytt i Claude Sonnet 5

Anthropic slapp Claude Sonnet 5 den 30. juni, og oppgir selv at ytelsen ligger nær Opus 4.8 til lavere pris, skriver utvikler Simon Willison etter å ha lest utviklerdokumentasjonen.

«Ytelsen ligger nær Opus 4.8, men til lavere priser.» — Anthropic, om Claude Sonnet 5

De praktiske endringene for deg som bygger: modellen har 1 million tokens kontekst og opptil 128 000 output-tokens, adaptiv tenkning er på som standard med mindre du slår den av, og sampling-parameterne temperature, top_p og top_k støttes ikke lenger. Verktøy og plattformfunksjoner er de samme som i Sonnet 4.6.

Listeprisen er identisk med Sonnet 4.6, altså $3 per million input-tokens og $15 per million output, med introduksjonsrabatt til $2/$10 ut 31. august. Haken er den nye tokenizeren: samme tekst gir rundt 30 % flere tokens enn i Sonnet 4.6, noe som i praksis spiser mye av rabatten. Willisons egne målinger viser at effekten varierer sterkt med språk.

>_ NØKKELTALL

1,4× flere tokens for engelsk tekst enn Sonnet 4.6

1,33× for spansk

1,28× for Python-kode

1,0× for forenklet mandarin (ingen endring)

Hva bør du gjøre?

Mål tokenforbruket på dine egne typiske dokumenter med Anthropics token-teller før du flytter produksjonslast, siden påslaget varierer med språk og innhold.
Fjern temperature, top_p og top_k fra API-kallene dine, de gir nå feil mot Sonnet 5.
Vil du styre kostnad og latens, slå av adaptiv tenkning eksplisitt med "thinking": {"type": "disabled"}.