Anthropic slapp Claude Sonnet 5 den 30. juni, og oppgir selv at ytelsen ligger nær Opus 4.8 til lavere pris, skriver utvikler Simon Willison etter å ha lest utviklerdokumentasjonen.
«Ytelsen ligger nær Opus 4.8, men til lavere priser.» — Anthropic, om Claude Sonnet 5
De praktiske endringene for deg som bygger: modellen har 1 million tokens kontekst og opptil 128 000 output-tokens, adaptiv tenkning er på som standard med mindre du slår den av, og sampling-parameterne temperature, top_p og top_k støttes ikke lenger. Verktøy og plattformfunksjoner er de samme som i Sonnet 4.6.
Listeprisen er identisk med Sonnet 4.6, altså $3 per million input-tokens og $15 per million output, med introduksjonsrabatt til $2/$10 ut 31. august. Haken er den nye tokenizeren: samme tekst gir rundt 30 % flere tokens enn i Sonnet 4.6, noe som i praksis spiser mye av rabatten. Willisons egne målinger viser at effekten varierer sterkt med språk.
Hva bør du gjøre?
- Mål tokenforbruket på dine egne typiske dokumenter med Anthropics token-teller før du flytter produksjonslast, siden påslaget varierer med språk og innhold.
- Fjern temperature, top_p og top_k fra API-kallene dine, de gir nå feil mot Sonnet 5.
- Vil du styre kostnad og latens, slå av adaptiv tenkning eksplisitt med "thinking": {"type": "disabled"}.