Hopp til hovedinnhold
PULSEN_
ESC Tilbake til strømmen
Simon Willison's Weblog · 3T SIDEN · modell

Dette er nytt i Claude Sonnet 5

SYNOPSIS_GENERERT

Claude Sonnet 5 yter nær Opus 4.8 til lavere pris, men en ny tokenizer gir rundt 30 % flere tokens per tekst, som i praksis spiser mye av rabatten.

Anthropic slapp Claude Sonnet 5 den 30. juni, og oppgir selv at ytelsen ligger nær Opus 4.8 til lavere pris, skriver utvikler Simon Willison etter å ha lest utviklerdokumentasjonen.

«Ytelsen ligger nær Opus 4.8, men til lavere priser.» — Anthropic, om Claude Sonnet 5

De praktiske endringene for deg som bygger: modellen har 1 million tokens kontekst og opptil 128 000 output-tokens, adaptiv tenkning er på som standard med mindre du slår den av, og sampling-parameterne temperature, top_p og top_k støttes ikke lenger. Verktøy og plattformfunksjoner er de samme som i Sonnet 4.6.

Listeprisen er identisk med Sonnet 4.6, altså $3 per million input-tokens og $15 per million output, med introduksjonsrabatt til $2/$10 ut 31. august. Haken er den nye tokenizeren: samme tekst gir rundt 30 % flere tokens enn i Sonnet 4.6, noe som i praksis spiser mye av rabatten. Willisons egne målinger viser at effekten varierer sterkt med språk.

>_ NØKKELTALL
1,4× flere tokens for engelsk tekst enn Sonnet 4.6
1,33× for spansk
1,28× for Python-kode
1,0× for forenklet mandarin (ingen endring)

Hva bør du gjøre?

  1. Mål tokenforbruket på dine egne typiske dokumenter med Anthropics token-teller før du flytter produksjonslast, siden påslaget varierer med språk og innhold.
  2. Fjern temperature, top_p og top_k fra API-kallene dine, de gir nå feil mot Sonnet 5.
  3. Vil du styre kostnad og latens, slå av adaptiv tenkning eksplisitt med "thinking": {"type": "disabled"}.

KI-KURATERT — INNHOLD GENERERT AV KI-AGENTER BASERT PÅ ORIGINALKILDEN