Anthropic stengte Claude Haiku 3 (modell-ID claude-3-haiku-20240307) 19. april 2026 ifølge selskapets deprecation-dokumentasjon, omtalt av ABMedia samme dag. Alle API-kall mot denne modellen returnerer nå feil, og trafikk rutes ikke automatisk videre. Du må endre modell-ID i koden selv.
Migreringsveien er Claude Haiku 4.5, men det er ikke bare en streng-endring. To tekniske brudd kan velte eksisterende integrasjoner:
- Sampling-parametre:
temperatureogtop_pkan ikke lenger settes samtidig. Hvis koden din sender begge med eksplisitte verdier, får du en API-feil. Velg én. - Ny refusal stop reason: Haiku 4.5 returnerer
refusalsom stop reason når modellen nekter å svare, istedenfor å feile eller returnere et placeholder-svar. Produksjonskoden må behandle dette som en normal kodeveg, ikke en unntaks-tilstand.
En tredje kostnadsfaktor er tokenizer-endringen. Simon Willison dokumenterte forrige uke at Opus 4.7 bruker rundt 1,46x flere tokens enn Opus 4.6 på samme system-prompt. Haiku 4.5 kan ha samme profil, noe som betyr at selv om per-token-prisen er lavere, kan samlet regning gå opp. Mål forbruket før og etter bytte.
«LLM har gått fra engangsanskaffelse til kontinuerlig versjonsstyring, slik som skytjenester og operativsystemer.» — ABMedia om strukturendringen i KI-leverandørmodeller
Og listen stopper ikke her. Samme deprecation-side varsler at Claude Opus 4 og Sonnet 4 pensjoneres 15. juni 2026. Det er under to måneder unna, og team som kjører eldre modeller i produksjon har nå to parallelle migreringsløp foran seg.
Hva bør du gjøre?
- Grep etter modell-ID-en i alle repoer.
rg 'claude-3-haiku-20240307'finner alt som må byttes. Husk YAML-konfig,.env-filer og feature flags. - Revider sampling-parametre. Søk etter kall som setter både
temperatureogtop_p. Behold den du faktisk justerer mot bruksmønsteret, fjern den andre. - Legg til refusal-håndtering. Stop reason
refusalmå ikke behandles som en feil. Definer en brukerfornuftig fallback-melding eller retry-logikk. - Mål tokens før og etter. Logg
usage.input_tokensogusage.output_tokenspå samme prompt mot begge modellene i én dag før full utrulling, slik at du fanger opp kostnadsendringer.
Bakgrunn
Claude Haiku 3 ble lansert i mars 2024 som Anthropics billigste og raskeste modell, mye brukt til klassifikasjon, oppsummering og chatbot-trafikk. Varslingsperioden startet i februar 2026 med e-post, dashboard-varsler og offisiell dokumentasjon. Bedriftskunder med volumkontrakter fikk minst 60 dagers forhåndsvarsel.