En detaljert analyse av 119 866 API-kall over tre måneder, publisert som GitHub-issue, viser at Anthropic endret standard cache TTL (time-to-live) fra 1 time til 5 minutter rundt 6.-8. mars. Data fra to uavhengige maskiner og kontoer bekrefter mønsteret: fra 1. februar til 5. mars var TTL konsekvent 1 time. Deretter tok 5-minutters-cachen over.
Konsekvensen er direkte: når cachen utløper etter 5 minutter, må hele konteksten lastes opp på nytt til full skrivepris. Skrivekostnaden er 12,5 ganger dyrere enn lesekostnaden. For lange kodeøkter med store kontekstvinduer betyr dette at en pause på over 5 minutter utløser en ny cache-skriving.
«February — the month Anthropic was defaulting to 1h TTL — shows only 1.1% waste. Every other month shows 15-53% overpayment from 5m cache re-creations» — fra analysen
Brukere på Pro-abonnement rapporterer at de for første gang treffer 5-timers kvotetaket etter endringen. Forfatteren ber Anthropic bekrefte om endringen var tilsiktet eller en regresjon, og vurdere å gjeninnføre 1-times TTL eller gjøre den konfigurerbar.