Kodeagenter er dyre fordi de sender mye kontekst på nytt for hver melding. Hele filer, tidligere svar og systeminstruksjoner følger med hvert kall, og token-telleren løper. Condense angriper dette punktet: i stedet for å endre agenten eller modellen, sitter proxyen imellom og trimmer det som sendes.
For deg som betaler egen API-regning er dette den interessante vinkelen. Du bytter ikke verktøy og du bytter ikke modell. Du peker agenten mot proxyen, og den komprimerer før kallet går videre. Tallet på 72 prosent er et tak, ikke et snitt, og gevinsten avhenger av hvor mye redundant kontekst arbeidsflyten din drar med seg.
Det åpne oppsettet betyr at du kan sette den opp selv og se hva den faktisk fjerner. Verdt en test hvis du kjører agenter tungt nok til at regningen merkes. Sjekk at komprimeringen ikke stryker kontekst du faktisk trenger, for der ligger risikoen: en billigere kjøring som løser oppgaven dårligere hjelper ingen.