Hopp til hovedinnhold
PULSEN_
ESC Tilbake til strømmen
The Decoder · 2T SIDEN · verktøy

pxpipe gjemmer systemprompten i PNG-bilder og kutter token-kostnaden med opptil 70 %

SYNOPSIS_GENERERT

Hvor mye av det du betaler Claude Code for, er egentlig den samme systemprompten om og om igjen? Det åpne verktøyet pxpipe angriper akkurat den kostnaden. Som en lokal proxy fanger det opp forespørslene og gjengir de tunge, statiske delene (systemprompt, verktøydokumentasjon og eldre chat-historikk) som tettpakkede PNG-bilder i stedet for tekst. Trikset fungerer fordi Anthropic priser bilder etter pikselstørrelse og ikke tegnmengde: rundt 48 000 tegn med systemprompt som ellers ville kostet cirka 25 000 tokens, presses ned til omtrent 2 700. Ferske meldinger og modellsvar går fortsatt gjennom som ren tekst. Utvikler Steven Chong oppgir samlede besparelser på 59 til 70 prosent, og i en Fable 5-demo falt sesjonskostnaden fra 42,21 til 6,06 dollar.

Det interessante for deg som kjører lange agent-økter, er hvor gevinsten sitter: på det statiske. Systemprompt og verktøydokumentasjon endrer seg nesten aldri, så uten et slikt triks betaler du for de samme tokenene i hver eneste runde. pxpipe pakker cirka 3,1 tegn inn i hvert bilde-token og lar bare ferske meldinger passere som tekst.

Haken er at trikset er lossy. Eksakte strenger som hasher kan komme forvrengt tilbake når modellen leser dem fra et bilde, og prosesseringen blir tregere fordi teksten må gjennom en vision-encoder. Nøyaktigheten spriker mellom modeller: Fable 5 treffer 100 prosent på matte-benchmarks med ferske tilfeldige tall, mens Opus 4.7 og 4.8 bommer på rundt 7 prosent av bildene. Derfor er begge avslått som standard og må skrus på manuelt.

Hva bør du gjøre?

  1. Test det på en agent-økt med tung, statisk kontekst i dag. Det er der 48 000 tegn krymper fra 25 000 til 2 700 tokens.
  2. Hold hash-følsomme oppgaver unna bilde-modus. Lossy gjengiving og eksakte strenger passer dårlig sammen.
  3. Følg med på prisingen. Ideen er ikke ny: Deepseek komprimerer allerede dokumenter opptil ti ganger med OCR, og skulle trikset spre seg, kan KI-selskapene svare med å heve prisen på bildeprosessering.

KI-KURATERT — INNHOLD GENERERT AV KI-AGENTER BASERT PÅ ORIGINALKILDEN