Hopp til hovedinnhold
PULSEN_
ESC Tilbake til strømmen
MarkTechPost · 24.5., 20:39 · verktøy

Tencent åpner TencentDB Agent Memory: lokalt minnelag for KI-agenter på SQLite

SYNOPSIS_GENERERT

Tencent åpnet TencentDB Agent Memory under MIT-lisens: et lokalt minnelag på SQLite som kuttet token-bruk opptil 61 % og hevet WideSearch-treff fra 33 % til 50 %.

Lange agent-oppgaver drukner kontekstvinduet i verbose verktøylogger, søkeresultater og feilspor lenge før oppgaven er løst. TencentDB Agent Memory, sluppet av Tencent 23. mai under MIT-lisens, angriper akkurat dette med to grep: et lagdelt langtidsminne og et symbolsk korttidsminne. Standardoppsettet kjører lokalt på SQLite med sqlite-vec-utvidelsen, så ingen ekstern API kreves.

Langtidsminnet er bygget som en firelagspyramide i stedet for en flat logg: rå dialog (L0), atomære fakta (L1), sceneblokker (L2) og en brukerprofil (L3). Profilen spørres først, og systemet graver bare ned til atomer eller rådialog når det trenger mer detalj. Korttidsminnet flytter fulle verktøylogger ut til egne filer under refs/*.md og koder tilstandsendringer i Mermaid-syntaks, slik at agenten resonnerer over en lett symbolgraf og henter råteksten med grep på en node_id først når den faktisk trengs.

Effekten i Tencents egne målinger er størst på token-bruk. På WideSearch steg treffraten i OpenClaw fra 33 % til 50 %, samtidig som token-bruken falt 61 %, fra 221 millioner til 86 millioner tokens. På SWE-bench, der 50 oppgaver kjøres etter hverandre for å presse konteksten, gikk suksess fra 58,4 % til 64,2 % med 33 % færre tokens. For langtidsminne hevet PersonaMem-nøyaktigheten seg fra 48 % til 76 %.

For deg som allerede kjører OpenClaw er terskelen lav: pluginen installeres som én npm-pakke (@tencentdb-agent-memory/memory-tencentdb), krever Node.js 22.16 eller nyere, og slås på med ett config-flagg. Det finnes også et ferdig Docker-bilde for Hermes Agent. To forbehold er verdt å notere: tallene er Tencents egne og ikke uavhengig verifisert, og korttidskomprimeringen med Mermaid-offloading krever en runtime-patch og må skrus på manuelt.

>_ NØKKELTALL
61 %: token-kutt på WideSearch (221M til 86M)
33 %: token-kutt på SWE-bench
31 %: token-kutt på AA-LCR

Hva bør du gjøre?

  1. Installer pluginen i en testinstans av OpenClaw og mål token-bruken på dine egne langkjørende oppgaver før du stoler på Tencents tall.
  1. Behold standard SQLite med sqlite-vec hvis du vil unngå ekstern avhengighet, og bytt til Tencent Cloud Vector Database først hvis du trenger skala.
  2. Skru på Mermaid-offloading (v0.3.4 eller nyere) bare for oppgaver med tunge verktøylogger, siden det krever en egen runtime-patch.

KI-KURATERT — INNHOLD GENERERT AV KI-AGENTER BASERT PÅ ORIGINALKILDEN