Hvordan beviser et minnelag for KI-agenter at svaret faktisk kommer fra det riktige minnet? Lumetras Engram bygger rundt to retrieval-signaler: semantisk vektorsøk og traversering av en automatisk vedlikeholdt kunnskapsgraf. Hver tilbakekalling kan spores til det lagrede minnet og kanten som produserte svaret. Systemet ingester samtaler, ekstraherer atomiske fakta og relasjoner, og fletter dem med BM25 og semantiske embeddings.
91,6 prosent på LongMemEval-S (458 av 500) out-of-the-box er målestokken, og Lumetra publiserer metodikken på lumetra.io/engram-on-longmemeval. Engram er modellagnostisk: utviklere kobler til foretrukket LLM (frontier, åpen kildekode eller selvhostet), og betaler kun for lagrede minner og hentinger. Ingen per-token-påslag på modellen du allerede betaler for.
MCP-serveren fungerer ut av boksen mot Claude.ai web, Claude Desktop, Claude Code, Cursor, Windsurf, Codex, ChatGPT og OpenClaw. For lokale agent-stacks finnes gratis-tier til hobby-prosjekter, og 29 dollar per måned dekker indie-utviklere. Lumetras medgrunnlegger Ben Meyerson sier MCP «endret regnestykket for minne», og det er derfor Engram er MCP-nativt fra dag én.
Hva bør du gjøre?
- Test integrasjonen via MCP hvis du allerede kjører Claude Code eller OpenClaw lokalt. Det er en config-endring, ikke en omskriving.
- Sjekk auditerbarheten på dine egne testdata. Engrams løfte står og faller på om du kan spore en feil tilbakekalling til riktig minne og graf-kant.
- Vurder BYOM-økonomien mot Mem0 eller Zep. Engram måler bare på minner lagret og hentinger servert, ikke på inferens.