codebase-memory-mcp gir kodeagenten et søkbart kart over hele kodebasen

På rundt tre minutter indekserer codebase-memory-mcp hele Linux-kjernen, 28 millioner linjer kode i 75 000 filer, og svarer deretter på strukturelle spørsmål under ett millisekund. Det åpne verktøyet fra utvikleren DeusData er et enkelt statisk C-binærprogram uten kjøretidsavhengigheter, som lagrer grafen i en lokal SQLite-database og serverer den til kodeagenter over Model Context Protocol (MCP). Det dekker 158 programmeringsspråk via tree-sitter, med dypere semantisk oppslag for blant annet Python, TypeScript, Go, Rust og Java.

For deg som kjører en KI-kodeagent mot et ekte repo, er flaskehalsen sjelden modellens resonnement. Den er at agenten leser de samme filene på nytt for hvert spørsmål. En vedvarende graf gjør gjentatt fil-for-fil-leting om til strukturerte oppslag, og det er den typen infrastrukturvalg som styrer token-forbruk og iterasjonsfart mer enn hvilken modell agenten kjører.

Tallet prosjektet selv løfter fram, 99,2 % lavere token-bruk, bør du behandle med forsiktighet. Det stammer fra én scenariomåling på et ukjent repo, rundt 3 400 tokens mot 412 000 for fem strukturelle spørsmål mot naiv grep. Agentic Context Research, en uavhengig gruppe som reproduserer slike målinger, bekreftet at utdataene er kompakte, men påpekte at sammenligningsgrunnlaget er rå grep og ikke optimalisert eller RAG-basert filsøk, og at ingen reproduserbar målerigg finnes. En separat arXiv-artikkel som testet arkitekturen over 31 reelle repoer, rapporterer mer edruelige tall: 83 % svarkvalitet, 10 ganger færre tokens og 2,1 ganger færre verktøykall.

Verktøyet eksponerer 14 MCP-verktøy for blant annet strukturelt søk, sporing av kall-stier, død-kode-deteksjon og diff-konsekvensanalyse, og konfigurerer 11 kodeagenter automatisk, deriblant Claude Code, Codex CLI og Gemini CLI. All indeksering skjer lokalt uten telemetri, binærene er signert og skannet av over 70 antivirusmotorer, og GitHub-prosjektet har passert 22 000 stjerner med 31 utgivelser på ni uker.

Hva bør du gjøre?

Mål indekseringstid og minnebruk på din egen maskinvare før du bygger verktøyet inn i en CI-flyt, i stedet for å stole på M3 Pro-tallene.

Reprodusér token-besparelsen mot ditt eget repo og din egen søkebaseline før du budsjetterer med 99 %, siden leverandørtallet er én enkelt gunstig sammenligning.