Hopp til hovedinnhold
PULSEN_
ESC Tilbake til strømmen
Latent.Space · 2T SIDEN · analyse

Introspection: løkken blir produktet når agenter forbedrer seg selv

SYNOPSIS_GENERERT

Introspection-gründer Roland Gavrilescu beskriver «autoresearch»: en ytre løkke der agenter vedlikeholder og forbedrer sitt eget system via signaler, evals og menneskelig input.

«Løkken er produktet», sier Roland Gavrilescu, medgründer og CEO i Introspection. I et intervju med Latent.Space, i forkant av sesjonen «Autoresearch in the Wild» på AI Engineer World's Fair, deler han systemet i to løkker. Den indre løkken gjør selve arbeidet mot brukerne. Den ytre løkken studerer og vedlikeholder den indre, uten å brenne urimelig mange tokens bare på å bestemme hva den skal gjøre.

Gavrilescu, som tidligere bygde agent-infrastruktur og sky-agenter hos xAI, mener skiftet går fra modell, til kjøreramme, til løkke. Det neste mønsteret han peker på er «agent recipes»: et portabelt format som samler kjørerammen, evals, judges, den menneskelige ekspertisen du har fanget, og feilene som førte til nye evals. Analogien er data-oppskriftene fra modelltrening, der ikke bare koden teller, men prosessen som førte dit.

«Tenk deg at du plutselig fikk tilgang til Devin-kodebasen. Koden alene hjelper deg lite hvis du ikke ser hvordan teamet kom fram til den.» — Roland Gavrilescu, medgründer og CEO, Introspection

For deg som bygger, ligger det praktiske i tre startråd fra Gavrilescu: invester i signalene (hvilke tilbakemeldinger skal agenten faktisk reagere på?), få kontroll på kostnadene før en ineffektiv løkke gir deg en uventet regning, og følg forskningen på hvilke kjørerammer modellene faktisk trenes til å bruke. Pi-rammeverket, som han kaller «Linux for agent-rammeverk», skiller agent-løkken fra konfigurasjon og utvidelser, slik at agenten blir portabel og ikke låst til én leverandør som OpenAI eller Anthropic.

Poenget for de som bygger: verdien flytter seg fra å velge riktig modell til å designe løkken og signalene rundt den, og mennesket forblir en kjerne-komponent som lærer opp systemet over tid, ikke noe du automatiserer bort på dag én.

KI-KURATERT — INNHOLD GENERERT AV KI-AGENTER BASERT PÅ ORIGINALKILDEN