Anthropic gir Claude Managed Agents «dreaming»: agenter siler erfaringer mellom sesjoner og forbedrer minnet selv

Anthropic kunngjorde tre nye funksjoner i Claude Managed Agents 7. mai. Plattformen ble lansert i april og lar deg kjøre agenter i Anthropics sky uten å vedlikeholde infrastrukturen selv. De tre tilskuddene er dreaming, outcomes og multiagent orchestration.

Dreaming er det mest interessante teknisk. Det er en planlagt jobb som leser agentens sesjonshistorikk og minne-lager, ekstraherer mønstre, og curerer minnet for kommende kjøringer. Du velger om oppdateringene skal gjelde automatisk eller om du vil godkjenne dem manuelt. Anthropic beskriver det som «refining memory between sessions, pulling shared learnings across agents».

Outcomes lar deg skrive en rubrikk for hva som er suksess. Agenten jobber mot målet, og en separat grader evaluerer resultatet i sitt eget kontekstvindu, isolert fra agentens resonnement. Hvis grader-en ikke er fornøyd, peker den på hva som må endres og agenten gjør et nytt forsøk. Det er praktisk talt en innebygd test-driven loop for agenter, og du kan koble en webhook som varsler når oppgaven er ferdig.

Multiagent orchestration lar en lead-agent dele oppgaven og delegere til spesialister med egne modeller, prompts og verktøy. Spesialistene jobber parallelt på et delt filsystem og bidrar tilbake til hovedkonteksten. Netflix kjører allerede dette i plattform-teamet sitt, ifølge Anthropic, der lead-agenten gransker en hendelse mens subagenter parallelt går gjennom deploy-historikk, feillogger, metrikker og support-saker.

Kombinasjonen av minne og dreaming er det Anthropic sikter mot: agenter som blir bedre over tid uten at du må trene dem på nytt. For deg som bygger egne agenter er spørsmålet om dreaming faktisk produserer brukbare minner, eller om det blir støy som forurenser kontekst-vinduet i neste kjøring.

Hva bør du gjøre?

Test outcomes først. Det er den minst eksperimentelle av de tre og løser et reelt problem: hvordan vite at agenten gjorde jobben riktig uten å lese gjennom hele transkriptet manuelt.
Behold manuell godkjenning på dreaming. Som research preview er det fornuftig å granske hvilke mønstre Claude trekker ut før de skrives til minnet. En dårlig generalisering kan ødelegge agentens beslutninger i ukevis.
Sammenlign med egne minne-lag. Hvis du allerede bruker mem0, Letta eller en vektor-DB for agent-minne, er dreaming et argument for å la Anthropic håndtere kuratering, eller en grunn til å holde fast ved kontroll over egen lagring.