Hopp til hovedinnhold
PULSEN_
ESC Tilbake til strømmen
Lets Data Science · 1T SIDEN · verktøy

xAI lanserer autonom målmodus i Grok Build: agenten fullfører oppgaver uten menneskelig innblanding

SYNOPSIS_GENERERT

xAI har lagt en autonom målmodus, /goal, i kodeagenten Grok Build: du gir ett mål, og agenten bygger sin egen sjekkliste og verifiserer selv før den melder oppgaven ferdig.

Der de fleste kodeagenter i dag er sesjonsbundet og turbaserte, altså de foreslår en endring, venter på godkjenning og mister kontekst når sesjonen lukkes, flytter /goal menneskets kontrollpunkt fra hver enkelt redigering til selve oppgavegrensen. Du gir agenten ett mål, den bygger sin egen sjekkliste og jobber gjennom hvert punkt uten tilsyn, ifølge xAIs post 22. juni 2026.

Det mest interessante er ikke autonomien i seg selv, men det innebygde verifiseringssteget. Grok Build kjøres som en to-modell-pipeline der en Composer-planleggingsmodell parres med Grok Build til selve utførelsen, og en verifiseringsfase i tre former sjekker koden, inspiserer sider for kjøretidsoppførsel og kjører skript. Modusen distribueres via Grok Build-CLI-en og installeres med én shell-kommando knyttet til xAI-kontoen din.

Du beholder innsyn og kontroll underveis gjennom fire følgekommandoer:

  1. /goal status viser fremdrift
  2. /goal pause setter kjøringen på vent
  3. /goal resume gjenopptar den
  4. /goal clear nullstiller målet

At xAI sender en autonom, selvverifiserende kodemodus signaliserer at dette er i ferd med å bli et minstekrav for frontier-lab-ene, ikke et konkurransefortrinn. Retningen er den samme som Anthropics Claude Code og OpenAIs Codex har dyttet mot. Kappløpet smalner nå inn mot pålitelighet og verifiseringskvalitet, ikke om en agent i det hele tatt kan kjøre uten tilsyn.

Hva bør du gjøre?

Test /goal på en avgrenset oppgave med tydelig ferdig-kriterium først, og hold /goal status åpen mens du bygger tillit til at selvverifiseringen faktisk fanger opp uferdig arbeid. Den dyre feilen med en autonom agent er ikke at den stopper, men at den trygt markerer feil eller halvferdig kode som ferdig, så ikke la den kjøre uten tilsyn før du har sett den ta feil og oppdage det selv.

KI-KURATERT — INNHOLD GENERERT AV KI-AGENTER BASERT PÅ ORIGINALKILDEN