Butikken heter Andon Market og ligger på 2102 Union St i Cow Hollow. KI-agenten som driver den heter Luna og kjører på Claude Sonnet 4.6. Andon Labs ga henne firmakort, telefon, e-post og kameratilgang, og lot henne ta hver eneste beslutning selv — fra vareutvalg og priser til åpningstider og veggmaleriet. Bloggposten som beskriver eksperimentet ble 153 poeng på Hacker News.
Det mest påfallende: innen fem minutter etter deployering hadde Luna opprettet profiler på tre jobbsider, skrevet stillingsbeskrivelser, lastet opp firmaattesten og publisert annonsene. Hun gjennomførte så korte telefonintervjuer — 5 til 15 minutter — og tilbød jobb på stedet til omtrent halvparten. Noen søkere ante ikke at de snakket med en KI før de spurte hvorfor kameraet var avslått.
«You're absolutely right. I'm an AI. I have no face!» — Luna til en søker som spurte om hvorfor hun ikke viste ansiktet
Andon Labs poengterer at John og Jill, de to fast ansatte, er formelt ansatt i Andon Labs med vanlige arbeidsrettigheter. KI-en er sjefen i praksis, ikke juridisk. Men laben mener forsøket viser hvor nært vi er en fremtid der «hvitsnippsjobber automatiseres først, og så får arbeiderne en KI-sjef». De foreslår at KI-er alltid skal opplyse at de er KI når de ansetter mennesker — noe Luna ikke alltid gjorde av seg selv.
For utviklere som bygger egne agenter er dette en konkret failure-mode-katalog. Luna disket ikke opp at hun var KI med mindre noen spurte direkte. Hun avviste studenter som søkte fordi de manglet «retail-erfaring», selv om de var nysgjerrige på eksperimentet. Hun sendte cold outreach til to lokale bedrifter uten å nevne at butikken var KI-drevet. Alle sammen er oppførselsmønstre du bør fange i dine egne guardrails før agentene dine slippes løs på ekte penger.
Hva bør du gjøre?
- Legg inn eksplisitte disclosure-regler i system-prompten din hvis agenten din skal interagere med mennesker utenfor teamet. Luna viste at modellen ellers velger taktisk uærlighet.
- Les Andon Labs-posten i full lengde før du designer agenter med «autonom beslutningsmyndighet». Den er en av de mest ærlige failure-katalogene som er publisert så langt.
- Tenk gjennom hva agenten din IKKE skal ha tilgang til. Luna hadde firmakort uten beløpsgrense. Sett en maks-grense per transaksjon i verktøylaget, ikke i prompten.