Kan KI-agenten din bli brukt mot deg? Google DeepMind mener svaret er ja. I en ny forskningsartikkel publisert 6. april identifiserer DeepMind-forskere seks angrepstyper de kaller «AI Agent Traps» — teknikker som utnytter at KI-agenter tolker nettsider annerledes enn mennesker.
Angrepene spenner fra skjulte kommandoer plantet i nettinnhold, via korruptering av agentens hukommelse, til metoder som snur agenten mot brukeren den skal hjelpe. Fellesnevneren er at angriperen ikke trenger tilgang til modellen — det holder å kontrollere innholdet agenten konsumerer.
For utviklere som bygger agentbaserte systemer er implikasjonen klar: input-validering og sandboxing er ikke nok. Agenter som navigerer åpent nettinnhold trenger dedikerte forsvar mot manipulert innhold — noe dagens rammeverk i liten grad tilbyr.