Devin Security Swarm fant 72 % av sårbarhetene i en test til 90 dollar per skann. Claude Security nådde 68 % til 132 dollar, Codex Security 48 % til 118 dollar, og Cursor Security bare 26 % til 4,60 dollar. Tallene kommer fra Cognitions egen benchmark, kjørt mot 50 reelle sårbarheter fra GitHub Security Advisories på tvers av 14 språk, med CVE-er publisert etter modellenes treningskutt for å utelukke memorering.
Det som skiller verktøyet fra tradisjonell statisk analyse, er at det ikke bare matcher mønstre. Cognition kaller arkitekturen «Agentic MapReduce»: en planleggingsagent deler kodebasen i shards, parallelle agenter leser hver sin del og resonnerer på tvers av filer for å fange kjedede logikkfeil og autentiseringsomganger, og en reducer deduperer funnene på tvers. For høykonfidens-funn reproduserer sandkasse-sesjoner sårbarheten mot et kjørende bygg før en PR i det hele tatt åpnes. Resultatet er færre falske positive og en PR-kø som speiler reell risiko.
Timingen er ikke tilfeldig. KI-generert kode står nå for 42 % av det som når produksjon, og introduserer sikkerhetsfunn i tidobbelt takt av håndskrevet kode, ifølge tallene Cognition viser til. Sikkerhetsteam som før gikk gjennom rundt 1 000 funn i måneden, ser nå 10 000 og oppover. Devin Security Swarm er altså et KI-verktøy bygget for å rydde opp i et etterslep KI-verktøy selv skapte.
Hva bør du gjøre?
- Test gratisversjonen på devin.ai/security ved å koble til ett repo; første fulle skann koster mest, senere skann prosesserer kun endret kode.
- Ikke stol blindt på recall-tallene: 72 % betyr at drøyt hver fjerde sårbarhet fortsatt slipper gjennom, så behold menneskelig gjennomgang på kritiske stier.
- Vei kostnaden mot volum, for 90 dollar per skann blir fort mye på et stort monorepo med hyppige skann.