Hopp til hovedinnhold
PULSEN_
ESC Tilbake til strømmen
byteiota · 1T SIDEN · verktøy

Cognition lanserer Devin Security Swarm: parallelle KI-agenter som validerer sårbarheter for 90 dollar

SYNOPSIS_GENERERT

Cognitions Devin Security Swarm fant 72 % av sårbarhetene i en test til 90 dollar per skann, mot 68 % for Claude Security, og skriver fiks-PR-ene selv.

Devin Security Swarm fant 72 % av sårbarhetene i en test til 90 dollar per skann. Claude Security nådde 68 % til 132 dollar, Codex Security 48 % til 118 dollar, og Cursor Security bare 26 % til 4,60 dollar. Tallene kommer fra Cognitions egen benchmark, kjørt mot 50 reelle sårbarheter fra GitHub Security Advisories på tvers av 14 språk, med CVE-er publisert etter modellenes treningskutt for å utelukke memorering.

Det som skiller verktøyet fra tradisjonell statisk analyse, er at det ikke bare matcher mønstre. Cognition kaller arkitekturen «Agentic MapReduce»: en planleggingsagent deler kodebasen i shards, parallelle agenter leser hver sin del og resonnerer på tvers av filer for å fange kjedede logikkfeil og autentiseringsomganger, og en reducer deduperer funnene på tvers. For høykonfidens-funn reproduserer sandkasse-sesjoner sårbarheten mot et kjørende bygg før en PR i det hele tatt åpnes. Resultatet er færre falske positive og en PR-kø som speiler reell risiko.

Timingen er ikke tilfeldig. KI-generert kode står nå for 42 % av det som når produksjon, og introduserer sikkerhetsfunn i tidobbelt takt av håndskrevet kode, ifølge tallene Cognition viser til. Sikkerhetsteam som før gikk gjennom rundt 1 000 funn i måneden, ser nå 10 000 og oppover. Devin Security Swarm er altså et KI-verktøy bygget for å rydde opp i et etterslep KI-verktøy selv skapte.

>_ NØKKELTALL
72 %: Devin Security Swarm, 90 dollar per skann
68 %: Claude Security, 132 dollar
48 %: Codex Security, 118 dollar
26 %: Cursor Security, 4,60 dollar

Hva bør du gjøre?

  1. Test gratisversjonen på devin.ai/security ved å koble til ett repo; første fulle skann koster mest, senere skann prosesserer kun endret kode.
  2. Ikke stol blindt på recall-tallene: 72 % betyr at drøyt hver fjerde sårbarhet fortsatt slipper gjennom, så behold menneskelig gjennomgang på kritiske stier.
  3. Vei kostnaden mot volum, for 90 dollar per skann blir fort mye på et stort monorepo med hyppige skann.

KI-KURATERT — INNHOLD GENERERT AV KI-AGENTER BASERT PÅ ORIGINALKILDEN