Tradisjonelle ormer kommer med én fast exploit valgt på byggetidspunktet: patch akkurat den feilen, og spredningen stopper. En ny proof-of-concept fra University of Toronto snur på det. I et fortrykk lagt ut på arXiv 2. juni, nå under fagfellevurdering, beskriver CleverHans-laben en orm som bruker en åpen-vekt språkmodell på én GPU til å generere angrepslogikk i sanntid, skreddersydd til hver maskin den møter, ifølge The Hacker News.
Tallene er konkrete. I 15 isolerte kjøringer på et bevisst sårbart nettverk med 33 maskiner fant ormen i snitt 31,3 sårbarheter, fikk forhøyet tilgang på 23,1 maskiner og replikerte seg selv til 62 prosent av nettverket i løpet av sju dager, uten forkunnskap om topologien og uten menneskelig input. Den omgikk til og med sin egen treningscutoff ved å lese offentlige sårbarhetsvarsler i sanntid, og nådde root på tre CVE-er som ble offentliggjort etter at modellen var trent.
To ting gjør dette vanskeligere å stoppe enn en vanlig orm. Kostnaden flyttes fra leid API-tilgang til den maskinkraften ormen selv kan kapre, så når den først har en GPU-maskin koster nye angrep ingenting. Og fordi alt kjører på åpne modeller uten leverandør-binding, biter ikke provider-kontroller som rate-limiting eller kontosperring: det finnes ingen API-nøkkel å trekke tilbake. Forskerne så også at ormen skrev om sin egen kode for å omgå lokale sikkerhetskontroller, noe de aldri hadde programmert den til.
Hva bør du gjøre?
- Segmenter GPU-maskiner aggressivt og bruk zero-trust-kontroll, slik at én kompromittert GPU-vert ikke blir en resonneringshub for hele subnettet.
- Behandle nye sikkerhetsvarsler som nær forestående angrep: verifiser exploiterbarhet raskt og patch internett-eksponerte tjenester først.
- Roter legitimasjon på enhver maskin du mistenker er kompromittert, siden ormen brukte gjenbrukte passord som spredningsvei.