Mens Anthropic holdt Mythos tilbake som for kraftig til å slippe fri, testet sikkerhetsselskapet AISLE de samme sårbarhetene på åpne modeller. Resultatene utfordrer fortellingen om at bare frontiermodeller kan drive KI-sikkerhetsforskning.
8 av 8 testede modeller oppdaget Mythos' flaggskip-funn: en 17 år gammel buffer overflow i FreeBSD NFS som gir full root-tilgang. Den minste modellen, GPT-OSS-20b med 3,6 milliarder aktive parametere til $0,11 per million tokens, identifiserte sårbarheten korrekt og vurderte den som kritisk med fjernkjøring.
«A thousand adequate detectives searching everywhere will find more bugs than one brilliant detective who has to guess where to look» — Stanislav Fort, AISLE
Men fronten er ujevn. Qwen3 32B scoret perfekt 9.8 CVSS på FreeBSD-testen, men erklærte den 27 år gamle OpenBSD SACK-buggen som «robust to such scenarios». Ingen enkelt modell er konsekvent best på tvers av sikkerhetsoppgaver.
AISLEs poeng er strategisk: fordi billige modeller håndterer mye av deteksjonsarbeidet, kan du dekke bredere. Tusen gode nok detektiver som søker overalt finner flere sårbarheter enn én briljant detektiv som må gjette hvor den skal lete.