Andelen KI-kode som når produksjon uten manuell gjennomgang har hoppet på et halvår

Andelen KI-genererte kodeendringer som når produksjon uten et separat manuelt review-steg har hoppet det siste halvåret, ifølge nye tall fra Cursor omtalt av Business Insider 28. juni. Selskapet måler ikke kvaliteten på den fullt autonome koden direkte, men sier den «overlever» i produksjon i høyere grad enn før, et tegn på at utviklere stoler mer på utdataene.

Skiftet er gradvis snarere enn brått. Utviklere lar agenter ta hånd om større deler av jobben og hopper over gjennomgangen på endringer de før ville lest linje for linje. Når agenter i praksis godkjenner hverandres arbeid, flyttes spørsmålet om kodekvalitet, sikkerhet og ansvar fra gjennomgangen til testdekning og CI.

Haken er at «overlever i produksjon» ikke er det samme som «er riktig». En endring kan ligge urørt i kodebasen i måneder fordi ingen har truffet feilen ennå, ikke fordi den er trygg. Cursor innrømmer selv at de ikke måler kvaliteten på den autonome koden direkte.

Hva bør du gjøre?

Behold gjennomgang der det gjør vondt. La agenter merge trivielle endringer selv, men krev menneskelig review på auth, betaling, migrasjoner og alt som rører persondata.
Styrk det automatiske sikkerhetsnettet. Når mennesket går ut av loopen, må testdekning, type-sjekk og statisk analyse ta over. Mål dekningen før du skrur ned på review.
Logg hvem som godkjente hva. Hvis en agent merger en annen agents kode, sørg for at sporet er etterprøvbart når noe ryker i produksjon.