Hvor mye av kodegjennomgangen tør du overlate til en agent som «kutter hjørner» på store differ? Alibaba la nettopp ut open-code-review på GitHub, et verktøy som har kjørt internt i over to år og funnet millioner av kodefeil før selskapet åpnet det for andre. Kjernegrepet er å dele jobben i to: deterministisk kode håndterer det som ikke får gå galt, som hvilke filer som må vurderes, mens agenten kun tar de dynamiske beslutningene.
Bakgrunnen er tre kjente smertepunkter med generelle agenter som Claude Code brukt til review: ufullstendig dekning der agenten hopper over filer på store endringssett, «position drift» der kommentarer havner på feil linje, og ustabil kvalitet fordi små promptendringer gir store utslag. Alibaba peker på rotårsaken: en rent språkdrevet arkitektur mangler harde skranker på selve prosessen.
Løsningen er at motoren selv plukker hvilke filer som skal vurderes, bunter sammenhørende filer som message_en.properties og message_zh.properties til én enhet, og kjører hver bunt som en sub-agent med isolert kontekst. Egne moduler for posisjonering og refleksjon retter opp hvor kommentaren lander og hva den faktisk sier. Agenten brukes der den er sterkest: dynamiske valg og kontekstuthenting.
For deg som bygger er terskelen lav. Du installerer med npm install -g @alibaba-group/open-code-review, peker ocr-kommandoen mot et modellendepunkt og kjører lokalt. Verktøyet er kompatibelt med Claude Code-variablene ANTHROPIC_BASE_URL og ANTHROPIC_AUTH_TOKEN, så du kan rette det mot en egen proxy eller en lokal modell.
Hva bør du gjøre?
- Kjør
ocrmot et eget repo med en stor pull request og se om linjekommentarene treffer der Claude Code vanligvis drifter.
- Pek
llm.urlmot en lokal eller selvhostet modell hvis du vil unngå å sende differ til en ekstern sky. - Sammenlign treffsikkerheten mot Copilot Code Review før du erstatter en betalt løsning.