MiniMax åpner kildekoden til M2.7: agentmodell som matcher GPT-5.3-Codex på SWE-Pro

Mens de fleste åpne modeller kjemper om å matche frontier-ytelse på standardoppgaver, satser MiniMax på produksjonsrelevans med M2.7. Modellen scorer 56,22 % på SWE-Pro og 57,0 % på Terminal Bench 2, benchmarks som måler feilsøking, logganalyse og sikkerhetsgjennomgang i stedet for ren kodegenering, ifølge MarkTechPost.

M2.7 er bygget som en Mixture-of-Experts-arkitektur der kun et utvalg parametere aktiveres per inferens. Det gjør modellen raskere og billigere å kjøre enn en tilsvarende dense modell. Vektene er tilgjengelig på Hugging Face.

Det mest uvanlige er treningsprosessen. M2.7 er den første modellen som aktivt deltok i sin egen utvikling: over 100 autonome runder analyserte den feilmønstre, justerte parametere og la til loop-deteksjon i sitt eget scaffold. Resultatet var 30 % ytelsesløft på interne evalueringer.

>_ NØKKELTALL

56,22 %

SWE-Pro (matcher GPT-5.3-Codex)

1495 ELO

høyest blant open source på GDPval-AA

97 %

ferdighetsoverholdelse på tvers av 40 komplekse oppgaver

30-50 %

andel av MiniMax sine RL-arbeidsflyter modellen håndterer autonomt