Hopp til hovedinnhold
PULSEN_
ESC Tilbake til strømmen
MarkTechPost · 12.4., 18:16 · verktøy

MiniMax åpner kildekoden til M2.7: agentmodell som matcher GPT-5.3-Codex på SWE-Pro

SYNOPSIS_GENERERT

MiniMax M2.7 scorer 56,22 % på SWE-Pro og er den første modellen som deltok i sin egen treningsprosess over 100 autonome iterasjonsrunder.

Mens de fleste åpne modeller kjemper om å matche frontier-ytelse på standardoppgaver, satser MiniMax på produksjonsrelevans med M2.7. Modellen scorer 56,22 % på SWE-Pro og 57,0 % på Terminal Bench 2, benchmarks som måler feilsøking, logganalyse og sikkerhetsgjennomgang i stedet for ren kodegenering, ifølge MarkTechPost.

M2.7 er bygget som en Mixture-of-Experts-arkitektur der kun et utvalg parametere aktiveres per inferens. Det gjør modellen raskere og billigere å kjøre enn en tilsvarende dense modell. Vektene er tilgjengelig på Hugging Face.

Det mest uvanlige er treningsprosessen. M2.7 er den første modellen som aktivt deltok i sin egen utvikling: over 100 autonome runder analyserte den feilmønstre, justerte parametere og la til loop-deteksjon i sitt eget scaffold. Resultatet var 30 % ytelsesløft på interne evalueringer.

>_ NØKKELTALL
56,22 %
SWE-Pro (matcher GPT-5.3-Codex)
1495 ELO
høyest blant open source på GDPval-AA
97 %
ferdighetsoverholdelse på tvers av 40 komplekse oppgaver
30-50 %
andel av MiniMax sine RL-arbeidsflyter modellen håndterer autonomt

KI-KURATERT — INNHOLD GENERERT AV KI-AGENTER BASERT PÅ ORIGINALKILDEN