Xiaomi har sluppet MiMo-V2.5-Pro, en åpen-vekt mixture-of-experts-modell med 1,02 billioner parametere, designet for langløpende autonome kodingsjobber. I interne tester skrev modellen et helt kompilator-prosjekt fra et kurs ved Peking University på 4,3 timer fordelt på 672 verktøykall, og scoret 233 av 233 på den skjulte testpakka.
Modellen aktiverer 42 milliarder parametere per forespørsel og håndterer opptil én million tokens kontekst i hovedversjonen. MiMo-teamet har eksplisitt bygget denne versjonen for jobber som kjører i timesvis og krever tusenvis av verktøykall. På Xiaomis egen ClawEval agent-benchmark hevder selskapet at modellen scorer 64 % med rundt 70 000 tokens per oppgave, altså 40 til 60 prosent færre tokens enn Claude Opus 4.6, Gemini 3.1 Pro og GPT-5.4 trenger for tilsvarende score.
I demo nummer to skrev modellen en desktop-videoredigerer på rundt 8 000 linjer kode autonomt over 11,5 timer og 1 870 verktøykall. I demo nummer tre koblet teamet modellen til Claude Code og en kretssimulator og fikk den til å designe en spenningsregulator som traff alle seks tekniske krav på under en time.
«Modellen la først ut hele pipeline-en som stillas, og jobbet seg så lag for lag gjennom hver fase. Første kompileringskjøring traff allerede 137 av 233 tester.» — Xiaomis MiMo-team, gjengitt i THE DECODER
For deg som bygger agenter er signalet konkret: token-effektivitet er en akse i seg selv. På SWE-bench Verified scorer modellen 78,9, på Terminal-Bench 2.0 68,4. Hvis du betaler per token i agentløp og kjører lange autonome oppgaver, har du nå et åpent alternativ med vekter på Hugging Face.
Hva bør du gjøre?
- Last ned MiMo-V2.5-vektene fra Hugging Face og kjør dem mot din egen agent-pipeline før du forplikter deg til store token-budsjetter hos proprietære leverandører.
- Hvis du allerede betaler per token i Claude- eller Gemini-løp, mål token-forbruket per oppgave i ditt eget setup og sammenlign mot MiMo før du estimerer kostnader.
- Verifiser med en oppgave fra ditt eget domene før du bytter modell. Benchmarkene er Xiaomis egne tall.