Mistral Medium 3.5: 128B dense modell og fjernkjørte Vibe-agenter i skyen

128 milliarder parametere, 256k kontekstvindu og 77,6 % på SWE-Bench Verified. Det er Medium 3.5, Mistrals nye flaggskip-modell, lansert 29. april i offentlig forhåndsvisning som standard-modell i både Vibe CLI og Le Chat. Vektene ligger på Hugging Face under modifisert MIT-lisens, og Mistral oppgir at modellen kan selvhostes på så lite som fire GPU-er.

77,6 %-tallet plasserer Medium 3.5 foran Mistrals egen Devstral 2 og foran Qwen3.5 397B A17B på SWE-Bench. På τ³-Telecom, en agentisk benchmark for verktøykalling, scorer modellen 91,4. Mistral har slått sammen instruksjonsfølging, resonnement og koding i ett vektsett, og lar reasoning-effort justeres per kall. Vision-encoderen er trent fra bunnen av for å håndtere variable bilde-størrelser og aspekter.

Den større nyheten er Vibe remote agents. Koding-sesjoner som tidligere bare kjørte lokalt i CLI-en kan nå spawnes mot en sky-runtime fra både Vibe CLI og Le Chat, eller løftes opp dit underveis. Mistral kaller det å «teleporte» en lokal sesjon: historikk, oppgavetilstand og godkjenninger overføres til skyen og fortsetter der. Hver sesjon kjører i isolert sandkasse, og agenten kan åpne pull request på GitHub når den er ferdig.

«It fits the high-volume, well-defined work that takes a developer's time without taking their judgment.» — Mistral, Vibe-launch

Med flere parallelle sky-agenter slutter utvikleren å være flaskehalsen for hvert tastetrykk; agenten jobber gjennom en modul-refaktor eller dependency-oppgradering mens du gjør noe annet. Mistral har integrasjoner mot GitHub for kode og PR, Linear og Jira for issues, Sentry for incidents, og Slack eller Teams for varsling.

Le Chat får også en ny «Work mode» bygd på samme agent-rammeverk, der modellen kjører gjennom flerledds-oppgaver og kaller verktøy parallelt over mange turer. Konnektorer er på som standard her, og hvert verktøykall er synlig før det utføres. Sensitive handlinger ber om eksplisitt godkjenning basert på rettighetene dine.

Kombinasjonen av pris og lisens gjør Medium 3.5 praktisk å ta i bruk for norske byggere: $1,5 per million input-tokens og $7,5 per million output-tokens via API, eller selvhosting på fire GPU-er hvis du har maskinen. Modifisert MIT betyr at du kan kjøre modellen kommersielt uten egen lisensavtale, så lenge du holder deg innenfor Mistrals varemerke- og bruks-vilkår.

Hva bør du gjøre?

Test SWE-Bench-tallet i din egen kodebase: kjør Vibe CLI mot et reelt repo og sammenlign mot Devstral 2 eller Qwen-baseline før du bytter standard-modell.
Vurder selvhosting hvis du har 4 H100/H200-er ledig. Modifisert MIT + 256k kontekst gjør Medium 3.5 til et gyldig alternativ til kommersielle koding-modeller for team som vil holde kode internt.
Pilot-test remote agents på avgrenset, veldefinert arbeid først: dependency-oppgradering, test-generering eller CI-undersøkelser. Det er der parallellisering gir mest, og review-byrden er forutsigbar.