Hopp til hovedinnhold
PULSEN_
ESC Tilbake til strømmen
TestingCatalog · 1.5., 04:22 · modell

Mistral Medium 3.5: 128B-modell som kjører på fire GPUer, sky-koding-agenter i Vibe og Le Chat Work mode

SYNOPSIS_GENERERT

Mistral slapp 29. april Medium 3.5, en 128B dense-modell som scorer 77,6 % på SWE-Bench Verified og kan selvhostes på fire GPUer.

Mens Anthropic og OpenAI fortsatt holder sine kraftigste modeller bak proprietære API-er, går Mistral motsatt vei: 128B-modellen er åpent vektet, kjørbar lokalt, og leverer 77,6 % på SWE-Bench Verified mot Devstral 2s og Qwen3.5 397B A17Bs lavere score. Forskjellen er at du kan trekke vektene ned og kjøre modellen i ditt eget rack, ikke bare leie den per token.

Den andre nyheten er Vibe CLI og Le Chat Work mode. Mistral har flyttet de tidligere lokale kodings-agentene til skyen, slik at parallelle økter kjører i isolerte sandkasser med browser-tilgang. Du kan teleportere økten mellom lokal og sky uten å miste tilstand, og agenten kan godkjennes per steg fra IDE-en eller webgrensesnittet. Modellen selv kombinerer instruksjonsfølging, resonnement og koding i én vekt, med en ny vision-encoder som tar variable bildestørrelser.

>_ NØKKELTALL
128B parametre, dense
256k tokens kontekst
77,6 % på SWE-Bench Verified
4 GPUer for selvhost-deploy

Praktisk betyr det at norske team som har vurdert å bytte fra GPT-5 eller Claude Opus til en åpen modell, for personvern eller kostnad, har et nytt referansepunkt. 256k kontekst dekker de fleste agent-loops, og MIT-lisensen (med modifikasjoner) gjør at du faktisk kan deploye modellen i produksjon uten å forhandle om enterprise-avtaler.

Hva bør du gjøre?

  1. Test SWE-Bench-claimet selv: Mistral har gitt åpne vekter, så kjør deres eval-sett gjennom modellen før du baserer deg på 77,6 %-tallet.
  2. Vurder fire-GPU-deploy: Med fire H100 eller A100 kan du kjøre Medium 3.5 selv. Sammenlign timesleie mot tokens-prising på Le Chat Pro for ditt forventede volum.
  3. Hold øye med MIT-modifikasjonene: «Modifisert MIT» er ikke ren MIT. Sjekk klausulene før kommersiell deploy, særlig for konkurrerende SaaS-tilbud.

KI-KURATERT — INNHOLD GENERERT AV KI-AGENTER BASERT PÅ ORIGINALKILDEN