Mens GPT-5.5 og Claude Opus 4.7 fortsatt selges som premium API-tjenester med tilhørende prising, slapp DeepSeek tirsdag V4 under MIT-lisens på Hugging Face. Modellen har 1,6 billioner parametere totalt, men aktiverer bare relevante deler ved inferens via en Mixture-of-Experts-arkitektur. Selskapet hevder ytelsen matcher de proprietære frontier-modellene til omtrent én sjettedel av API-prisen.
Releasen er resultatet av 484 dager med utvikling siden V3, og kommer fra det samme kinesiske teamet som vakte oppsikt med R1 i januar 2025. På kode-benchmarks ligger V4 innenfor 2-3 prosentpoeng av de ledende lukkede modellene, og på matematisk resonnering overgår den ifølge teamet flere av dem.
«AGI belongs to everyone.» (Deli Chen, DeepSeek-forsker)
Fordi MIT-lisensen tillater fri kommersiell bruk og modifikasjon, kan du laste ned vekter, fine-tune mot egne data, og kjøre alt på privat infrastruktur uten API-betaling eller bruksbegrensninger. Det fjerner vendor lock-in for organisasjoner som har holdt seg unna lukkede modeller av personvern- eller suverenitetsgrunner.
Hva bør du gjøre?
- Sjekk om aktiv parameter-størrelse passer din GPU: 1,6T totalt betyr ingenting hvis du ikke kan laste vektene. Se på MoE-rutings-konfigurasjonen og hvor mange eksperter som faktisk er aktive per token før du planlegger hardware.
- Test mot ditt eget bruksområde, ikke benchmarks: kjør egen evaluering på dine data. Frontier på MMLU sier lite om hvordan modellen håndterer norsk eller dine domene-spesifikke prompter.
- Vurder økonomien på nytt: hvis du brenner mer enn noen tusen kroner i måneden på Opus 4.7 eller GPT-5.5 til ikke-kritiske oppgaver, kan en V4-deployment via vLLM eller Together gi 80 prosent kostnadsreduksjon på samme arbeidsmengde.