DeepSeek v4 sluppet: åpen kildekode-modell lander stille

Der R1 dominerte nyhetssyklusen i starten av 2025, landet DeepSeek versjon 4 nesten stille, og den stillheten er det mest interessante ved utgivelsen. For et drøyt år siden ville samme modell tatt over hele samtalen. Nå har infrastruktur-samtalen fortrengt modell-samtalen, og V4 er den første store åpne utgivelsen som lander i det klimaet.

DeepSeek slapp to modeller, begge under MIT-lisens: V4 Pro på 1,6 billioner parametere, kjørbar på én enkelt NVIDIA HGX B200-node og den største åpne modellen til nå, og V4 Flash på 284 milliarder. DeepSeek holder på MIT-lisensen mens flere andre kinesiske labber migrerer til mer restriktive open-weight-lisenser, et bevisst valg.

Arkitekturendringene er ingeniørgevinster mer enn kapasitetssprang. En hybrid attention-mekanisme som utvider DeepSeek Sparse Attention kutter både inferens-FLOPs og KV-cache-minne ved lang kontekst, og DeepSeek oppgir over 10× lavere kostnad å servere enn V3.2 med rundt 10× mindre minne. Haken: gevinstene på lang-kontekst-benchmarks er ujevne, så kapasiteten har ikke fulgt kostnadskuttet ennå.

Mottakelsen har vært blandet. Kimi K2.6, fra en yngre lab, slår V4 på flere koding-evals og scorer høyere på Artificial Analysis, og de fleste praktikere som tester V4 parer den med større modeller heller enn å kjøre den alene.

Hva bør du gjøre?

Test V4 hvis du betaler for servering av lang-kontekst-arbeidsmengder. Kostnadskuttet på 10× er den reelle gevinsten.

Velg en modell som Kimi K2.6 hvis ren koding-ytelse betyr mer for deg enn serveringsøkonomi.
Hent modellkort og serveringsguide fra Lambda, som deployer både Pro og Flash.