DeepSeek publiserte 24. april en preview av V4, oppfølgeren til R1 som rystet amerikanske KI-aksjer i januar 2025. Selskapet i Hangzhou hevder V4 har «world class» resonnering og best agentisk koding blant open source-modeller, i direkte konkurranse med Claude, ChatGPT og Gemini. Modellen er open source, slik R1 var.
Det teknisk interessante er treningsstacken. DeepSeek brukte Huaweis «Supernode»-infrastruktur med klynger av Ascend 950-brikker, pluss Cambricon-silisium. Ingen Nvidia. Huawei bekreftet partnerskapet i en egen uttalelse. Dette er første gang en frontier-nivå kinesisk modell er trent fullt ut utenfor Nvidia-stacken, en direkte konsekvens av Washingtons eksportkontroll på H100 og nyere.
«R1 sjokkerte USA fordi ingen ventet at en kinesisk modell skulle konkurrere på det nivået. V4 er en follow-through på samme trend, og trender gir ikke overskrifter som sjokk» — Ivan Su, senior equity analyst i MorningStar
«Det betyr at KI-systemer kan bygges og deployes uten å være avhengig av Nvidia, og det er derfor V4 kan få enda større impact enn R1» — Wei Sun, principal analyst i Counterpoint Research
DeepSeek innrømmer i forskningsnotatet at V4 fortsatt ligger bak Gemini på bred verdenskunnskap, men hevder lederposisjon blant åpne modeller. Bakteppet er amerikanske anklager: Michael Kratsios i Det hvite hus publiserte torsdag et memo om «industriell-skala» destillering fra kinesiske aktører. Både Anthropic og OpenAI har tidligere anklaget DeepSeek for det samme.
Hva bør du gjøre?
- Følg med på Hugging Face for V4-vektene. R1 lå der innen dager, og GGUF/kvantiseringer fulgte i løpet av uka.
- Test den agentiske kodingen mot din egen oppgave hvis du kjører agenter lokalt. DeepSeek hevder best i klassen blant åpne modeller. Verifiser selv.
- Les lisensen før du deployer kommersielt. Tidligere DeepSeek-modeller har hatt åpne, men ikke helt restriksjonsfrie vilkår.