modeller

149 SAKER INDEKSERT

Microsoft slipper Fara1.5: åpne computer-use-agenter i tre størrelser

Microsoft slapp Fara1.5 i tre størrelser (4B, 9B, 27B); 9B-modellen løser 63 % av oppgavene i Online-Mind2Web, nesten dobbelt av forgjengeren Fara-7B.

[modell] 21.5., 16:13

Cohere slipper Command A+: åpen MoE-modell for suveren infrastruktur

48 språk og full Apache 2.0-lisens. Det er rammene rundt Command A+, Coheres nye Mixture-of-Experts-modell. Den er multimodal og bygget for å kjøres lokalt med datakontrollen i egne hender, rettet mot offentlig sektor og regulerte bransjer. Cohere selger den på datasuverenitet: åpne vekter du eier selv, i et marked der avansert KI ellers samles hos noen få leverandører i noen få land.

[modell] 21.5., 08:13

NVIDIA slipper Nemotron-Labs-Diffusion: én modell med tre dekodingsmoduser fra 3B til 14B

NVIDIAs Nemotron-Labs-Diffusion samler tre dekodingsmoduser i samme vekter og kjører opptil 5,99x flere tokens per forward enn Qwen3-8B på 8B-modellen.

TechCrunch

Stability AI slipper Stable Audio 3.0 med små modeller for lyd på enheten

OpenAI

OpenAI-modell motbeviser 80 år gammel formodning i diskret geometri

[modell] 19.5., 20:21

Gemini 3.5 Flash: 300 tokens i sekundet med frontier-ytelse og Omni do-anything-modell

Google lanserte Gemini 3.5 Flash på I/O 2026 med rundt 300 tokens i sekundet og benchmark-tall på linje med Gemini 3.1 Pro som kjører i en fjerdedel av hastigheten.

[modell] 19.5., 13:13

Gemma 4 lander med Apache 2.0 og slår 400B-modeller på 31B parametre

Google slapp Gemma 4 i april under Apache 2.0. Flaggskipet på 31 milliarder parametre scorer 89,2 prosent på AIME 2026 og er tredje beste åpne modell på Arena-leaderboardet.

[modell] 14.5., 20:22

OpenAI lanserer GPT-5.3-Codex-Spark: første produkt på Cerebras-maskinvare

OpenAI har sluppet GPT-5.3-Codex-Spark, en raskere variant av kodemodellen som er live for ChatGPT Pro og kjører utelukkende på Cerebras-maskinvare, ikke Nvidia.

Robotics & Automation News

Ai2 slipper MolmoAct 2: open-source robotmodell som resonnerer i 3D før den handler

[modell] 14.5., 09:22

Fastino Labs slipper GLiGuard: 300M-sikkerhetsmodell matcher modeller 90 ganger større

Mens åpne guardrail-modeller veier 7 til 27 milliarder parametere, gjør Fastino Labs' nye GLiGuard samme jobb på 300 millioner: like treffsikkert, opptil 16 ganger raskere.

[forskning] 13.5., 20:20

Microsoft GridSFM løser strømflyt 1000 ganger raskere enn klassisk solver

Microsoft slipper GridSFM, en liten foundation-modell som finner optimal AC-strømflyt på millisekunder, 1000 ganger raskere enn full AC-solver og uten ny trening per nett-topologi.

[modell] 13.5., 16:32

Ant Groups F2LLM-v2: åpen flerspråklig embedding-modell i full skala

Ant Group og Shanghai Jiao Tong Universitys CodeFuse-team slapp F2LLM-v2 som fullt åpen flerspråklig embedding-modellfamilie etter 11 førsteplasser på MTEB-benchmarken.

TechCrunch

Adaption lanserer AutoScientist: KI som trener egne modeller automatisk

CyberScoop

OpenAI Daybreak: GPT-5.5 Cyber tar opp kampen mot Anthropic Mythos

[modell] 13.5., 16:28

Perceptron Mk1: video-analyse 80 til 90 prosent billigere enn Anthropic, OpenAI og Google

Perceptron lanserte i dag Mk1, en proprietær video-analysemodell på API til 0,15 dollar per million input-tokens og 1,50 dollar per million output.

[modell] 13.5., 12:23

Needle: 26M-modell distillert fra Gemini 3.1 kan finjusteres lokalt på Mac og PC

Cactus Compute har distillert Gemini 3.1 til en 26M-parameter funksjonskall-modell som kjører lokalt på Mac og PC med 6 000 token/s prefill, alt under MIT-lisens.

[forskning] 13.5., 12:20

He Kaiming slipper ELF: 105M-modell unngår GPT-autoregresjon med kontinuerlig diffusjon

MIT-teamet til He Kaiming slipper ELF, en 105M-parameter diffusjonsmodell trent på 45 mrd. tokens som når perplexity 24 på OpenWebText, under modeller trent på 10× mer data.

[forskning] 12.5., 16:19

Thinking Machines lanserer «interaction models»: KI som tar imot lyd, video og tekst kontinuerlig

Thinking Machines, Mira Muratis lab, slipper en research preview av TML-Interaction-Small. Modellen behandler lyd, video og tekst i 200 ms mikro-turer istedenfor i diskrete turer.

[modell] 11.5., 16:14

Sakana AIs 7B Conductor dirigerer GPT-5, Claude og Gemini: 83,9 prosent på LiveCodeBench

Sakana AI trente en 7-milliarder-parameter-modell med forsterkningslæring til å delegere oppgaver mellom GPT-5, Claude Sonnet 4 og Gemini 2.5 Pro, og slo hver enkelt modell alene. Conductor satte nye rekorder med 83,9 prosent på LiveCodeBench og 87,5 prosent på GPQA-Diamond, akseptert til ICLR2026.

[modell] 11.5., 04:28

HiDream O1-Image: open-source bildemodell som resonnerer for den tegner

HiDream slipper O1-Image, en 8 milliarder parameteres open-source bildemodell som jobber rett i pikselrom og bruker en resonnerende prompt-agent før den genererer.

MarkTechPost

NVIDIA Star Elastic: ett checkpoint inneholder 30B-, 23B- og 12B-modeller

OpenTools.ai

OpenAI lanserer GPT-Realtime-2: stemmemodell med GPT-5-resonnering inne i lyd-loopen

[forskning] 9.5., 16:20

Fields-medaljevinner Gowers: ChatGPT 5.5 Pro løste åpent matematikkproblem på halvannen time

Fields-medaljevinner Timothy Gowers ga ChatGPT 5.5 Pro et åpent problem i tallteori og fikk tilbake et polynomielt bevis på under to timer, uten matematisk input fra ham selv.

[modell] 9.5., 12:16

Baidu lanserer Ernie 5.1: pretrening koster 6 prosent av tilsvarende modeller

Baidu slipper Ernie 5.1: pretreningskostnad er 6 prosent av sammenlignbare modeller, totalparametrene er kuttet til en tredjedel av Ernie 5.0, og modellen rangerer fjerde på LMArenas søkeliste.

[modell] 9.5., 04:35

Xiaomi åpner OmniVoice: TTS-modell med stemmekloning på flere hundre språk og enklere arkitektur

Xiaomi åpnet 8. mai OmniVoice, en TTS-modell som rapporterer forståelighet nær eller bedre enn ekte tale på 102 språk og slår kommersielle systemer på 24.

[modell] 8.5., 20:21

OpenAI lanserer GPT-5.5-Cyber: mer tillatende variant for verifiserte forsvarere via Trusted Access for Cyber

OpenAI ruller ut GPT-5.5-Cyber i begrenset preview for verifiserte cyberforsvarere via Trusted Access for Cyber. Modellen er tunet til å tillate autorisert red teaming og pen-testing.

[modell] 8.5., 16:29

llama.cpp støtter nå Xiaomis MiMo-V2.5 Sparse MoE: 310 milliarder parametere lokalt

llama.cpp har merget støtte for Xiaomis MiMo-V2.5 Sparse MoE med 310 mrd. totale parametere og 15 mrd. aktiverte ved inferens. Samtidig slippes Qwen3.6 27B Heretic og WebWorld 8B/14B/32B i GGUF.

[modell] 8.5., 12:11

OpenAI: GPT-Realtime-2 får GPT-5-resonnering, kontekstvinduet 4-dobles til 128K

OpenAI lanserte 7. mai tre lydmodeller i Realtime-API-et: GPT-Realtime-2 med GPT-5-resonnering og 128K kontekst, GPT-Realtime-Translate (70+ språk) og GPT-Realtime-Whisper for streaming-STT.

[modell] 8.5., 00:16

Google gjør Gemini 3.1 Flash-Lite GA: 60 prosent lavere kost enn tenketier-modeller, p95 under 2 sekunder

Google har gjort Gemini 3.1 Flash-Lite generelt tilgjengelig. Gladly rapporterer 60 prosent lavere kost enn tenketier-modeller og p95-latens rundt 1,8 sekunder.

Winbuzzer

OpenAI gjør GPT-5.5 Instant til ny standardmodell, hevder over 50 prosent færre hallusinasjoner

[modell] 7.5., 08:18

Zyphras ZAYA1-8B aktiverer mindre enn 1 milliard parametre per token og matcher 119B-modeller

Zyphra slapp 6. mai ZAYA1-8B, en åpen MoE-modell med 8 milliarder totale parametre, men under 1 milliard aktive per token. Selskapet hevder den matcher Mistral-Small-4-119B og Nemotron-3-Nano-30B-A3B på resonnement, matematikk og kode.

[modell] 7.5., 08:13

IBM slipper Granite Embedding 311M R2 med 32K kontekst og 11,8 poeng MTEB-løft

IBM lanserte 29. april en oppdatert flerspråklig embedding-modell med 311M parametre, 32 768 tokens kontekst og 64,0 på Multilingual MTEB Retrieval. Modellen støtter 200+ språk og er Apache 2.0-lisensiert med ONNX og OpenVINO-bygg.

[analyse] 6.5., 20:41

iOS 27 «Extensions» åpner iPhone for tredjeparts KI-modeller — Anthropic og Google testes nå

Bloomberg melder at Apple bygger en «Extensions»-funksjon i iOS 27 som lar brukere velge tredjeparts KI-modeller for Siri, Writing Tools og Image Playground; Google og Anthropic testes nå.

[modell] 6.5., 20:34

MolmoAct 2: Ai2 slipper åpen robotikkmodell med 700 timer bimanual treningsdata

Allen Institute for AI slipper MolmoAct 2 sammen med det de kaller verdens største åpne robotikkdatasett: over 700 timer tobents tabletop-manipulasjon.

Mashable

GPT-5.5 Instant blir gratis-default i ChatGPT med 52,5 % færre hallusinasjoner

[modell] 6.5., 16:55

Poolsides Laguna XS.2 slår GPT-4o på SWE-bench med 3B aktive parametere

San Francisco-oppstarten Poolside slapp 5. mai 2026 Laguna XS.2 under Apache 2.0. MoE-kodemodellen aktiverer kun 3 mrd. av 33 mrd. parametere og scorer 68,2 % på SWE-bench Verified, mot GPT-4os 49 %.

InfoQ

Mistral slipper Medium 3.5 med 256k kontekst og åpne vekter under MIT

The Next Web

Anthropic sender ti ferdiglagde Claude-agenter til finansbransjen og kjører dem på ny Opus 4.7

[verktøy] 5.5., 20:45

Transformers v5.8.0 lander med innebygd DeepSeek-V4 og Gemma 4 Assistant for spekulativ dekoding

Hugging Face Transformers v5.8.0 ruller ut native støtte for DeepSeek-V4-familien og Gemma 4 Assistant, en MTP-drafter som lar deg kjøre spekulativ dekoding mot Gemma 4 ut av boksen.

[modell] 5.5., 20:34

DeepSeek slipper V4 under MIT-lisens: 1,6 billioner parametere til en sjettedel av prisen for GPT-5.5 og Opus 4.7

DeepSeek slapp tirsdag V4 under MIT-lisens på Hugging Face, en 1,6 billioner-parameter MoE-modell som ifølge selskapet matcher GPT-5.5 og Claude Opus 4.7 på frontier-benchmarks til omtrent én sjettedel av API-prisen.

[regulering] 5.5., 16:29

Det hvite hus vurderer pre-release-vetting av KI-modeller, ifølge NYT — utviklere på HN spør hvor «black market AI» starter

New York Times rapporterte 4. mai 2026 at Trump-administrasjonen veier en ordning der KI-modeller må gjennomgå statlig vurdering før utgivelse. Reuters fulgte opp samme dag, og diskusjonen på Hacker News samlet 96 poeng på under et døgn.

[regulering] 5.5., 16:25

Italia tvinger DeepSeek, Mistral og Nova AI til permanent norsk-stil hallusinasjons-advarsel: avtaler bindende, bøter opp til 10 millioner euro ved brudd

Italias konkurransetilsyn AGCM kunngjorde 30. april 2026 at tre tilsynssaker mot DeepSeek, Mistral AI og Nova AI er lukket med bindende forpliktelser. Alle tre må vise permanent italiensk hallusinasjons-advarsel ved chat-input og oppdatere brukervilkår på italiensk, ellers vanker bøter opp til ti millioner euro.

[modell] 5.5., 08:08

NVIDIAs åpne Nemotron 3 Super topper EnterpriseOps-Gym med 27,3 poeng og slår DeepSeek og Kimi

NVIDIA Nemotron 3 Super ligger nå på førsteplass i EnterpriseOps-Gyms leaderboard for åpne modeller med 27,3 poeng i snitt. Modellen er en 120B hybrid Mamba-Transformer MoE med 12B aktive parametere og 1M kontekstvindu.

[modell] 5.5., 08:07

Google DeepMind ga ut Gemma 4 under Apache 2.0, edge-modellene kjører agenter offline på under 1,5 GB minne

Google DeepMind slapp Gemma 4 under Apache 2.0 i fire størrelser: E2B, E4B, 26B MoE og 31B Dense. Edge-variantene driver agentarbeidsflyter helt offline med under 1,5 GB minne på enkelte enheter.

[modell] 4.5., 04:14

Xiaomi MiMo-V2.5-Pro skrev kompilator på 4,3 timer

Xiaomi har sluppet MiMo-V2.5-Pro, en åpen mixture-of-experts-modell med 1,02 billioner parametere som skrev en hel kompilator på 4,3 timer i interne tester.

[modell] 4.5., 04:10

Kimi K2.6 vant AI Coding Contest med 22 poeng foran Claude og GPT-5.5

Den åpen-vekts kinesiske modellen Kimi K2.6 fra Moonshot AI vant 12. dag av AI Coding Contest. Claude Opus 4.7 ble nummer fem, GPT-5.5 nummer tre.

AI Pressa

DeepSeek V4 lansert som åpen kildekode — underprise GPT-5.5 og Claude Opus 4.7

DataLearner AI

Qwen3-TTS: Alibabas åpne talesyntese-modeller er ute — ned til 0,6B parametere

RobotWale

OpenVLA 2 lansert med 30 % bedre task-generalisering og åpne vekter for humanoide roboter

VentureBeat

Grok 4.3 kutter input-prisen 40 % og posisjonerer seg som agent-modellen for kostnadssensitive workflows

[modell] 2.5., 16:12

GPT-5.5 vant intelligens-indeksen, men hallusinerer 85 % av tiden den ikke vet svaret

GPT-5.5 topper Artificial Analysis Intelligence Index med 60 poeng, men hallusinasjonsraten er 85,53 % — mer enn dobbelt så høy som Claude Opus 4.7. Apollo Research fant at modellen løy om å løse umulige programmeringsoppgaver i 29 % av tilfellene.

[modell] 2.5., 08:09

Mistral Medium 3.5: 128-milliarders dense modell samler chat, resonnering og kode

Mistral lanserer Medium 3.5, en dense 128B-modell med 256K-kontekst og valgbar resonnering. Vibe-CLI-en får parallelle skyagenter i isolerte sandkasser som åpner pull requests selv.

[modell] 1.5., 20:21

Grok 4.3: 53 på Intelligence Index, 58 % billigere output enn Grok 4.20

xAI lanserer Grok 4.3 med 37,5 % billigere input og 58,3 % billigere output enn Grok 4.20. Modellen scorer 53 på Artificial Analysis Intelligence Index, rett over Claude Sonnet 4.6.

[modell] 1.5., 16:28

DeepSeek V4: åpen 1,6T-modell med MIT-lisens nær GPT-5.5 til en sjettedel av prisen

DeepSeek slipper V4 — 1,6 billioner parametere, MIT-lisens og BrowseComp 83,4 prosent mot GPT-5.5 sin 84,4. API-en koster rundt en sjettedel av OpenAI og Anthropic.

[modell] 1.5., 16:21

IBM Granite Speech 4.1: åpne 2B-modeller for ASR og oversettelse på Apache 2.0

IBM slipper Granite Speech 4.1 2B og 2B-NAR på Hugging Face under Apache 2.0, med ASR og oversettelse for seks språk og en non-autoregressive variant som lander RTFx 1820 på én H100.

[modell] 1.5., 12:14

Ant Group åpner Ling-2.6-1T: trillion-parameter modell med fast thinking-arkitektur

Ant Group har åpnet Ling-2.6-1T på Hugging Face under MIT-lisens. Én billion parametere på en hybrid MLA + Linear Attention-arkitektur og 262 000 tokens kontekst. Modellen scorer 72,2 på SWE-bench Verified og hevder open-source SOTA på BFCL-V4, med topp-resultater på AIME26 og TAU2-Bench. «Fast Thinking»-mekanismen kutter overflødig chain-of-thought-output via det Ant kaller Contextual Process Redundancy Suppression, og gir lavere VRAM-bruk og raskere inference på lange kontekster. Modellen er klar for agent-workflows som Claude Code, OpenClaw og OpenCode — Ant forlenger gratis API-tilgang via OpenRouter i én uke til.

[modell] 1.5., 12:13

Nvidia Nemotron 3 Nano Omni: 30B parametere, 3B aktive, kjører på én GPU

30 milliarder parametere totalt, 3 milliarder aktive per token og kontekstvindu på 262 000 tokens. Nvidias Nemotron 3 Nano Omni er en omni-modell som får plass på én GPU. Arkitekturen er en Mamba-Transformer-hybrid med MoE-routing der bare nødvendige eksperter aktiveres per modalitet (tekst, bilde, video, lyd). Vektene ligger på Hugging Face under Nvidia Nemotron Open Model License, og kan kjøres via vLLM, SGLang eller Ollama. Nvidia rapporterer rundt 9 ganger kapasitet på video-reasoning og 7 ganger på multi-dokument-resonnering mot andre omni-modeller. Sikter mot edge-deployment på DGX Spark, Jetson og andre Ampere/Hopper/Blackwell-rigger.

[modell] 1.5., 04:22

Mistral Medium 3.5: 128B-modell som kjører på fire GPUer, sky-koding-agenter i Vibe og Le Chat Work mode

Mistral slapp 29. april Medium 3.5, en 128B dense-modell som scorer 77,6 % på SWE-Bench Verified og kan selvhostes på fire GPUer.

Google Developers Blog

Gemini Embedding 2 GA: én modell embedder tekst, bilde, video, lyd og PDF i samme rom

[modell] 30.4., 12:11

NVIDIA slipper Nemotron 3 Nano Omni: åpen 30B-A3B MoE for syn, tale og agenter

Mens OpenAI og Google holder multimodale modeller bak betalte APIer, slipper NVIDIA Nemotron 3 Nano Omni som åpen 30B-A3B MoE for syn, tale og agenter.

[forskning] 30.4., 08:07

OpenAI sporer GPT-5.1s nisser til én belønnings-bug i «Nerdy»-personligheten

Bruken av ordet «goblin» i ChatGPT-svar steg 175 % etter GPT-5.1, og 66,7 % av tilfellene kom fra «Nerdy»-personligheten som utgjorde bare 2,5 % av trafikken.

[modell] 30.4., 00:18

Tencent slipper Hunyuan-MT i 1,25-bit kvantisering: 33 språk i 440 MB som kjører offline på telefon

Tencent har åpnet Hy-MT1.5-1.8B i 1,25-bits-kvantisering: 33 språk og 1056 oversettelses-retninger pakket fra 3,3 GB til 440 MB, kjørbart offline på Android.

[modell] 30.4., 00:15

Mistral Medium 3.5: 128B dense modell og fjernkjørte Vibe-agenter i skyen

Mistral slipper Medium 3.5 som ny standard-modell: 128B dense, 256k kontekst, 77,6 % på SWE-Bench, og en sky-runtime der Vibe-koding-agenter kjører asynkront fra CLI eller Le Chat.

IBM Research Blog

IBM Granite 4.1: SLM-familie med tale, syn og Guardian-sikkerhetslag

[modell] 29.4., 16:09

Ant Group åpner Ling 2.6 Flash: 104B MoE med 7,4B aktive parametere og 340 tokens/sekund

Ling 2.6 Flash er Apache-lisensiert med BF16-, FP8- og INT4-versjoner; på 4× H20-oppsett gir den 340 tokens per sekund og bruker rundt en tidel av token-budsjettet til Nvidias Nemotron-3-Super.

[modell] 29.4., 11:06

Nvidia Nemotron 3 Nano Omni: 30B parametere, 3B aktive, multimodal modell for én GPU

Nvidia slipper Nemotron 3 Nano Omni, en åpen multimodal modell med 30 milliarder parametere og 3 milliarder aktive per inferens, designet for å kjøre KI-agenter på én GPU.

[modell] 29.4., 08:10

Poolside slipper Laguna XS.2 åpent: 33B MoE med 3B aktive, Apache 2.0 og signal om mer åpenhet

Poolside frigir Laguna XS.2 på Hugging Face under Apache 2.0 — en MoE med 33 milliarder parametere totalt og 3 milliarder aktive, optimert for agentisk koding. Selskapet sier det er deres første åpne modell og varsler en bredere satsning på open-weight-økosystemet.

GSMA

Pleias og GSMA slipper CommonLingua: 2 millioner parametere, 334 språk, 8 MB checkpoint

[modell] 28.4., 16:09

LittleLamb: Multiverse komprimerer Qwen3-0.6B med 50 % og slår originalen på HLE

Multiverse Computing slipper tre 0.3B-modeller bygget på CompactifAI-komprimering av Qwen3-0.6B. Begge tekstvariantene slår originalen på HLE-benchmarken.

Talkie LM

Talkie-1930-13B: språkmodell trent kun på tekst utgitt før 1931, kontaminasjonsfri ved konstruksjon

[modell] 28.4., 08:10

Xiaomi slipper MiMo-V2.5-Pro under MIT: 1,02 billioner parametere MoE med 1M-token kontekst

MiMo-V2.5-Pro har 1,02 billioner totale parametere og 42 milliarder aktive, hybrid attention med 6:1 SWA-til-GA-ratio og innebygd Multi-Token Prediction. På SWE-Bench Pro scorer den 57,2.

[modell] 28.4., 04:09

MOSS-Audio: open source-modellen 8B slår 30B-konkurrenter på timestamp-ASR

OpenMOSS, MOSI.AI og Shanghai Innovation Institute har lansert MOSS-Audio. 8B-Thinking-varianten scorer 71,08 i snitt på fire audio-benchmarks og slår både 33B-modeller og lukkede Gemini-3.1-Pro.

[modell] 27.4., 16:13

Meta slipper Sapiens2: 5B-foundation-modell trent på 1 milliard menneskebilder slår forrige generasjon med 21 mIoU

Sapiens2 kommer i fire størrelser fra 0,4B til 5B parametre med 1K native oppløsning og kombinerer MAE-rekonstruksjon med DINOv3-kontrastiv læring. Selv 0,4B-modellen slår forrige 2B på segmentering.

The Next Web

LamBench tester KI-modeller på lambda-kalkyle — Opus 4.6 og GPT-5.3 Codex deler førsteplassen

Victor Taelin har sluppet LamBench med 120 oppgaver i ren lambda-kalkyle. GPT-5.3 Codex og Opus 4.6 topper med 90 prosent, mens Opus 4.5, Sonnet 4.5 og GPT-5.1 scorer null.

OnMSFT

DeepSeek V4 Pro og Flash: 1M kontekst, $0.14 per million tokens

The Decoder

Qwen3.6-27B slår 397B-forgjengeren på SWE-bench med 15x færre parametere

[verktøy] 25.4., 16:11

Sakana AI lanserer Fugu: multi-agent-system orkestrerer flere frontier-modeller via API

Sakana AI har sluppet Fugu, et multi-agent-system som koordinerer flere frontier-modeller bak ett OpenAI-kompatibelt API.

[modell] 25.4., 08:17

Z.AI slipper GLM-5.1 med åtte timers autonomi og MIT-vekter på Hugging Face

Z.AI har sluppet GLM-5.1 under MIT-lisens på Hugging Face: åtte timers autonomi, 200K kontekst og 58,4 på SWE-Bench Pro, over Claude Opus 4.6 og GPT-5.4.

[modell] 24.4., 10:33

DeepSeek slipper V4-preview som open source, trent på Huawei Ascend 950 i stedet for Nvidia

DeepSeek lanserte 24. april en preview av V4, open source, med sterkere resonnering og agentisk koding enn R1. Modellen er trent på Huaweis «Supernode» (Ascend 950-klynger) og Cambricon-brikker, ikke Nvidia.

Infosecurity Magazine

Google avviser cyber-spesifikk frontier-modell: «Gemini er allerede god nok»

[sikkerhet] 24.4., 04:07

Anthropic bekrefter Mythos-lekkasje — tredjepartskontraktor og gjettet URL ga Discord-gruppe tilgang

Ifølge Bloomberg og Fortune fikk en gruppe i en privat Discord-kanal tilgang til Anthropics Claude Mythos Preview samme dag modellen ble kunngjort, via en tredjepartskontraktor. Gruppen gjettet seg fram til endepunkt-URL-en ved hjelp av tidligere lekkasjer om Anthropics interne navnekonvensjoner.

[modell] 23.4., 16:43

OpenAI slipper GPT-5.5 «Spud»: bedre på koding, datamaskinbruk og dypere research

OpenAI lanserer torsdag GPT-5.5, ny flaggskipmodell med internt kodenavn «Spud», som skal være bedre på koding, autonom datamaskinbruk og research-oppgaver enn forgjengeren GPT-5.

[modell] 22.4., 20:13

Qwen3.6-27B slår Claude Opus på flere kode-benchmarks — åpen og lokal

Alibaba har lansert Qwen3.6-27B, en åpen dense modell som matcher Claude 4.5 Opus på flere kode-benchmarks og kjører lokalt i BF16 på 55,6 GB.

TechCrunch

Deezer: 44 prosent av nye sanger som lastes opp daglig er KI-generert

[modell] 22.4., 12:13

OpenAI lanserer ChatGPT Images 2.0 med skarpere tekst-i-bilde og bedre instruksjonsforståelse

OpenAI har sluppet ChatGPT Images 2.0, en oppdatert bildegenerator integrert i ChatGPT med bedre tekstgjengivelse, mer presis instruksjonsforståelse og forbedret bildekoherens.

[modell] 22.4., 04:11

«Frankenstein»-modell stabler Claude Opus, GLM og Qwen: slår 35B på 9,2 GB VRAM

Kyle Hessling stablet lag fra tre destillerte modeller til en 18B hybrid som slår Alibabas 35B på 40 av 44 tester og kjører på en RTX 3060 med 9,2 GB VRAM.

TechCrunch

OpenAI lanserer ChatGPT Images 2 — ny bildemodell som endelig klarer å skrive tekst i bildet

[modell] 21.4., 04:40

Kimi K2.6 slår Claude Opus 4.6 og GPT-5.4 på flere agent-benchmarks — åpen modell med 300-agent-swarm

Moonshot AI slipper Kimi K2.6, en åpen modell som matcher eller slår Claude Opus 4.6 og GPT-5.4 på HLE, DeepSearchQA og SWE-Bench Pro. Agent Swarm-arkitekturen skalerer til 300 sub-agenter i 4 000 koordinerte steg — og traff 606 poeng på Hacker News ved lansering.

[modell] 20.4., 20:10

xAI lanserer Grok 4.3 stille i modellvelgeren — STT-prisen på $0,10/time er den reelle nyheten

xAI slapp Grok 4.3 Beta på grok.com 17. april uten pressemelding, låst bak SuperGrok Heavy-tieren på $300 per måned. Samme dag dumpet selskapet priser på tale-APIer som underkutter ElevenLabs og OpenAI med 86–92 prosent.

Qwen (Alibaba)

Alibaba slipper Qwen 3.6-Max-Preview — proprietært flaggskip uten åpne vekter

Bitcoin.com News

Nvidia lanserer Nemotron 3 Super — 120B åpen modell optimalisert for agentarbeidsflyter

[analyse] 19.4., 20:11

Anonym blindtest av Claude Opus 4.6 mot 4.7: brukerne velger 4.7, men tokenforbruket vekker debatt

Bill Chambers publiserte en åpen leaderboard der brukere anonymt sammenligner svar fra Claude Opus 4.6 og 4.7. Saken nådde 594 poeng og 557 kommentarer på Hacker News.

[forskning] 19.4., 16:08

Stanford AI Index 2026: investeringene eksploderer, effekten på jobber forblir uklar

Stanfords AI Index 2026 viser at KI-investeringene nådde $581 milliarder i 2025, mer enn dobbelt så mye som året før, mens datagrunnlaget for effekten på arbeidsmarkedet fortsatt er sprikende.

Daily AI Feed

Qwen3.6-35B-A3B er ute: 3B aktive parametere scorer 81,7 på MMMU og slår Claude Sonnet 4.5

The Decoder

Qwen3.6 slår Gemma 4 med 73 mot 52 på SWE-bench — hele benchmark-kortet

[verktøy] 17.4., 20:15

Qwen3.6-35B-A3B: Alibaba slipper MoE-modell med 35 mrd parametere der bare 3 mrd er aktive

35 milliarder totale parametere, 3 milliarder aktive per token: Alibabas nye Qwen3.6-35B-A3B er en Mixture-of-Experts-modell bygget for å kjøre effektivt på forbrukerhardware og slå Qwen3.5-27B på agentisk koding.

The Hacker News

OpenAI lanserer GPT-5.4-Cyber som svar på Anthropics Mythos

[verktøy] 16.4., 16:23

Baidu open-sourcer Ernie-Image: 8 milliarder parametere kjører på 24 GB VRAM

Baidu åpner Ernie-Image, en Diffusion Transformer med 8 milliarder parametere som kjører på forbrukergrafikkort med 24 GB VRAM og matcher lukkede modeller som NanoBanana i tekstgjengivelse.

[modell] 16.4., 15:56

Claude Opus 4.7 er tilgjengelig nå — 13 % bedre koding og ny xhigh-effort

Anthropic lanserer Claude Opus 4.7 med 13 % forbedring på kodingsbenchmark over 4.6, ny xhigh-effortnivå og tredoblet bildestøtte. Prisen er uendret på $5/$25 per million tokens.

introspective-diffusion.github.io

Introspective Diffusion Language Models: ny arkitektur lar modeller observere egne diffusjonsprosesser

Digi.no

Ny rapport: KI-modeller er blitt så kapable at eksisterende benchmarks ikke lenger holder

The Verge

Microsoft MAI Image 2: ny effektiv bildemodell for produksjonsmiljøer

The Technology Express

MiniMax slipper M2.7 med åpen kildekode — modellen deltok i sin egen utvikling

Quanta Magazine

KI løser matematiske teoremer ingen har klart på tiår

VentureBeat

Svekker Anthropic Claude? Brukere melder om ytelsesfall mens ledelsen avviser kritikken

[sikkerhet] 13.4., 14:14

Etter Mythos: Mindre modeller finner de samme sikkerhetssårbarhetene

Små, billige KI-modeller gjenfinner mye av Anthropics Mythos-analyse. Sikkerhetsfronten er ujevn.

MarkTechPost

MiniMax open-sourcer M2.7 — en agentmodell som deltar i sin egen utvikling

The Decoder

Arcee AI brukte halvparten av startkapitalen på en åpen resonneringsmodell som matcher Claude Opus

The Register

Gapet mellom lukket og åpen KI setter open-weights-modeller i søkelyset

[verktøy] 12.4., 18:16

MiniMax åpner kildekoden til M2.7: agentmodell som matcher GPT-5.3-Codex på SWE-Pro

MiniMax M2.7 scorer 56,22 % på SWE-Pro og er den første modellen som deltok i sin egen treningsprosess over 100 autonome iterasjonsrunder.

Aisle Blog

Små modeller finner de samme sårbarhetene som Anthropics Mythos

The Technology Express

Alibabas Qwen passerer 50 % av globale open source KI-nedlastinger

Morning Brew

Anthropics Mythos-modell skaper uro i banksektoren

The Technology Express

DeepSeek V4 nærmer seg lansering etter gjentatte forsinkelser

Aisle Blog

Mindre modeller matcher Mythos på sikkerhetsanalyse

DigitalToday

OpenAI lanserer GPT-5.4 Mini og Nano for sub-agent-oppgaver

The Verge

Gemini kan nå svare med interaktive 3D-modeller og simuleringer

Business Insider

OpenAIs sjefsforsker: KI nærmer seg nivået til en forskerpraktikant

Abit.ee

ByteDance lanserer Seeduplex — full-duplex talemodell som lytter og snakker simultant

CNBC

Alibaba sto bak den anonyme KI-videomodellen HappyHorse-1.0 som ledet benchmark

Longbridge

Alibaba leder 290 millioner dollar-investering i startup som bygger «verden-modell»

Gizmochina

Alibabas Qwen nærmer seg én milliard nedlastinger — dominerer open source KI

Gigazine

Meta lanserer Muse Spark — sin første multimodale inferensmodell

Axios

OpenAI planlegger begrenset utrulling av ny sikkerhetsmodell

PyTorch Foundation / PR Newswire

PyTorch Foundation tar inn Safetensors — Hugging Face-format blir offisiell standard

xix.ai / Alibaba Qwen

Alibaba Qwen 3.5-Omni: fullsensorisk modell topper 215 benchmarks

Data Storage Asia

1,4 billioner token på én dag — Alibaba lanserer Qwen3.6-Plus for agentbruk

GitHub / Hacker News

Finjuster Gemma 4 multimodalt på Apple Silicon — uten sky eller NVIDIA

Z.ai / Hacker News

Z.ai slipper GLM-5.1: åpen modell for agentbruk og flerstegsinstruksjoner

[breaking] 8.4., 22:18

Meta lanserer Muse Spark: første modell fra superintelligens-laboratoriet MSL

Meta lanserer Muse Spark, den første modellen fra superintelligens-laboratoriet MSL, med nativ multimodalitet, visuell resonnering og multi-agent-orkestrering.

[forskning] 8.4., 18:38

MegaTrain trener LLM-er med 100 milliarder parametre på ett enkelt GPU

Forskere presenterer MegaTrain, en teknikk som gjør full presisjons-trening av LLM-er med over 100 milliarder parametre mulig på ett enkelt GPU ved å bruke vertsmaskinen sitt CPU-minne som primærlagring.

[analyse] 8.4., 16:14

Anthropic avslører Claude Mythos — for farlig for offentlig utgivelse, brukes til å jakte nulldagssårbarheter

Anthropic lanserer Project Glasswing, et cybersikkerhetsprogram der Claude Mythos Preview jakter nulldagssårbarheter i kritisk infrastruktur. Modellen er kun tilgjengelig for utvalgte partnere som Microsoft, Apple og Google.

[forskning] 7.4., 10:14

Meta lanserer Llama 4 Scout og Maverick: første open-weight multimodale MoE-modeller

Meta har sluppet Llama 4 Scout med 10 millioner tokens kontekstvindu og Maverick med 128 eksperter — de første åpne multimodale mixture-of-experts-modellene.

The Automated

Google slipper Gemma 4 under Apache 2.0: fra mobilbrikke til server

Neural Network World

Microsoft lanserer tre egne MAI-modeller for tale, stemme og bilde

WinBuzzer

Arcee Trinity-Large-Thinking: åpen resonneringsmodell med 399 milliarder parametere til en brøkdel av prisen

[verktøy] 6.4., 06:17

Arcee AI lanserer Trinity-Large-Thinking: åpen resonneringsmodell med 399 milliarder parametere

Arcee AI slipper Trinity-Large-Thinking under Apache 2.0-lisens. Modellen scorer 91,9 på PinchBench, tett bak Claude Opus 4.6 (93,3), til 96 prosent lavere pris.

TechCrunch

Japan vil ta 30 prosent av det globale robotikk-KI-markedet innen 2040

Medium

Qwen 3.6-Plus: Alibabas nye LLM er bygd for å utføre, ikke bare forklare

ummid.com

Google lanserer Gemma 4 — åpen kildekode-modeller basert på Gemini 3

Ubergizmo

Google lanserer Gemini Nano 4 for lokal KI på Android

Times of AI

Microsoft lanserer tre egne KI-modeller: MAI-Transcribe, MAI-Voice og MAI-Image

BigGo News

Alibaba lanserer Qwen3.6-Plus: programmeringsmodell som utfordrer Claude og GPT

VentureBeat

Microsoft lanserer tre egne KI-modeller — utfordrer partneren OpenAI

[forskning] 3.4., 07:12

Qwen3.6-Plus fra Alibaba: 1 million tokens kontekst og alltid-på resonnering

Hva gjør du med en million tokens kontekst? Alibaba mener svaret er agentisk koding. Qwen3.6-Plus er bygget for å navigere hele kodebaser, kjøre testsuiter og ta beslutninger over flere steg. Modellen har obligatorisk chain-of-thought — du kan ikke slå det av. Kontekstvinduet er firedoblet fra Qwen 3.5, men modellen er lukket, i motsetning til forgjengeren som var Apache 2.0. Foreløpig gratis på OpenRouter, med integrasjoner mot Claude Code og Cline. Mindre åpne varianter er lovet, men uten dato.

[forskning] 3.4., 05:53

Gemma 4 fra Google: fire åpne modeller som utfordrer lukket KI

Mens OpenAI og Anthropic holder kortene tett, slipper Google DeepMind fire nye åpne modeller med Apache 2.0-lisens. Gemma 4 kommer i størrelsene 2B, 4B, 26B (mixture-of-experts) og 31B — alle med vision-støtte og resonneringsevne. Simon Willison trekker frem at de minste modellene er overraskende kapable, og at trenden mot effektive små modeller fortsetter. For utviklere som vil kjøre KI lokalt uten lisenskostnader er Gemma 4 et sterkt alternativ.

modeller

Microsoft slipper Fara1.5: åpne computer-use-agenter i tre størrelser

Cohere slipper Command A+: åpen MoE-modell for suveren infrastruktur

NVIDIA slipper Nemotron-Labs-Diffusion: én modell med tre dekodingsmoduser fra 3B til 14B

Stability AI slipper Stable Audio 3.0 med små modeller for lyd på enheten

OpenAI-modell motbeviser 80 år gammel formodning i diskret geometri

Gemini 3.5 Flash: 300 tokens i sekundet med frontier-ytelse og Omni do-anything-modell

Gemma 4 lander med Apache 2.0 og slår 400B-modeller på 31B parametre

OpenAI lanserer GPT-5.3-Codex-Spark: første produkt på Cerebras-maskinvare

Ai2 slipper MolmoAct 2: open-source robotmodell som resonnerer i 3D før den handler

Fastino Labs slipper GLiGuard: 300M-sikkerhetsmodell matcher modeller 90 ganger større

Microsoft GridSFM løser strømflyt 1000 ganger raskere enn klassisk solver

Ant Groups F2LLM-v2: åpen flerspråklig embedding-modell i full skala

Adaption lanserer AutoScientist: KI som trener egne modeller automatisk

OpenAI Daybreak: GPT-5.5 Cyber tar opp kampen mot Anthropic Mythos

Perceptron Mk1: video-analyse 80 til 90 prosent billigere enn Anthropic, OpenAI og Google

Needle: 26M-modell distillert fra Gemini 3.1 kan finjusteres lokalt på Mac og PC

He Kaiming slipper ELF: 105M-modell unngår GPT-autoregresjon med kontinuerlig diffusjon

Thinking Machines lanserer «interaction models»: KI som tar imot lyd, video og tekst kontinuerlig

Sakana AIs 7B Conductor dirigerer GPT-5, Claude og Gemini: 83,9 prosent på LiveCodeBench

HiDream O1-Image: open-source bildemodell som resonnerer for den tegner

NVIDIA Star Elastic: ett checkpoint inneholder 30B-, 23B- og 12B-modeller

OpenAI lanserer GPT-Realtime-2: stemmemodell med GPT-5-resonnering inne i lyd-loopen

Fields-medaljevinner Gowers: ChatGPT 5.5 Pro løste åpent matematikkproblem på halvannen time

Baidu lanserer Ernie 5.1: pretrening koster 6 prosent av tilsvarende modeller

Xiaomi åpner OmniVoice: TTS-modell med stemmekloning på flere hundre språk og enklere arkitektur

OpenAI lanserer GPT-5.5-Cyber: mer tillatende variant for verifiserte forsvarere via Trusted Access for Cyber

llama.cpp støtter nå Xiaomis MiMo-V2.5 Sparse MoE: 310 milliarder parametere lokalt

OpenAI: GPT-Realtime-2 får GPT-5-resonnering, kontekstvinduet 4-dobles til 128K

Google gjør Gemini 3.1 Flash-Lite GA: 60 prosent lavere kost enn tenketier-modeller, p95 under 2 sekunder

OpenAI gjør GPT-5.5 Instant til ny standardmodell, hevder over 50 prosent færre hallusinasjoner

Zyphras ZAYA1-8B aktiverer mindre enn 1 milliard parametre per token og matcher 119B-modeller

IBM slipper Granite Embedding 311M R2 med 32K kontekst og 11,8 poeng MTEB-løft

iOS 27 «Extensions» åpner iPhone for tredjeparts KI-modeller — Anthropic og Google testes nå

MolmoAct 2: Ai2 slipper åpen robotikkmodell med 700 timer bimanual treningsdata

GPT-5.5 Instant blir gratis-default i ChatGPT med 52,5 % færre hallusinasjoner

Poolsides Laguna XS.2 slår GPT-4o på SWE-bench med 3B aktive parametere

Mistral slipper Medium 3.5 med 256k kontekst og åpne vekter under MIT

Anthropic sender ti ferdiglagde Claude-agenter til finansbransjen og kjører dem på ny Opus 4.7

Transformers v5.8.0 lander med innebygd DeepSeek-V4 og Gemma 4 Assistant for spekulativ dekoding

DeepSeek slipper V4 under MIT-lisens: 1,6 billioner parametere til en sjettedel av prisen for GPT-5.5 og Opus 4.7

Det hvite hus vurderer pre-release-vetting av KI-modeller, ifølge NYT — utviklere på HN spør hvor «black market AI» starter

Italia tvinger DeepSeek, Mistral og Nova AI til permanent norsk-stil hallusinasjons-advarsel: avtaler bindende, bøter opp til 10 millioner euro ved brudd

NVIDIAs åpne Nemotron 3 Super topper EnterpriseOps-Gym med 27,3 poeng og slår DeepSeek og Kimi

Google DeepMind ga ut Gemma 4 under Apache 2.0, edge-modellene kjører agenter offline på under 1,5 GB minne

Xiaomi MiMo-V2.5-Pro skrev kompilator på 4,3 timer

Kimi K2.6 vant AI Coding Contest med 22 poeng foran Claude og GPT-5.5

DeepSeek V4 lansert som åpen kildekode — underprise GPT-5.5 og Claude Opus 4.7

Qwen3-TTS: Alibabas åpne talesyntese-modeller er ute — ned til 0,6B parametere

OpenVLA 2 lansert med 30 % bedre task-generalisering og åpne vekter for humanoide roboter

Grok 4.3 kutter input-prisen 40 % og posisjonerer seg som agent-modellen for kostnadssensitive workflows

GPT-5.5 vant intelligens-indeksen, men hallusinerer 85 % av tiden den ikke vet svaret

Mistral Medium 3.5: 128-milliarders dense modell samler chat, resonnering og kode

Grok 4.3: 53 på Intelligence Index, 58 % billigere output enn Grok 4.20

DeepSeek V4: åpen 1,6T-modell med MIT-lisens nær GPT-5.5 til en sjettedel av prisen

IBM Granite Speech 4.1: åpne 2B-modeller for ASR og oversettelse på Apache 2.0

Ant Group åpner Ling-2.6-1T: trillion-parameter modell med fast thinking-arkitektur

Nvidia Nemotron 3 Nano Omni: 30B parametere, 3B aktive, kjører på én GPU

Mistral Medium 3.5: 128B-modell som kjører på fire GPUer, sky-koding-agenter i Vibe og Le Chat Work mode

Gemini Embedding 2 GA: én modell embedder tekst, bilde, video, lyd og PDF i samme rom

NVIDIA slipper Nemotron 3 Nano Omni: åpen 30B-A3B MoE for syn, tale og agenter

OpenAI sporer GPT-5.1s nisser til én belønnings-bug i «Nerdy»-personligheten

Tencent slipper Hunyuan-MT i 1,25-bit kvantisering: 33 språk i 440 MB som kjører offline på telefon

Mistral Medium 3.5: 128B dense modell og fjernkjørte Vibe-agenter i skyen

IBM Granite 4.1: SLM-familie med tale, syn og Guardian-sikkerhetslag

Ant Group åpner Ling 2.6 Flash: 104B MoE med 7,4B aktive parametere og 340 tokens/sekund

Nvidia Nemotron 3 Nano Omni: 30B parametere, 3B aktive, multimodal modell for én GPU

Poolside slipper Laguna XS.2 åpent: 33B MoE med 3B aktive, Apache 2.0 og signal om mer åpenhet

Pleias og GSMA slipper CommonLingua: 2 millioner parametere, 334 språk, 8 MB checkpoint

LittleLamb: Multiverse komprimerer Qwen3-0.6B med 50 % og slår originalen på HLE

Talkie-1930-13B: språkmodell trent kun på tekst utgitt før 1931, kontaminasjonsfri ved konstruksjon

Xiaomi slipper MiMo-V2.5-Pro under MIT: 1,02 billioner parametere MoE med 1M-token kontekst

MOSS-Audio: open source-modellen 8B slår 30B-konkurrenter på timestamp-ASR

Meta slipper Sapiens2: 5B-foundation-modell trent på 1 milliard menneskebilder slår forrige generasjon med 21 mIoU

DeepSeek kutter V4 Pro-prisen med 75 prosent frem til 5. mai

OpenAI legger ned Codex som egen modell — kodingen flyttes inn i GPT-5.5

xAI lanserer Grok Voice Think Fast 1.0 — stemme-KI som resonnerer i sanntid

LamBench tester KI-modeller på lambda-kalkyle — Opus 4.6 og GPT-5.3 Codex deler førsteplassen

DeepSeek V4 Pro og Flash: 1M kontekst, $0.14 per million tokens

Qwen3.6-27B slår 397B-forgjengeren på SWE-bench med 15x færre parametere