modeller
149 SAKER INDEKSERT
Microsoft slipper Fara1.5: åpne computer-use-agenter i tre størrelser
Microsoft slapp Fara1.5 i tre størrelser (4B, 9B, 27B); 9B-modellen løser 63 % av oppgavene i Online-Mind2Web, nesten dobbelt av forgjengeren Fara-7B.
Cohere slipper Command A+: åpen MoE-modell for suveren infrastruktur
48 språk og full Apache 2.0-lisens. Det er rammene rundt Command A+, Coheres nye Mixture-of-Experts-modell. Den er multimodal og bygget for å kjøres lokalt med datakontrollen i egne hender, rettet mot offentlig sektor og regulerte bransjer. Cohere selger den på datasuverenitet: åpne vekter du eier selv, i et marked der avansert KI ellers samles hos noen få leverandører i noen få land.
NVIDIA slipper Nemotron-Labs-Diffusion: én modell med tre dekodingsmoduser fra 3B til 14B
NVIDIAs Nemotron-Labs-Diffusion samler tre dekodingsmoduser i samme vekter og kjører opptil 5,99x flere tokens per forward enn Qwen3-8B på 8B-modellen.
Stability AI slipper Stable Audio 3.0 med små modeller for lyd på enheten
OpenAI-modell motbeviser 80 år gammel formodning i diskret geometri
Gemini 3.5 Flash: 300 tokens i sekundet med frontier-ytelse og Omni do-anything-modell
Google lanserte Gemini 3.5 Flash på I/O 2026 med rundt 300 tokens i sekundet og benchmark-tall på linje med Gemini 3.1 Pro som kjører i en fjerdedel av hastigheten.
Gemma 4 lander med Apache 2.0 og slår 400B-modeller på 31B parametre
Google slapp Gemma 4 i april under Apache 2.0. Flaggskipet på 31 milliarder parametre scorer 89,2 prosent på AIME 2026 og er tredje beste åpne modell på Arena-leaderboardet.
OpenAI lanserer GPT-5.3-Codex-Spark: første produkt på Cerebras-maskinvare
OpenAI har sluppet GPT-5.3-Codex-Spark, en raskere variant av kodemodellen som er live for ChatGPT Pro og kjører utelukkende på Cerebras-maskinvare, ikke Nvidia.
Ai2 slipper MolmoAct 2: open-source robotmodell som resonnerer i 3D før den handler
Fastino Labs slipper GLiGuard: 300M-sikkerhetsmodell matcher modeller 90 ganger større
Mens åpne guardrail-modeller veier 7 til 27 milliarder parametere, gjør Fastino Labs' nye GLiGuard samme jobb på 300 millioner: like treffsikkert, opptil 16 ganger raskere.
Microsoft GridSFM løser strømflyt 1000 ganger raskere enn klassisk solver
Microsoft slipper GridSFM, en liten foundation-modell som finner optimal AC-strømflyt på millisekunder, 1000 ganger raskere enn full AC-solver og uten ny trening per nett-topologi.
Ant Groups F2LLM-v2: åpen flerspråklig embedding-modell i full skala
Ant Group og Shanghai Jiao Tong Universitys CodeFuse-team slapp F2LLM-v2 som fullt åpen flerspråklig embedding-modellfamilie etter 11 førsteplasser på MTEB-benchmarken.
Adaption lanserer AutoScientist: KI som trener egne modeller automatisk
OpenAI Daybreak: GPT-5.5 Cyber tar opp kampen mot Anthropic Mythos
Perceptron Mk1: video-analyse 80 til 90 prosent billigere enn Anthropic, OpenAI og Google
Perceptron lanserte i dag Mk1, en proprietær video-analysemodell på API til 0,15 dollar per million input-tokens og 1,50 dollar per million output.
Needle: 26M-modell distillert fra Gemini 3.1 kan finjusteres lokalt på Mac og PC
Cactus Compute har distillert Gemini 3.1 til en 26M-parameter funksjonskall-modell som kjører lokalt på Mac og PC med 6 000 token/s prefill, alt under MIT-lisens.
He Kaiming slipper ELF: 105M-modell unngår GPT-autoregresjon med kontinuerlig diffusjon
MIT-teamet til He Kaiming slipper ELF, en 105M-parameter diffusjonsmodell trent på 45 mrd. tokens som når perplexity 24 på OpenWebText, under modeller trent på 10× mer data.
Thinking Machines lanserer «interaction models»: KI som tar imot lyd, video og tekst kontinuerlig
Thinking Machines, Mira Muratis lab, slipper en research preview av TML-Interaction-Small. Modellen behandler lyd, video og tekst i 200 ms mikro-turer istedenfor i diskrete turer.
Sakana AIs 7B Conductor dirigerer GPT-5, Claude og Gemini: 83,9 prosent på LiveCodeBench
Sakana AI trente en 7-milliarder-parameter-modell med forsterkningslæring til å delegere oppgaver mellom GPT-5, Claude Sonnet 4 og Gemini 2.5 Pro, og slo hver enkelt modell alene. Conductor satte nye rekorder med 83,9 prosent på LiveCodeBench og 87,5 prosent på GPQA-Diamond, akseptert til ICLR2026.
HiDream O1-Image: open-source bildemodell som resonnerer for den tegner
HiDream slipper O1-Image, en 8 milliarder parameteres open-source bildemodell som jobber rett i pikselrom og bruker en resonnerende prompt-agent før den genererer.
NVIDIA Star Elastic: ett checkpoint inneholder 30B-, 23B- og 12B-modeller
OpenAI lanserer GPT-Realtime-2: stemmemodell med GPT-5-resonnering inne i lyd-loopen
Fields-medaljevinner Gowers: ChatGPT 5.5 Pro løste åpent matematikkproblem på halvannen time
Fields-medaljevinner Timothy Gowers ga ChatGPT 5.5 Pro et åpent problem i tallteori og fikk tilbake et polynomielt bevis på under to timer, uten matematisk input fra ham selv.
Baidu lanserer Ernie 5.1: pretrening koster 6 prosent av tilsvarende modeller
Baidu slipper Ernie 5.1: pretreningskostnad er 6 prosent av sammenlignbare modeller, totalparametrene er kuttet til en tredjedel av Ernie 5.0, og modellen rangerer fjerde på LMArenas søkeliste.
Xiaomi åpner OmniVoice: TTS-modell med stemmekloning på flere hundre språk og enklere arkitektur
Xiaomi åpnet 8. mai OmniVoice, en TTS-modell som rapporterer forståelighet nær eller bedre enn ekte tale på 102 språk og slår kommersielle systemer på 24.
OpenAI lanserer GPT-5.5-Cyber: mer tillatende variant for verifiserte forsvarere via Trusted Access for Cyber
OpenAI ruller ut GPT-5.5-Cyber i begrenset preview for verifiserte cyberforsvarere via Trusted Access for Cyber. Modellen er tunet til å tillate autorisert red teaming og pen-testing.
llama.cpp støtter nå Xiaomis MiMo-V2.5 Sparse MoE: 310 milliarder parametere lokalt
llama.cpp har merget støtte for Xiaomis MiMo-V2.5 Sparse MoE med 310 mrd. totale parametere og 15 mrd. aktiverte ved inferens. Samtidig slippes Qwen3.6 27B Heretic og WebWorld 8B/14B/32B i GGUF.
OpenAI: GPT-Realtime-2 får GPT-5-resonnering, kontekstvinduet 4-dobles til 128K
OpenAI lanserte 7. mai tre lydmodeller i Realtime-API-et: GPT-Realtime-2 med GPT-5-resonnering og 128K kontekst, GPT-Realtime-Translate (70+ språk) og GPT-Realtime-Whisper for streaming-STT.
Google gjør Gemini 3.1 Flash-Lite GA: 60 prosent lavere kost enn tenketier-modeller, p95 under 2 sekunder
Google har gjort Gemini 3.1 Flash-Lite generelt tilgjengelig. Gladly rapporterer 60 prosent lavere kost enn tenketier-modeller og p95-latens rundt 1,8 sekunder.
OpenAI gjør GPT-5.5 Instant til ny standardmodell, hevder over 50 prosent færre hallusinasjoner
Zyphras ZAYA1-8B aktiverer mindre enn 1 milliard parametre per token og matcher 119B-modeller
Zyphra slapp 6. mai ZAYA1-8B, en åpen MoE-modell med 8 milliarder totale parametre, men under 1 milliard aktive per token. Selskapet hevder den matcher Mistral-Small-4-119B og Nemotron-3-Nano-30B-A3B på resonnement, matematikk og kode.
IBM slipper Granite Embedding 311M R2 med 32K kontekst og 11,8 poeng MTEB-løft
IBM lanserte 29. april en oppdatert flerspråklig embedding-modell med 311M parametre, 32 768 tokens kontekst og 64,0 på Multilingual MTEB Retrieval. Modellen støtter 200+ språk og er Apache 2.0-lisensiert med ONNX og OpenVINO-bygg.
iOS 27 «Extensions» åpner iPhone for tredjeparts KI-modeller — Anthropic og Google testes nå
Bloomberg melder at Apple bygger en «Extensions»-funksjon i iOS 27 som lar brukere velge tredjeparts KI-modeller for Siri, Writing Tools og Image Playground; Google og Anthropic testes nå.
MolmoAct 2: Ai2 slipper åpen robotikkmodell med 700 timer bimanual treningsdata
Allen Institute for AI slipper MolmoAct 2 sammen med det de kaller verdens største åpne robotikkdatasett: over 700 timer tobents tabletop-manipulasjon.
GPT-5.5 Instant blir gratis-default i ChatGPT med 52,5 % færre hallusinasjoner
Poolsides Laguna XS.2 slår GPT-4o på SWE-bench med 3B aktive parametere
San Francisco-oppstarten Poolside slapp 5. mai 2026 Laguna XS.2 under Apache 2.0. MoE-kodemodellen aktiverer kun 3 mrd. av 33 mrd. parametere og scorer 68,2 % på SWE-bench Verified, mot GPT-4os 49 %.
Mistral slipper Medium 3.5 med 256k kontekst og åpne vekter under MIT
Anthropic sender ti ferdiglagde Claude-agenter til finansbransjen og kjører dem på ny Opus 4.7
Transformers v5.8.0 lander med innebygd DeepSeek-V4 og Gemma 4 Assistant for spekulativ dekoding
Hugging Face Transformers v5.8.0 ruller ut native støtte for DeepSeek-V4-familien og Gemma 4 Assistant, en MTP-drafter som lar deg kjøre spekulativ dekoding mot Gemma 4 ut av boksen.
DeepSeek slipper V4 under MIT-lisens: 1,6 billioner parametere til en sjettedel av prisen for GPT-5.5 og Opus 4.7
DeepSeek slapp tirsdag V4 under MIT-lisens på Hugging Face, en 1,6 billioner-parameter MoE-modell som ifølge selskapet matcher GPT-5.5 og Claude Opus 4.7 på frontier-benchmarks til omtrent én sjettedel av API-prisen.
Det hvite hus vurderer pre-release-vetting av KI-modeller, ifølge NYT — utviklere på HN spør hvor «black market AI» starter
New York Times rapporterte 4. mai 2026 at Trump-administrasjonen veier en ordning der KI-modeller må gjennomgå statlig vurdering før utgivelse. Reuters fulgte opp samme dag, og diskusjonen på Hacker News samlet 96 poeng på under et døgn.
Italia tvinger DeepSeek, Mistral og Nova AI til permanent norsk-stil hallusinasjons-advarsel: avtaler bindende, bøter opp til 10 millioner euro ved brudd
Italias konkurransetilsyn AGCM kunngjorde 30. april 2026 at tre tilsynssaker mot DeepSeek, Mistral AI og Nova AI er lukket med bindende forpliktelser. Alle tre må vise permanent italiensk hallusinasjons-advarsel ved chat-input og oppdatere brukervilkår på italiensk, ellers vanker bøter opp til ti millioner euro.
NVIDIAs åpne Nemotron 3 Super topper EnterpriseOps-Gym med 27,3 poeng og slår DeepSeek og Kimi
NVIDIA Nemotron 3 Super ligger nå på førsteplass i EnterpriseOps-Gyms leaderboard for åpne modeller med 27,3 poeng i snitt. Modellen er en 120B hybrid Mamba-Transformer MoE med 12B aktive parametere og 1M kontekstvindu.
Google DeepMind ga ut Gemma 4 under Apache 2.0, edge-modellene kjører agenter offline på under 1,5 GB minne
Google DeepMind slapp Gemma 4 under Apache 2.0 i fire størrelser: E2B, E4B, 26B MoE og 31B Dense. Edge-variantene driver agentarbeidsflyter helt offline med under 1,5 GB minne på enkelte enheter.
Xiaomi MiMo-V2.5-Pro skrev kompilator på 4,3 timer
Xiaomi har sluppet MiMo-V2.5-Pro, en åpen mixture-of-experts-modell med 1,02 billioner parametere som skrev en hel kompilator på 4,3 timer i interne tester.
Kimi K2.6 vant AI Coding Contest med 22 poeng foran Claude og GPT-5.5
Den åpen-vekts kinesiske modellen Kimi K2.6 fra Moonshot AI vant 12. dag av AI Coding Contest. Claude Opus 4.7 ble nummer fem, GPT-5.5 nummer tre.
DeepSeek V4 lansert som åpen kildekode — underprise GPT-5.5 og Claude Opus 4.7
Qwen3-TTS: Alibabas åpne talesyntese-modeller er ute — ned til 0,6B parametere
OpenVLA 2 lansert med 30 % bedre task-generalisering og åpne vekter for humanoide roboter
Grok 4.3 kutter input-prisen 40 % og posisjonerer seg som agent-modellen for kostnadssensitive workflows
GPT-5.5 vant intelligens-indeksen, men hallusinerer 85 % av tiden den ikke vet svaret
GPT-5.5 topper Artificial Analysis Intelligence Index med 60 poeng, men hallusinasjonsraten er 85,53 % — mer enn dobbelt så høy som Claude Opus 4.7. Apollo Research fant at modellen løy om å løse umulige programmeringsoppgaver i 29 % av tilfellene.
Mistral Medium 3.5: 128-milliarders dense modell samler chat, resonnering og kode
Mistral lanserer Medium 3.5, en dense 128B-modell med 256K-kontekst og valgbar resonnering. Vibe-CLI-en får parallelle skyagenter i isolerte sandkasser som åpner pull requests selv.
Grok 4.3: 53 på Intelligence Index, 58 % billigere output enn Grok 4.20
xAI lanserer Grok 4.3 med 37,5 % billigere input og 58,3 % billigere output enn Grok 4.20. Modellen scorer 53 på Artificial Analysis Intelligence Index, rett over Claude Sonnet 4.6.
DeepSeek V4: åpen 1,6T-modell med MIT-lisens nær GPT-5.5 til en sjettedel av prisen
DeepSeek slipper V4 — 1,6 billioner parametere, MIT-lisens og BrowseComp 83,4 prosent mot GPT-5.5 sin 84,4. API-en koster rundt en sjettedel av OpenAI og Anthropic.
IBM Granite Speech 4.1: åpne 2B-modeller for ASR og oversettelse på Apache 2.0
IBM slipper Granite Speech 4.1 2B og 2B-NAR på Hugging Face under Apache 2.0, med ASR og oversettelse for seks språk og en non-autoregressive variant som lander RTFx 1820 på én H100.
Ant Group åpner Ling-2.6-1T: trillion-parameter modell med fast thinking-arkitektur
Ant Group har åpnet Ling-2.6-1T på Hugging Face under MIT-lisens. Én billion parametere på en hybrid MLA + Linear Attention-arkitektur og 262 000 tokens kontekst. Modellen scorer 72,2 på SWE-bench Verified og hevder open-source SOTA på BFCL-V4, med topp-resultater på AIME26 og TAU2-Bench. «Fast Thinking»-mekanismen kutter overflødig chain-of-thought-output via det Ant kaller Contextual Process Redundancy Suppression, og gir lavere VRAM-bruk og raskere inference på lange kontekster. Modellen er klar for agent-workflows som Claude Code, OpenClaw og OpenCode — Ant forlenger gratis API-tilgang via OpenRouter i én uke til.
Nvidia Nemotron 3 Nano Omni: 30B parametere, 3B aktive, kjører på én GPU
30 milliarder parametere totalt, 3 milliarder aktive per token og kontekstvindu på 262 000 tokens. Nvidias Nemotron 3 Nano Omni er en omni-modell som får plass på én GPU. Arkitekturen er en Mamba-Transformer-hybrid med MoE-routing der bare nødvendige eksperter aktiveres per modalitet (tekst, bilde, video, lyd). Vektene ligger på Hugging Face under Nvidia Nemotron Open Model License, og kan kjøres via vLLM, SGLang eller Ollama. Nvidia rapporterer rundt 9 ganger kapasitet på video-reasoning og 7 ganger på multi-dokument-resonnering mot andre omni-modeller. Sikter mot edge-deployment på DGX Spark, Jetson og andre Ampere/Hopper/Blackwell-rigger.
Mistral Medium 3.5: 128B-modell som kjører på fire GPUer, sky-koding-agenter i Vibe og Le Chat Work mode
Mistral slapp 29. april Medium 3.5, en 128B dense-modell som scorer 77,6 % på SWE-Bench Verified og kan selvhostes på fire GPUer.
Gemini Embedding 2 GA: én modell embedder tekst, bilde, video, lyd og PDF i samme rom
NVIDIA slipper Nemotron 3 Nano Omni: åpen 30B-A3B MoE for syn, tale og agenter
Mens OpenAI og Google holder multimodale modeller bak betalte APIer, slipper NVIDIA Nemotron 3 Nano Omni som åpen 30B-A3B MoE for syn, tale og agenter.
OpenAI sporer GPT-5.1s nisser til én belønnings-bug i «Nerdy»-personligheten
Bruken av ordet «goblin» i ChatGPT-svar steg 175 % etter GPT-5.1, og 66,7 % av tilfellene kom fra «Nerdy»-personligheten som utgjorde bare 2,5 % av trafikken.
Tencent slipper Hunyuan-MT i 1,25-bit kvantisering: 33 språk i 440 MB som kjører offline på telefon
Tencent har åpnet Hy-MT1.5-1.8B i 1,25-bits-kvantisering: 33 språk og 1056 oversettelses-retninger pakket fra 3,3 GB til 440 MB, kjørbart offline på Android.
Mistral Medium 3.5: 128B dense modell og fjernkjørte Vibe-agenter i skyen
Mistral slipper Medium 3.5 som ny standard-modell: 128B dense, 256k kontekst, 77,6 % på SWE-Bench, og en sky-runtime der Vibe-koding-agenter kjører asynkront fra CLI eller Le Chat.
IBM Granite 4.1: SLM-familie med tale, syn og Guardian-sikkerhetslag
Ant Group åpner Ling 2.6 Flash: 104B MoE med 7,4B aktive parametere og 340 tokens/sekund
Ling 2.6 Flash er Apache-lisensiert med BF16-, FP8- og INT4-versjoner; på 4× H20-oppsett gir den 340 tokens per sekund og bruker rundt en tidel av token-budsjettet til Nvidias Nemotron-3-Super.
Nvidia Nemotron 3 Nano Omni: 30B parametere, 3B aktive, multimodal modell for én GPU
Nvidia slipper Nemotron 3 Nano Omni, en åpen multimodal modell med 30 milliarder parametere og 3 milliarder aktive per inferens, designet for å kjøre KI-agenter på én GPU.
Poolside slipper Laguna XS.2 åpent: 33B MoE med 3B aktive, Apache 2.0 og signal om mer åpenhet
Poolside frigir Laguna XS.2 på Hugging Face under Apache 2.0 — en MoE med 33 milliarder parametere totalt og 3 milliarder aktive, optimert for agentisk koding. Selskapet sier det er deres første åpne modell og varsler en bredere satsning på open-weight-økosystemet.
Pleias og GSMA slipper CommonLingua: 2 millioner parametere, 334 språk, 8 MB checkpoint
LittleLamb: Multiverse komprimerer Qwen3-0.6B med 50 % og slår originalen på HLE
Multiverse Computing slipper tre 0.3B-modeller bygget på CompactifAI-komprimering av Qwen3-0.6B. Begge tekstvariantene slår originalen på HLE-benchmarken.
Talkie-1930-13B: språkmodell trent kun på tekst utgitt før 1931, kontaminasjonsfri ved konstruksjon
Xiaomi slipper MiMo-V2.5-Pro under MIT: 1,02 billioner parametere MoE med 1M-token kontekst
MiMo-V2.5-Pro har 1,02 billioner totale parametere og 42 milliarder aktive, hybrid attention med 6:1 SWA-til-GA-ratio og innebygd Multi-Token Prediction. På SWE-Bench Pro scorer den 57,2.
MOSS-Audio: open source-modellen 8B slår 30B-konkurrenter på timestamp-ASR
OpenMOSS, MOSI.AI og Shanghai Innovation Institute har lansert MOSS-Audio. 8B-Thinking-varianten scorer 71,08 i snitt på fire audio-benchmarks og slår både 33B-modeller og lukkede Gemini-3.1-Pro.
Meta slipper Sapiens2: 5B-foundation-modell trent på 1 milliard menneskebilder slår forrige generasjon med 21 mIoU
Sapiens2 kommer i fire størrelser fra 0,4B til 5B parametre med 1K native oppløsning og kombinerer MAE-rekonstruksjon med DINOv3-kontrastiv læring. Selv 0,4B-modellen slår forrige 2B på segmentering.
DeepSeek kutter V4 Pro-prisen med 75 prosent frem til 5. mai
OpenAI legger ned Codex som egen modell — kodingen flyttes inn i GPT-5.5
xAI lanserer Grok Voice Think Fast 1.0 — stemme-KI som resonnerer i sanntid
LamBench tester KI-modeller på lambda-kalkyle — Opus 4.6 og GPT-5.3 Codex deler førsteplassen
Victor Taelin har sluppet LamBench med 120 oppgaver i ren lambda-kalkyle. GPT-5.3 Codex og Opus 4.6 topper med 90 prosent, mens Opus 4.5, Sonnet 4.5 og GPT-5.1 scorer null.
DeepSeek V4 Pro og Flash: 1M kontekst, $0.14 per million tokens
Qwen3.6-27B slår 397B-forgjengeren på SWE-bench med 15x færre parametere
Sakana AI lanserer Fugu: multi-agent-system orkestrerer flere frontier-modeller via API
Sakana AI har sluppet Fugu, et multi-agent-system som koordinerer flere frontier-modeller bak ett OpenAI-kompatibelt API.
Z.AI slipper GLM-5.1 med åtte timers autonomi og MIT-vekter på Hugging Face
Z.AI har sluppet GLM-5.1 under MIT-lisens på Hugging Face: åtte timers autonomi, 200K kontekst og 58,4 på SWE-Bench Pro, over Claude Opus 4.6 og GPT-5.4.
DeepSeek slipper V4-preview som open source, trent på Huawei Ascend 950 i stedet for Nvidia
DeepSeek lanserte 24. april en preview av V4, open source, med sterkere resonnering og agentisk koding enn R1. Modellen er trent på Huaweis «Supernode» (Ascend 950-klynger) og Cambricon-brikker, ikke Nvidia.
Google avviser cyber-spesifikk frontier-modell: «Gemini er allerede god nok»
Anthropic bekrefter Mythos-lekkasje — tredjepartskontraktor og gjettet URL ga Discord-gruppe tilgang
Ifølge Bloomberg og Fortune fikk en gruppe i en privat Discord-kanal tilgang til Anthropics Claude Mythos Preview samme dag modellen ble kunngjort, via en tredjepartskontraktor. Gruppen gjettet seg fram til endepunkt-URL-en ved hjelp av tidligere lekkasjer om Anthropics interne navnekonvensjoner.
OpenAI slipper GPT-5.5 «Spud»: bedre på koding, datamaskinbruk og dypere research
OpenAI lanserer torsdag GPT-5.5, ny flaggskipmodell med internt kodenavn «Spud», som skal være bedre på koding, autonom datamaskinbruk og research-oppgaver enn forgjengeren GPT-5.
Qwen3.6-27B slår Claude Opus på flere kode-benchmarks — åpen og lokal
Alibaba har lansert Qwen3.6-27B, en åpen dense modell som matcher Claude 4.5 Opus på flere kode-benchmarks og kjører lokalt i BF16 på 55,6 GB.
Deezer: 44 prosent av nye sanger som lastes opp daglig er KI-generert
OpenAI lanserer ChatGPT Images 2.0 med skarpere tekst-i-bilde og bedre instruksjonsforståelse
OpenAI har sluppet ChatGPT Images 2.0, en oppdatert bildegenerator integrert i ChatGPT med bedre tekstgjengivelse, mer presis instruksjonsforståelse og forbedret bildekoherens.
«Frankenstein»-modell stabler Claude Opus, GLM og Qwen: slår 35B på 9,2 GB VRAM
Kyle Hessling stablet lag fra tre destillerte modeller til en 18B hybrid som slår Alibabas 35B på 40 av 44 tester og kjører på en RTX 3060 med 9,2 GB VRAM.
OpenAI lanserer ChatGPT Images 2 — ny bildemodell som endelig klarer å skrive tekst i bildet
Kimi K2.6 slår Claude Opus 4.6 og GPT-5.4 på flere agent-benchmarks — åpen modell med 300-agent-swarm
Moonshot AI slipper Kimi K2.6, en åpen modell som matcher eller slår Claude Opus 4.6 og GPT-5.4 på HLE, DeepSearchQA og SWE-Bench Pro. Agent Swarm-arkitekturen skalerer til 300 sub-agenter i 4 000 koordinerte steg — og traff 606 poeng på Hacker News ved lansering.
xAI lanserer Grok 4.3 stille i modellvelgeren — STT-prisen på $0,10/time er den reelle nyheten
xAI slapp Grok 4.3 Beta på grok.com 17. april uten pressemelding, låst bak SuperGrok Heavy-tieren på $300 per måned. Samme dag dumpet selskapet priser på tale-APIer som underkutter ElevenLabs og OpenAI med 86–92 prosent.
Alibaba slipper Qwen 3.6-Max-Preview — proprietært flaggskip uten åpne vekter
Nvidia lanserer Nemotron 3 Super — 120B åpen modell optimalisert for agentarbeidsflyter
Anonym blindtest av Claude Opus 4.6 mot 4.7: brukerne velger 4.7, men tokenforbruket vekker debatt
Bill Chambers publiserte en åpen leaderboard der brukere anonymt sammenligner svar fra Claude Opus 4.6 og 4.7. Saken nådde 594 poeng og 557 kommentarer på Hacker News.
Stanford AI Index 2026: investeringene eksploderer, effekten på jobber forblir uklar
Stanfords AI Index 2026 viser at KI-investeringene nådde $581 milliarder i 2025, mer enn dobbelt så mye som året før, mens datagrunnlaget for effekten på arbeidsmarkedet fortsatt er sprikende.
Qwen3.6-35B-A3B er ute: 3B aktive parametere scorer 81,7 på MMMU og slår Claude Sonnet 4.5
Qwen3.6 slår Gemma 4 med 73 mot 52 på SWE-bench — hele benchmark-kortet
Qwen3.6-35B-A3B: Alibaba slipper MoE-modell med 35 mrd parametere der bare 3 mrd er aktive
35 milliarder totale parametere, 3 milliarder aktive per token: Alibabas nye Qwen3.6-35B-A3B er en Mixture-of-Experts-modell bygget for å kjøre effektivt på forbrukerhardware og slå Qwen3.5-27B på agentisk koding.
OpenAI lanserer GPT-5.4-Cyber som svar på Anthropics Mythos
Baidu open-sourcer Ernie-Image: 8 milliarder parametere kjører på 24 GB VRAM
Baidu åpner Ernie-Image, en Diffusion Transformer med 8 milliarder parametere som kjører på forbrukergrafikkort med 24 GB VRAM og matcher lukkede modeller som NanoBanana i tekstgjengivelse.
Claude Opus 4.7 er tilgjengelig nå — 13 % bedre koding og ny xhigh-effort
Anthropic lanserer Claude Opus 4.7 med 13 % forbedring på kodingsbenchmark over 4.6, ny xhigh-effortnivå og tredoblet bildestøtte. Prisen er uendret på $5/$25 per million tokens.
Introspective Diffusion Language Models: ny arkitektur lar modeller observere egne diffusjonsprosesser
Ny rapport: KI-modeller er blitt så kapable at eksisterende benchmarks ikke lenger holder
Microsoft MAI Image 2: ny effektiv bildemodell for produksjonsmiljøer
MiniMax slipper M2.7 med åpen kildekode — modellen deltok i sin egen utvikling
KI løser matematiske teoremer ingen har klart på tiår
Svekker Anthropic Claude? Brukere melder om ytelsesfall mens ledelsen avviser kritikken
Etter Mythos: Mindre modeller finner de samme sikkerhetssårbarhetene
Små, billige KI-modeller gjenfinner mye av Anthropics Mythos-analyse. Sikkerhetsfronten er ujevn.
MiniMax open-sourcer M2.7 — en agentmodell som deltar i sin egen utvikling
Arcee AI brukte halvparten av startkapitalen på en åpen resonneringsmodell som matcher Claude Opus
Gapet mellom lukket og åpen KI setter open-weights-modeller i søkelyset
MiniMax åpner kildekoden til M2.7: agentmodell som matcher GPT-5.3-Codex på SWE-Pro
MiniMax M2.7 scorer 56,22 % på SWE-Pro og er den første modellen som deltok i sin egen treningsprosess over 100 autonome iterasjonsrunder.
Små modeller finner de samme sårbarhetene som Anthropics Mythos
Alibabas Qwen passerer 50 % av globale open source KI-nedlastinger
Anthropics Mythos-modell skaper uro i banksektoren
DeepSeek V4 nærmer seg lansering etter gjentatte forsinkelser
Mindre modeller matcher Mythos på sikkerhetsanalyse
OpenAI lanserer GPT-5.4 Mini og Nano for sub-agent-oppgaver
Gemini kan nå svare med interaktive 3D-modeller og simuleringer
OpenAIs sjefsforsker: KI nærmer seg nivået til en forskerpraktikant
ByteDance lanserer Seeduplex — full-duplex talemodell som lytter og snakker simultant
Alibaba sto bak den anonyme KI-videomodellen HappyHorse-1.0 som ledet benchmark
Alibaba leder 290 millioner dollar-investering i startup som bygger «verden-modell»
Alibabas Qwen nærmer seg én milliard nedlastinger — dominerer open source KI
Meta lanserer Muse Spark — sin første multimodale inferensmodell
OpenAI planlegger begrenset utrulling av ny sikkerhetsmodell
PyTorch Foundation tar inn Safetensors — Hugging Face-format blir offisiell standard
Alibaba Qwen 3.5-Omni: fullsensorisk modell topper 215 benchmarks
1,4 billioner token på én dag — Alibaba lanserer Qwen3.6-Plus for agentbruk
Finjuster Gemma 4 multimodalt på Apple Silicon — uten sky eller NVIDIA
Z.ai slipper GLM-5.1: åpen modell for agentbruk og flerstegsinstruksjoner
Meta lanserer Muse Spark: første modell fra superintelligens-laboratoriet MSL
Meta lanserer Muse Spark, den første modellen fra superintelligens-laboratoriet MSL, med nativ multimodalitet, visuell resonnering og multi-agent-orkestrering.
MegaTrain trener LLM-er med 100 milliarder parametre på ett enkelt GPU
Forskere presenterer MegaTrain, en teknikk som gjør full presisjons-trening av LLM-er med over 100 milliarder parametre mulig på ett enkelt GPU ved å bruke vertsmaskinen sitt CPU-minne som primærlagring.
Anthropic avslører Claude Mythos — for farlig for offentlig utgivelse, brukes til å jakte nulldagssårbarheter
Anthropic lanserer Project Glasswing, et cybersikkerhetsprogram der Claude Mythos Preview jakter nulldagssårbarheter i kritisk infrastruktur. Modellen er kun tilgjengelig for utvalgte partnere som Microsoft, Apple og Google.
Meta lanserer Llama 4 Scout og Maverick: første open-weight multimodale MoE-modeller
Meta har sluppet Llama 4 Scout med 10 millioner tokens kontekstvindu og Maverick med 128 eksperter — de første åpne multimodale mixture-of-experts-modellene.
Google slipper Gemma 4 under Apache 2.0: fra mobilbrikke til server
Microsoft lanserer tre egne MAI-modeller for tale, stemme og bilde
Arcee Trinity-Large-Thinking: åpen resonneringsmodell med 399 milliarder parametere til en brøkdel av prisen
Arcee AI lanserer Trinity-Large-Thinking: åpen resonneringsmodell med 399 milliarder parametere
Arcee AI slipper Trinity-Large-Thinking under Apache 2.0-lisens. Modellen scorer 91,9 på PinchBench, tett bak Claude Opus 4.6 (93,3), til 96 prosent lavere pris.
Japan vil ta 30 prosent av det globale robotikk-KI-markedet innen 2040
Qwen 3.6-Plus: Alibabas nye LLM er bygd for å utføre, ikke bare forklare
Google lanserer Gemma 4 — åpen kildekode-modeller basert på Gemini 3
Google lanserer Gemini Nano 4 for lokal KI på Android
Microsoft lanserer tre egne KI-modeller: MAI-Transcribe, MAI-Voice og MAI-Image
Alibaba lanserer Qwen3.6-Plus: programmeringsmodell som utfordrer Claude og GPT
Microsoft lanserer tre egne KI-modeller — utfordrer partneren OpenAI
Qwen3.6-Plus fra Alibaba: 1 million tokens kontekst og alltid-på resonnering
Hva gjør du med en million tokens kontekst? Alibaba mener svaret er agentisk koding. Qwen3.6-Plus er bygget for å navigere hele kodebaser, kjøre testsuiter og ta beslutninger over flere steg. Modellen har obligatorisk chain-of-thought — du kan ikke slå det av. Kontekstvinduet er firedoblet fra Qwen 3.5, men modellen er lukket, i motsetning til forgjengeren som var Apache 2.0. Foreløpig gratis på OpenRouter, med integrasjoner mot Claude Code og Cline. Mindre åpne varianter er lovet, men uten dato.
Gemma 4 fra Google: fire åpne modeller som utfordrer lukket KI
Mens OpenAI og Anthropic holder kortene tett, slipper Google DeepMind fire nye åpne modeller med Apache 2.0-lisens. Gemma 4 kommer i størrelsene 2B, 4B, 26B (mixture-of-experts) og 31B — alle med vision-støtte og resonneringsevne. Simon Willison trekker frem at de minste modellene er overraskende kapable, og at trenden mot effektive små modeller fortsetter. For utviklere som vil kjøre KI lokalt uten lisenskostnader er Gemma 4 et sterkt alternativ.