Rapporten er på over 400 sider, og IEEE Spectrum har plukket ut tallene som betyr noe. USA-baserte organisasjoner slapp 50 «notable» modeller i 2025, og industri står nå for over 90 prosent av dem, opp fra under 50 prosent i 2015. Kina tetter gapet raskt, og leder på roboter: 295 000 industriroboter installert i 2024, mot USAs 34 200.
Pengene følger kurven. Privat KI-investering traff $581 milliarder i 2025, mer enn en dobling fra $253 milliarder året før, og forbi den gamle toppen fra 2021 (som var drevet av oppkjøp, ikke drift). Over $344 milliarder av dette havnet i amerikanske selskaper.
«Å vite at en benchmark for juridisk resonnement har 75 prosent nøyaktighet, forteller oss lite om hvor godt den passer inn i en advokatpraksis.» — Ray Perrault, medleder for AI Index-styringsgruppen
Benchmarks mettes raskere enn forskere klarer å lage nye. På Humanity's Last Exam gikk topp-modellen fra 8,8 prosent i 2025 til over 50 prosent for Claude Opus 4.6 og Gemini 3.1 Pro i april 2026. Samtidig er modellene fortsatt elendige på hverdagsoppgaver: Claude Opus 4.6 leser en analog klokke riktig bare 8,9 prosent av tiden, ifølge ClockBench.
Compute har vokst 3,3 ganger per år siden 2022, målt i H100e-ekvivalenter. Nvidia har over 60 prosent av verdens KI-compute, Amazon og Google følger etter. Karbonavtrykket følger: xAIs Grok 4 estimeres til over 72 000 tonn CO2-ekvivalenter i trening alene, ifølge Stanford. Epoch AI estimerer uavhengig tallet til rundt 140 000 tonn.
Jobb-effekten er det som ikke bekreftes. Rapporten finner at entry-level-stillinger innen softwareutvikling og kundeservice faller, mens mid- og senior-roller holder seg. Men arbeidsledigheten stiger også blant yrker som er lite eksponert for KI. Historien lar seg ikke koke ned til «KI tar jobbene».
Hva bør du gjøre?
- Les selve rapporten eller Epoch AIs datasett før du siterer tall i egne prosjekter. IEEE Spectrums gjennomgang er god, men Stanfords eget sammendrag og grafer gir deg kildene.
- Velg benchmarks med forsiktighet når du vurderer modeller. SWE-Bench Verified og OSWorld er mer agent-relevante enn Humanity's Last Exam hvis du bygger verktøy som skal bruke datamaskinen.
- Juster forventninger til multimodalitet. Hvis prosjektet ditt avhenger av at modellen leser klokker, diagrammer eller nyanser i bilder, test grundig — språkdelen dominerer ofte svarene selv når du gir bilder som input.