Hopp til hovedinnhold
PULSEN_
ESC Tilbake til strømmen

LLM

71 SAKER INDEKSERT

XDA Developers

AMD Ryzen AI Halo: kompakt arbeidsstasjon med opptil 192 GB minne for lokale LLM-er

[modell] 21.5., 08:13

NVIDIA slipper Nemotron-Labs-Diffusion: én modell med tre dekodingsmoduser fra 3B til 14B

NVIDIAs Nemotron-Labs-Diffusion samler tre dekodingsmoduser i samme vekter og kjører opptil 5,99x flere tokens per forward enn Qwen3-8B på 8B-modellen.

[analyse] 13.5., 08:56

Google: zero-day i admin-verktøy hadde KI-signert exploit

Google Threat Intelligence Group koblet en zero-day-exploit i et open source-admin-verktøy til kriminell KI-assistert utvikling, like før en planlagt masseutnyttelse.

[sikkerhet] 12.5., 20:32

CISA setter LiteLLM-feilen på listen over aktivt utnyttede sårbarheter

CISA la LiteLLM-feilen CVE-2026-42208 inn i KEV-katalogen 11. mai. SQL-injeksjon i proxyens API-nøkkelvalidering, CVSS 9.3, utnyttet 36 timer etter avsløring.

[forskning] 11.5., 16:14

Sakana og NVIDIA gjør LLM-inferens 20,5 prosent raskere med TwELL: ren CUDA, ingen arkitekturendring

Sakana AI og NVIDIA publiserte TwELL, et nytt sparse-format med tilpassede CUDA-kjerner som gir 20,5 prosent raskere inferens og 21,9 prosent raskere trening på en 2B-modell, uten målbart nøyaktighetstap. Trikset er å pakke aktiveringssparsitet inn i samme tile-størrelse som matmul-kjernen allerede bruker, slik at Tensor Cores ikke blir tomgang.

[forskning] 10.5., 00:33

Ny arXiv-studie: Frontier-modeller korrumperer 25 prosent av dokumentinnhold når de delegeres skriveoppgaver

DELEGATE-52, en ny arXiv-studie, viser at Gemini 3.1 Pro, Claude 4.6 Opus og GPT-5.4 i snitt korrumperer 25 prosent av dokumentinnholdet i lange delegerte arbeidsflyter. Feilene er sparsomme men alvorlige, og verktøybruk gjør det ikke bedre.

[verktøy] 9.5., 00:14

OrcaRouter Lite slipper MIT-lisensiert LLM-ruter med null påslag på BYOK-trafikk

Continuum AI lanserte 8. mai OrcaRouter og OrcaRouter Lite, en åpen LLM-ruter med 200+ modeller og null markup på BYOK-trafikk, mot OpenRouters 5 prosent.

[verktøy] 6.5., 16:57

QNAP slipper QAI-h1290FX: 16-kjerners EPYC, RTX-GPU og 12 NVMe-spor for lokale LLM-er til 19 000 euro

QNAP lanserte 6. mai 2026 QAI-h1290FX, en edge-server for lokal kjøring av LLM-er. AMD EPYC 7302P (16 kjerner), valgfri NVIDIA RTX-GPU, tolv U.2 NVMe-spor, prislapp ca. 18 999 euro.

[verktøy] 5.5., 20:48

llm-from-scratch: bygg en GPT-modell på MacBooken din på under en time

Et åpent verksted-repo lar deg skrive hele GPT-treningspipelinen selv (tokenizer, transformer, training loop) og treffer 10M parametere på MacBook under én time. Bygget på Karpathys nanoGPT-spor.

[regulering] 5.5., 16:30

Fem store forlag og Scott Turow saksøker Meta og Zuckerberg for å ha trent Llama på piratbøker fra LibGen og Anna's Archive

Cengage, Elsevier, Hachette, Macmillan, McGraw Hill og forfatter Scott Turow sendte 5. mai 2026 en class action mot Meta og Mark Zuckerberg i Southern District of New York. Søksmålet hevder at Meta lastet ned millioner av opphavsrettslig beskyttede bøker og fagartikler fra LibGen og Anna's Archive for å trene Llama-modellene.

[verktøy] 4.5., 04:25

Cloudflare splitter LLM-prosessering i to: Infire kjører Kimi K2.5 på 8 H100-er

Cloudflare lanserte en egen inferens-motor «Infire» som splitter prefill og decode på ulik maskinvare og kjører Kimi K2.5 (560 GB) på åtte H100-er.

AI Pressa

DeepSeek V4 lansert som åpen kildekode — underprise GPT-5.5 og Claude Opus 4.7

[forskning] 3.5., 08:09

Alibaba Metis kutter unødvendige verktøykall fra 98 % til 2 % via ny RL-metode

Alibaba har trent en multimodal modell, Metis, med Hierarchical Decoupled Policy Optimisation (HDPO) som lærer agenter å avstå fra verktøykall når intern kunnskap holder. Resultatet: redundante kall faller fra 98 % til 2 % uten å ofre resonneringsnøyaktighet.

[analyse] 2.5., 08:16

En uke uten Claude Pro: lokal Qwen 3.5 9B taklet alt unntatt render-panelet

XDA-skribent erstattet Claude Pro med Qwen 3.5 9B på en RTX 3070 i en uke. Bilde-analyse og research holdt mål, men render-panelet ble grunnen til å beholde $17/mnd-abonnementet.

[verktøy] 29.4., 20:09

Anaconda Desktop i beta: lokal LLM-inferens og conda samlet i ett vindu

Anaconda har sluppet Anaconda Desktop i offentlig beta. Appen samler modell-oppdagelse, lokal inferens og conda-miljøhåndtering på Windows, Mac og Linux og er den varslede arvtakeren etter Navigator.

Europe Says (TimesLIVE)

Sør-Afrika trekker tilbake KI-policy etter at draften siterte oppdiktede forskningsartikler

OnMSFT

DeepSeek V4 Pro og Flash: 1M kontekst, $0.14 per million tokens

[verktøy] 25.4., 08:17

Andrej Karpathys LLM-forelesning får interaktiv visuell guide

Andrej Karpathys forelesning «How LLMs Work» har fått en interaktiv side der du klikker deg gjennom hver fase fra Common Crawl til RLHF. Tok førsteplass på Show HN i går.

[modell] 24.4., 10:33

DeepSeek slipper V4-preview som open source, trent på Huawei Ascend 950 i stedet for Nvidia

DeepSeek lanserte 24. april en preview av V4, open source, med sterkere resonnering og agentisk koding enn R1. Modellen er trent på Huaweis «Supernode» (Ascend 950-klynger) og Cambricon-brikker, ikke Nvidia.

flipbook.page

Flipbook genererer hver nettside live fra en språkmodell — HTML strømmes token for token

Infosecurity Magazine

Forskere avdekker 10 prompt-injection-angrep i bruk mot KI-agenter — målet er svindel og datatyveri

[forskning] 23.4., 04:14

Forskning: KI-modeller 10 til 20 ganger mer villige til å gi farlig info pakket inn som cyberpunk-fiksjon

10 til 20 ganger mer effektivt. Det er hva forskere fra DexAI Icaro Lab og Sapienza University fant da de pakket farlige KI-prompts inn som cyberpunk-noveller, teologiske disputaser og mytopoetisk metafor. Adversarial Humanities Benchmark består av 3 600 prompts og er testet mot 31 frontier-modeller fra Anthropic, Google og OpenAI. Snittsuksess for omgåelse: 55,75 %, opp fra under 4 % på de opprinnelige direkte forespørslene.

[verktøy] 22.4., 00:13

GoModel: åpen kildekode-gateway som ruter LLM-kall til 10 leverandører fra ett endepunkt

GoModel er en ny åpen kildekode-gateway skrevet i Go som eksponerer OpenAI-kompatibelt API mot Anthropic, Gemini, Groq, xAI, Azure, Oracle, Ollama og flere i samme kall. Kjører som Docker-container.

BusinessWire

Grafana Labs lanserer observability-suite for LLM-kall, token-latens og KI-kostnader

[verktøy] 21.4., 04:19

Moonshot slipper Kimi Vendor Verifier: test om inferens-leverandøren din faktisk kjører den modellen du betaler for

Moonshot AI åpner Kimi Vendor Verifier, et verktøy som sammenligner output fra tredjeparts-API-er mot referanseimplementasjonen for å avsløre skjulte kvantiseringer og modellbytter. Lanseringen traff 192 poeng på Hacker News.

[sikkerhet] 21.4., 00:15

SGLang har kritisk RCE-sårbarhet CVE-2026-5760: Ondsinnede GGUF-filer kjører Python på serveren (CVSS 9,8)

CERT/CC advarer om CVE-2026-5760 i SGLang: en ondsinnet GGUF-fil kan kjøre vilkårlig Python-kode via «/v1/rerank». CVSS 9,8. Patch umiddelbart hvis du serverer lokale LLM-er.

[modell] 20.4., 20:10

xAI lanserer Grok 4.3 stille i modellvelgeren — STT-prisen på $0,10/time er den reelle nyheten

xAI slapp Grok 4.3 Beta på grok.com 17. april uten pressemelding, låst bak SuperGrok Heavy-tieren på $300 per måned. Samme dag dumpet selskapet priser på tale-APIer som underkutter ElevenLabs og OpenAI med 86–92 prosent.

antirez.com

Redis-skaperen: KI-sikkerhet handler om modellintelligens, ikke GPU-antall

Cloudflare Research

Cloudflare komprimerer LLM-vekter tapsfritt — 2,6 bits entropi per BF16-eksponent

The Decoder

Qwen3.6 slår Gemma 4 med 73 mot 52 på SWE-bench — hele benchmark-kortet

[sikkerhet] 17.4., 12:11

Firebase-nøkkel uten API-restriksjoner trigget 54 000 euro Gemini-regning på 13 timer

En eksponert Firebase browser-nøkkel brukte 54 000 euro Gemini-kreditt på 13 timer før Google Clouds varsler rakk å reagere.

[breaking] 17.4., 12:10

Anthropic lanserer Claude Opus 4.7 med 13 prosent bedre koding og ny xhigh-innsats

Claude Opus 4.7 løfter kodebenchmark 13 prosent over Opus 4.6, støtter bilder opp til 2576 piksler og introduserer ny xhigh-innsats til uendret pris.

[analysis] 16.4., 20:19

21GB Qwen3.6 på en laptop tegnet bedre pelikan enn Claude Opus 4.7

Simon Willison testet Qwen3.6-35B-A3B (20,9GB kvantisert) mot nye Claude Opus 4.7 på sin MacBook Pro M5 via LM Studio. Den lokale modellen vant på både pelikan-på-sykkel og flamingo-på-enhjuling — SVG-benchmarken Willison har brukt siden oktober 2024.

[verktøy] 16.4., 16:19

Qwen3.6-35B-A3B: Alibaba åpner MoE-modell med 262 144 tokens kontekst

Qwen3.6-35B-A3B er en ny åpen MoE-modell fra Alibaba med 35 milliarder parametere totalt, 3 milliarder aktive, 262 144 tokens native kontekst og toppscore på Terminal-Bench 2.0.

introspective-diffusion.github.io

Introspective Diffusion Language Models: ny arkitektur lar modeller observere egne diffusjonsprosesser

[verktøy] 16.4., 07:25

Gemma 4 kjører nå fullt offline på iPhone — E2B-varianten anbefalt for mobilbruk

Googles Gemma 4 er tilgjengelig for lokal inferens på iPhone via AI Edge Gallery-appen. Ingen skytjeneste, ingen API-kall — modellen kjører direkte på enhetens GPU.

[verktøy] 15.4., 20:36

Gemini Robotics-ER 1.6: DeepMind oppgraderer romlig KI-resonnering for roboter

Google DeepMind lanserer Gemini Robotics-ER 1.6 med forbedret romlig resonnering, suksessdeteksjon og instrumentavlesning via Gemini API.

GitHub

LangAlpha: open-source KI-verktøy for finansanalyse med persistente arbeidsrom

[sikkerhet] 15.4., 14:16

Anthropic Mythos finner sikkerhetshull raskere enn de kan fikses

Anthropics nye Mythos-modell har funnet tusenvis av kritiske sårbarheter i alle store operativsystemer og nettlesere, og over 99 % er fortsatt ikke patchet.

[analyse] 15.4., 14:13

Linux 7.0 innfører formelle regler for KI-generert kode

Linux 7.0 lanserer den første offisielle policyen for KI-assistert kode i kjernen med frivillig Assisted-by-merking og fullt menneskelig ansvar for alle bidrag.

[sikkerhet] 15.4., 07:23

OpenAI lanserer GPT-5.4-Cyber — kun for verifiserte sikkerhetseksperter

OpenAI lanserer en sikkerhets-finjustert variant av GPT-5.4 som senker nektelsesgrenser for defensivt sikkerhetsarbeid, kun tilgjengelig via verifisert tilgang.

Introspective Diffusion (research)

Introspective Diffusion: første diffusjonsmodell som matcher autoregressive modeller i kvalitet

TestingCatalog

Meta lanserer Contemplating-modus — 16 KI-agenter resonnerer parallelt gratis

The Technology Express

MiniMax slipper M2.7 med åpen kildekode — modellen deltok i sin egen utvikling

[forskning] 14.4., 18:12

Åpne modeller under 32B parametre matcher nå GPT-5-nivå ytelse

Qwen3.5 27B og Gemma 4 31B scorer på nivå med GPT-5 på Artificial Analysis sin Intelligence Index, men sliter med faktagjenkalling.

[verktøy] 14.4., 14:18

Google lanserer Gemma 4 i fire størrelser — 31B-utgaven rangerer tredje globalt

Googles nye Gemma 4-serie inkluderer fire modeller fra 2,3 til 31 milliarder parametere, der 31B-utgaven rangerer som tredje beste åpne modell globalt. Den minste varianten kjører på Raspberry Pi med 128K kontekstvindu.

[sikkerhet] 14.4., 04:19

Tre kritiske sårbarheter i LiteLLM gir full overtakelse av KI-gatewayer

Tre kritiske sårbarheter i LiteLLM lar angripere omgå autentisering, stjele credentials og kjøre vilkårlig kode. Oppgrader til v1.83.0 nå.

Hacker News

N-Day-Bench: Ny benchmark måler om språkmodeller finner reelle sikkerhetshull

Quanta Magazine

KI løser matematiske teoremer ingen har klart på tiår

[analyse] 13.4., 18:16

Stanford AI Index 2026: 88 prosent av bedrifter bruker KI, men ytelsen svikter på enkle oppgaver

Stanfords 2026 AI Index viser at 88 prosent av organisasjoner bruker KI, opp 10 prosentpoeng fra 2024, men modellene svikter fortsatt på enkle oppgaver.

[analyse] 11.4., 04:18

Linux-kjernen publiserer offisiell policy for KI-assistert koding

Linux-kjerneprosjektet fastslår at KI-agenter aldri kan signere Developer Certificate of Origin og innfører et nytt Assisted-by-tag for attribusjon.

SecurityWeek

Internet Bug Bounty stanser nye innmeldinger etter flom av KI-genererte rapporter

Bytecode Alliance

Wasmtime-teamet brukte KI-verktøy til å finne 12 sårbarheter på tre uker

[sikkerhet] 10.4., 06:21

Sikkerhetsvarsel: LLM-rutere kan injisere ondsinnede verktøykall i agent-systemer

Noen LLM-rutere legger til uautoriserte verktøykall i API-svar, noe som kan gi vilkårlig kodeeksekvering i agent-rammeverk der verktøy utfører reelle handlinger.

Business Insider

«Tokenmaxxing» splitter tech-bransjen: Er token-forbruk et mål på produktivitet?

[breaking] 8.4., 22:18

Meta lanserer Muse Spark: første modell fra superintelligens-laboratoriet MSL

Meta lanserer Muse Spark, den første modellen fra superintelligens-laboratoriet MSL, med nativ multimodalitet, visuell resonnering og multi-agent-orkestrering.

[sikkerhet] 8.4., 22:16

GrafanaGhost: nullklikks prompt injection bruker Grafanas KI til å eksfiltrere data

Noma Security har avdekket GrafanaGhost, et nullklikks-angrep som utnytter Grafanas innebygde KI-assistent til å eksfiltrere sensitive data uten brukerinteraksjon eller innlogging.

[forskning] 8.4., 18:38

MegaTrain trener LLM-er med 100 milliarder parametre på ett enkelt GPU

Forskere presenterer MegaTrain, en teknikk som gjør full presisjons-trening av LLM-er med over 100 milliarder parametre mulig på ett enkelt GPU ved å bruke vertsmaskinen sitt CPU-minne som primærlagring.

[sikkerhet] 8.4., 16:15

LiteLLM-pakke kompromittert: populært Python-bibliotek for LLM-ruting stjal API-nøkler fra utviklere

En ondsinnet versjon av LiteLLM, Python-biblioteket som lar utviklere rute kall mellom OpenAI, Anthropic og andre LLM-er, ble brukt til å stjele API-nøkler og credentials. KI-selskapet Mercor mistet 4 TB data.

XDA Developers

Spekulativ dekoding gjør lokale LLM-er raskere uten maskinvareoppgradering

Gizmodo

App Store-boom: 84 % flere nye apper på tre måneder takket være vibe coding

AI Base News

Alibabas Qwen3.6-Plus: halvparten så stor, full agentkoding

Hacker News / GitHub

GuppyLM: en 8,7M-parameter språkmodell bygd fra bunnen for å lære bort LLM-mekanikk

George Liu AI

Kjør Gemma 4 lokalt med LM Studios nye headless CLI

[verktøy] 6.4., 07:03

Karpathy dropper vektordatabaser — bygger kunnskapsbase med ren Markdown

Andrej Karpathy har publisert en åpen arkitektur for LLM-drevne kunnskapsbaser som erstatter vektordatabaser med strukturerte Markdown-filer og en LLM som kompilerer innholdet automatisk.

AP News

WGA inngår 4-årig avtale med Hollywood — blokkerer KI-trening på manus

Medium

Qwen 3.6-Plus: Alibabas nye LLM er bygd for å utføre, ikke bare forklare

Hacker News

sllm lar utviklere dele GPU-noder og kjøre LLM-er uten tokenbegrensning

The Register

Caltech-startup slipper 1-bit LLM som er 14 ganger mindre og kjører på iPhone

BigGo News

Alibaba lanserer Qwen3.6-Plus: programmeringsmodell som utfordrer Claude og GPT

[verktøy] 3.4., 05:53

AMD Lemonade: open source LLM-server bruker GPU og NPU samtidig

478 poeng på Hacker News på én dag. AMD har lansert Lemonade, en open source-server som lar deg kjøre store språkmodeller lokalt ved å bruke både GPU og NPU på nyere PC-er. Verktøyet støtter Windows 11 og Linux, og krever ingen skykonto. For utviklere med AMD-maskinvare er dette et reelt alternativ til Ollama — særlig for maskiner med mye unified RAM der modeller som gpt-oss-120b kan lastes direkte.