selvhostet
29 SAKER INDEKSERT
Upatchet ChromaDB-feil lar angripere kjøre kode på serveren
ChromaDB har en uautentisert RCE-feil (CVE-2026-45829) uten patch i Python FastAPI-serveren, versjoner 1.0.0 til 1.5.8. HiddenLayer publiserte 18. mai etter tre måneders taushet fra vedlikeholderne.
AMD Ryzen AI Halo: kompakt arbeidsstasjon med opptil 192 GB minne for lokale LLM-er
Ollama v0.30 går over til native llama.cpp i stor arkitekturendring
Forge: guardrails løfter selvhostet 8B-modell fra 53 til 99 prosent på agent-eval
Det MIT-lisensierte Python-rammeverket Forge løfter en selvhostet 8B-modell fra 53 til 99 prosent på sin agent-eval ved å legge guardrails rundt verktøykallene, uten å trene modellen på nytt.
ChromaToast: upatchet RCE i ChromaDB lar angripere ta over serveren
HiddenLayer har avdekket ChromaToast (CVE-2026-45829), en pre-autentisert RCE i vektordatabasen ChromaDB som lar uautentiserte angripere kjøre kode og overta serveren, fortsatt upatchet i versjon 1.5.8.
Anthropic åpner Claude Managed Agents for selvhostede sandkasser og MCP-tunneler
Anthropic lar bedrifter kjøre verktøyene til Claude Managed Agents på egen infrastruktur, men selve agent-loopen blir værende på Anthropics servere.
Fragnesia: Tredje XFRM-baserte root-eskalering i Linux-kjernen på en måned
Linux-distroene ruller ut patcher for CVE-2026-46300 «Fragnesia», en lokal root-eskalering i kjernens XFRM ESP-in-TCP-subsystem. Det er den tredje sårbarheten i samme klasse etter Dirty Frag og Copy Fail, sistnevnte allerede utnyttet i det fri.
Microsoft Foundry Local 1.1: lokal taletranskribering, embeddings og Responses API
0,67 GB. Det er minnefotavtrykket Microsoft har klart å presse Nvidias Nemotron Speech Streaming-modell ned til, fra 2,47 GB, med under 1 prosent tap på WER. Modellen er nå med i Foundry Local 1.1 og kjører sanntids tale-til-tekst direkte på CPU med 0,56 sekunders algoritmisk latens. Samme oppgradering legger til embeddings via en OpenAI-kompatibel API og en Open Responses API for verktøykall og multimodal vision-language input. Foundry Local er Microsofts lokale alternativ til Azure OpenAI, og 1.1 trimmer dessuten JS-pakken ved å bytte ut koffi-FFI med en custom Node-API C-addon, samt skille ut WebGPU som en valgfri plugin.
Fedora og Ubuntu legger lokal KI inn i standarddistribusjonen
Fedora 40 og Ubuntu 26.04 leverer llama.cpp, ROCm og CUDA-pakker i standardrepoene, uten telemetri og uten skytvang. Beslutningen sender et signal: lokale modeller er ikke lenger en hobby på siden, men en del av Linux-skrivebordet.
Qwen 2.5 på NAS dekker smarthjem-automatisering uten Claude
Brutalist Report-utvikler: stopp å lime KI-chat på alt, bruk Apples on-device-modell
Hermes Agent gir selvhostet KI-agent med minne og messaging-gateway
Brukt server-GPU til 200 dollar kjører LLM bedre enn RTX 3060
Hardware Haven viser hvordan en NVIDIA V100 16 GB fra 2017 kan kjøpes for rundt 100 dollar på SXM2-server-sokkel og kobles til vanlig hovedkort med en adapter til ytterligere 100 dollar. PCIe-versjonen koster typisk over 1000 dollar.
Kritisk Ollama-feil lekker minne fra 300 000 selvhostede servere
Cyera-forskere fant en out-of-bounds heap-lesefeil i Ollama som lar uautoriserte angripere lekke prompt-historikk, API-nøkler og miljøvariabler fra rundt 300 000 internett-eksponerte servere. Feilen er sporet som CVE-2026-7482 og fikset i Ollama 0.17.1.
Kritisk minnelekkasje i Ollama eksponerer 300.000 servere (CVE-2026-7482)
CVE-2026-7482 (CVSS 9.1) lar en uautentisert angriper lekke hele heap-minnet til en Ollama-prosess med tre API-kall, og rammer rundt 300.000 servere som står åpne mot internett. Oppgrader til Ollama 0.17.1 umiddelbart.
OrcaRouter Lite slipper MIT-lisensiert LLM-ruter med null påslag på BYOK-trafikk
Continuum AI lanserte 8. mai OrcaRouter og OrcaRouter Lite, en åpen LLM-ruter med 200+ modeller og null markup på BYOK-trafikk, mot OpenRouters 5 prosent.
Coder lanserer selvhostede agenter med valgfri modell, retter seg mot regulerte bransjer
61 prosent av utviklingsteamene kjører allerede agenter, men 70 prosent gjør det på infrastruktur som ikke var bygget for det, ifølge Coders egen undersøkelse 6. mai.
Local Deep Research treffer 4 000 stjerner: selvhostet KI-forskning med 95 % SimpleQA-treff
Open source-verktøyet Local Deep Research kjører hele forskningssløyfen på din egen maskin med Ollama og SearXNG, og hevder 95 % treff på SimpleQA-benchmarken med GPT-4.1-mini.
Coder Agents i beta: hele agent-stacken kjører selvhostet, modell-agnostisk fra dag én
Coder slipper Coder Agents i beta 6. mai. KI-kodingsagenten kjører hele stacken (kontrollplan, orkestrering, eksekvering) inne i kundens nettverksperimeter.
QNAP slipper QAI-h1290FX: 16-kjerners EPYC, RTX-GPU og 12 NVMe-spor for lokale LLM-er til 19 000 euro
QNAP lanserte 6. mai 2026 QAI-h1290FX, en edge-server for lokal kjøring av LLM-er. AMD EPYC 7302P (16 kjerner), valgfri NVIDIA RTX-GPU, tolv U.2 NVMe-spor, prislapp ca. 18 999 euro.
Striga finner to upatchede CVE-er i Ollamas Windows-klient som lar angripere plante en stille innloggings-RCE
Ollamas Windows-build kjører signaturverifisering som returnerer «no error» uansett, og bygger oppdateringsstien direkte fra HTTP-headere. Striga viser hvordan kjeden lander en payload i Windows Startup-mappen som kjører ved hver innlogging. Versjon 0.12.10 til 0.23.0 er sårbare.
Bleeding Llama: kritisk Ollama-feil eksponerer prompts og API-nøkler i 300 000 selvhostede oppsett
En CVSS 9.3-feil i Ollamas GGUF-laster lar uautoriserte angripere sende tre API-kall, lese ut prompts og API-nøkler fra heap-minnet, og eksfiltrere dem via Ollamas innebygde push-funksjon. Patchet i 0.17.1.
OpenClaw v2026.5.2 flytter plugins fra npm til ClawHub: beta-kanal får automatisk fallback
OpenClaw v2026.5.2 ble sluppet 2. mai og flytter eksterne plugins til ClawHub som standardregister. Beta-kanalen prøver «@beta» først, og faller tilbake til «latest» når plugin mangler beta-utgivelse.
Calibre 9.8: e-boklesleren støtter alle lokale OpenAI-kompatible KI-leverandører
Home Assistant med Qwen3 lokalt slår Googles Gemini for Home, også når kommandoen er tvetydig
Home Assistant med en lokal LLM som Qwen3 9B håndterer tvetydige smarthjem-kommandoer bedre enn Gemini for Home, som dessuten stopper på 20 spørringer per dag på gratisplan.
PoC for Metabase Enterprise-feilen CVE-2026-33725 er offentlig: H2 INIT-trikset gir RCE via serialiseringsimport
En autentisert admin i Metabase Enterprise kan kjøre kode på serveren via H2 JDBC INIT-injeksjon i POST /api/ee/serialization/import. Python-PoC ligger på GitHub. Metabase Cloud er rammet.
CVE-2026-33626: SSRF i LMDeploy ble utnyttet på 12 timer og gir tilgang til cloud-metadata
Sårbarheten i LMDeploys load_image() lar angripere bruke modell-serveren som SSRF-primitiv mot 169.254.169.254 og interne tjenester, og første utnyttelse skjedde 12 timer og 31 minutter etter avsløringen.
CVE-2026-40050: Kritisk path traversal i CrowdStrike LogScale leser serverfiler uten innlogging
CrowdStrike har sluppet patcher for en uautentisert path traversal-feil (CVE-2026-40050) i LogScale som lar eksterne angripere lese vilkårlige serverfiler. Bare selvhostede installasjoner er rammet.
Wirken-utvikleren kaller agent-gatewayer «DOS-nostalgi»: ett tokenlager, en angriper nok
Davi Ottenheimer publiserte en detaljert sammenligning av NVIDIAs OpenClaw-oppskrift mot sin egen gateway Wirken, og argumenterer for at hele agent-kategorien gjenoppfinner 1980-tallets sikkerhetsfeil ved å gi én prosess alle nøklene.