Hopp til hovedinnhold
PULSEN_
ESC Tilbake til strømmen

selvhostet

29 SAKER INDEKSERT

[sikkerhet] 4D SIDEN

Upatchet ChromaDB-feil lar angripere kjøre kode på serveren

ChromaDB har en uautentisert RCE-feil (CVE-2026-45829) uten patch i Python FastAPI-serveren, versjoner 1.0.0 til 1.5.8. HiddenLayer publiserte 18. mai etter tre måneders taushet fra vedlikeholderne.

XDA Developers

AMD Ryzen AI Halo: kompakt arbeidsstasjon med opptil 192 GB minne for lokale LLM-er

Ollama (GitHub)

Ollama v0.30 går over til native llama.cpp i stor arkitekturendring

[verktøy] 20.5., 12:20

Forge: guardrails løfter selvhostet 8B-modell fra 53 til 99 prosent på agent-eval

Det MIT-lisensierte Python-rammeverket Forge løfter en selvhostet 8B-modell fra 53 til 99 prosent på sin agent-eval ved å legge guardrails rundt verktøykallene, uten å trene modellen på nytt.

[sikkerhet] 20.5., 12:18

ChromaToast: upatchet RCE i ChromaDB lar angripere ta over serveren

HiddenLayer har avdekket ChromaToast (CVE-2026-45829), en pre-autentisert RCE i vektordatabasen ChromaDB som lar uautentiserte angripere kjøre kode og overta serveren, fortsatt upatchet i versjon 1.5.8.

[analyse] 19.5., 13:24

Anthropic åpner Claude Managed Agents for selvhostede sandkasser og MCP-tunneler

Anthropic lar bedrifter kjøre verktøyene til Claude Managed Agents på egen infrastruktur, men selve agent-loopen blir værende på Anthropics servere.

[sikkerhet] 15.5., 12:27

Fragnesia: Tredje XFRM-baserte root-eskalering i Linux-kjernen på en måned

Linux-distroene ruller ut patcher for CVE-2026-46300 «Fragnesia», en lokal root-eskalering i kjernens XFRM ESP-in-TCP-subsystem. Det er den tredje sårbarheten i samme klasse etter Dirty Frag og Copy Fail, sistnevnte allerede utnyttet i det fri.

[verktøy] 13.5., 08:45

Microsoft Foundry Local 1.1: lokal taletranskribering, embeddings og Responses API

0,67 GB. Det er minnefotavtrykket Microsoft har klart å presse Nvidias Nemotron Speech Streaming-modell ned til, fra 2,47 GB, med under 1 prosent tap på WER. Modellen er nå med i Foundry Local 1.1 og kjører sanntids tale-til-tekst direkte på CPU med 0,56 sekunders algoritmisk latens. Samme oppgradering legger til embeddings via en OpenAI-kompatibel API og en Open Responses API for verktøykall og multimodal vision-language input. Foundry Local er Microsofts lokale alternativ til Azure OpenAI, og 1.1 trimmer dessuten JS-pakken ved å bytte ut koffi-FFI med en custom Node-API C-addon, samt skille ut WebGPU som en valgfri plugin.

[verktøy] 11.5., 12:36

Fedora og Ubuntu legger lokal KI inn i standarddistribusjonen

Fedora 40 og Ubuntu 26.04 leverer llama.cpp, ROCm og CUDA-pakker i standardrepoene, uten telemetri og uten skytvang. Beslutningen sender et signal: lokale modeller er ikke lenger en hobby på siden, men en del av Linux-skrivebordet.

XDA Developers

Qwen 2.5 på NAS dekker smarthjem-automatisering uten Claude

unix.foo

Brutalist Report-utvikler: stopp å lime KI-chat på alt, bruk Apples on-device-modell

Elest.io Blog

Hermes Agent gir selvhostet KI-agent med minne og messaging-gateway

[analyse] 10.5., 16:33

Brukt server-GPU til 200 dollar kjører LLM bedre enn RTX 3060

Hardware Haven viser hvordan en NVIDIA V100 16 GB fra 2017 kan kjøpes for rundt 100 dollar på SXM2-server-sokkel og kobles til vanlig hovedkort med en adapter til ytterligere 100 dollar. PCIe-versjonen koster typisk over 1000 dollar.

[sikkerhet] 10.5., 16:30

Kritisk Ollama-feil lekker minne fra 300 000 selvhostede servere

Cyera-forskere fant en out-of-bounds heap-lesefeil i Ollama som lar uautoriserte angripere lekke prompt-historikk, API-nøkler og miljøvariabler fra rundt 300 000 internett-eksponerte servere. Feilen er sporet som CVE-2026-7482 og fikset i Ollama 0.17.1.

[sikkerhet] 10.5., 00:17

Kritisk minnelekkasje i Ollama eksponerer 300.000 servere (CVE-2026-7482)

CVE-2026-7482 (CVSS 9.1) lar en uautentisert angriper lekke hele heap-minnet til en Ollama-prosess med tre API-kall, og rammer rundt 300.000 servere som står åpne mot internett. Oppgrader til Ollama 0.17.1 umiddelbart.

[verktøy] 9.5., 00:14

OrcaRouter Lite slipper MIT-lisensiert LLM-ruter med null påslag på BYOK-trafikk

Continuum AI lanserte 8. mai OrcaRouter og OrcaRouter Lite, en åpen LLM-ruter med 200+ modeller og null markup på BYOK-trafikk, mot OpenRouters 5 prosent.

[verktøy] 7.5., 12:25

Coder lanserer selvhostede agenter med valgfri modell, retter seg mot regulerte bransjer

61 prosent av utviklingsteamene kjører allerede agenter, men 70 prosent gjør det på infrastruktur som ikke var bygget for det, ifølge Coders egen undersøkelse 6. mai.

[verktøy] 7.5., 00:28

Local Deep Research treffer 4 000 stjerner: selvhostet KI-forskning med 95 % SimpleQA-treff

Open source-verktøyet Local Deep Research kjører hele forskningssløyfen på din egen maskin med Ollama og SearXNG, og hevder 95 % treff på SimpleQA-benchmarken med GPT-4.1-mini.

[verktøy] 6.5., 20:31

Coder Agents i beta: hele agent-stacken kjører selvhostet, modell-agnostisk fra dag én

Coder slipper Coder Agents i beta 6. mai. KI-kodingsagenten kjører hele stacken (kontrollplan, orkestrering, eksekvering) inne i kundens nettverksperimeter.

[verktøy] 6.5., 16:57

QNAP slipper QAI-h1290FX: 16-kjerners EPYC, RTX-GPU og 12 NVMe-spor for lokale LLM-er til 19 000 euro

QNAP lanserte 6. mai 2026 QAI-h1290FX, en edge-server for lokal kjøring av LLM-er. AMD EPYC 7302P (16 kjerner), valgfri NVIDIA RTX-GPU, tolv U.2 NVMe-spor, prislapp ca. 18 999 euro.

[sikkerhet] 5.5., 20:26

Striga finner to upatchede CVE-er i Ollamas Windows-klient som lar angripere plante en stille innloggings-RCE

Ollamas Windows-build kjører signaturverifisering som returnerer «no error» uansett, og bygger oppdateringsstien direkte fra HTTP-headere. Striga viser hvordan kjeden lander en payload i Windows Startup-mappen som kjører ved hver innlogging. Versjon 0.12.10 til 0.23.0 er sårbare.

[sikkerhet] 5.5., 20:24

Bleeding Llama: kritisk Ollama-feil eksponerer prompts og API-nøkler i 300 000 selvhostede oppsett

En CVSS 9.3-feil i Ollamas GGUF-laster lar uautoriserte angripere sende tre API-kall, lese ut prompts og API-nøkler fra heap-minnet, og eksfiltrere dem via Ollamas innebygde push-funksjon. Patchet i 0.17.1.

[verktøy] 3.5., 20:22

OpenClaw v2026.5.2 flytter plugins fra npm til ClawHub: beta-kanal får automatisk fallback

OpenClaw v2026.5.2 ble sluppet 2. mai og flytter eksterne plugins til ClawHub som standardregister. Beta-kanalen prøver «@beta» først, og faller tilbake til «latest» når plugin mangler beta-utgivelse.

Linuxiac

Calibre 9.8: e-boklesleren støtter alle lokale OpenAI-kompatible KI-leverandører

[analyse] 29.4., 12:08

Home Assistant med Qwen3 lokalt slår Googles Gemini for Home, også når kommandoen er tvetydig

Home Assistant med en lokal LLM som Qwen3 9B håndterer tvetydige smarthjem-kommandoer bedre enn Gemini for Home, som dessuten stopper på 20 spørringer per dag på gratisplan.

[sikkerhet] 28.4., 08:09

PoC for Metabase Enterprise-feilen CVE-2026-33725 er offentlig: H2 INIT-trikset gir RCE via serialiseringsimport

En autentisert admin i Metabase Enterprise kan kjøre kode på serveren via H2 JDBC INIT-injeksjon i POST /api/ee/serialization/import. Python-PoC ligger på GitHub. Metabase Cloud er rammet.

[sikkerhet] 27.4., 12:08

CVE-2026-33626: SSRF i LMDeploy ble utnyttet på 12 timer og gir tilgang til cloud-metadata

Sårbarheten i LMDeploys load_image() lar angripere bruke modell-serveren som SSRF-primitiv mot 169.254.169.254 og interne tjenester, og første utnyttelse skjedde 12 timer og 31 minutter etter avsløringen.

[sikkerhet] 26.4., 20:09

CVE-2026-40050: Kritisk path traversal i CrowdStrike LogScale leser serverfiler uten innlogging

CrowdStrike har sluppet patcher for en uautentisert path traversal-feil (CVE-2026-40050) i LogScale som lar eksterne angripere lese vilkårlige serverfiler. Bare selvhostede installasjoner er rammet.

[verktøy] 22.4., 08:11

Wirken-utvikleren kaller agent-gatewayer «DOS-nostalgi»: ett tokenlager, en angriper nok

Davi Ottenheimer publiserte en detaljert sammenligning av NVIDIAs OpenClaw-oppskrift mot sin egen gateway Wirken, og argumenterer for at hele agent-kategorien gjenoppfinner 1980-tallets sikkerhetsfeil ved å gi én prosess alle nøklene.