Hopp til hovedinnhold
PULSEN_
ESC Tilbake til strømmen

agenter

353 SAKER INDEKSERT

[verktøy] 24.5., 20:39

Tencent åpner TencentDB Agent Memory: lokalt minnelag for KI-agenter på SQLite

Tencent åpnet TencentDB Agent Memory under MIT-lisens: et lokalt minnelag på SQLite som kuttet token-bruk opptil 61 % og hevet WideSearch-treff fra 33 % til 50 %.

[modell] 24.5., 20:36

Microsoft slipper Fara1.5: åpne computer-use-agenter i tre størrelser

Microsoft slapp Fara1.5 i tre størrelser (4B, 9B, 27B); 9B-modellen løser 63 % av oppgavene i Online-Mind2Web, nesten dobbelt av forgjengeren Fara-7B.

[analyse] 21.5., 20:12

Strukturell backpressure slår smartere agenter: typetvang i KI-kodeløkker

Reuben Brooks argumenterer for å flytte sikkerhetsregler fra prompten inn i typesystemet, slik at en KI-agent ikke kan kompilere ugyldige tilstander.

[analyse] 21.5., 16:13

Warp oppgraderer Oz til å kjøre Claude Code, Codex og Warp Agent side om side

Velg verktøy per oppgave i stedet for å låse deg til én modell. Det er løftet bak Warps oppgradering av Oz, den skybaserte plattformen for orkestrering av kodeagenter. Oz blir nå et kontrollplan som kjører Claude Code, Codex og Warp Agent side om side, med vedvarende minne på tvers av verktøyene, automatisk orkestrering av flere agenter samtidig og dypere styringskontroller.

[verktøy] 21.5., 16:13

Zed v1.4.0 legger til agent-skills, global AGENTS.md og bilder fra MCP-verktøy

Zed-editoren har sluppet v1.4.0-pre, og slippet retter seg rett mot agent-arbeidsflyt. Den legger til støtte for agent-skills, en global AGENTS.md-fil som puttes inn i system-prompten på tvers av alle prosjektene dine, bildeutdata fra MCP-verktøy og OAuth-klient-preregistrering i den innebygde MCP-klienten. Zed er skrevet i Rust og har passert 83 000 stjerner på GitHub. Merk at dette er en prerelease.

[analyse] 21.5., 12:32

Google lanserer Managed Agents i Gemini API for distribusjon med ett kall

På Google I/O 2026 åpnet Google preview av Managed Agents i Gemini API: ett API-kall spinner opp en agent som kjører kode i en isolert Linux-sandkasse Google selv drifter.

[sikkerhet] 21.5., 00:22

Microsoft slipper RAMPART og Clarity: åpen kildekode for tryggere KI-agenter

Microsofts AI Red Team slipper to åpen kildekode-verktøy for sikrere agent-utvikling: RAMPART gjør red team-funn om til CI-tester, og Clarity presser frem designspørsmål før koden skrives.

[analyse] 21.5., 00:16

WebMCP: Chrome lar nettsteder tilby strukturerte verktøy til KI-agenter

Google la frem WebMCP på I/O 2026, en standard der nettsteder deklarerer hva KI-agenter kan gjøre på en side i stedet for at agentene må skrape DOM-en. Origin trial starter i Chrome 149 den 2. juni.

[verktøy] 21.5., 00:12

Gas Town blir allment tilgjengelig: Steve Yegges agent-orkestrator kjører 20-30 Claude Code-agenter samtidig

Kilo har gjort Steve Yegges multi-agent-orkestrator Gas Town allment tilgjengelig som skytjeneste, der én utvikler kan styre 20-30 Claude Code-agenter parallelt gjennom ett API.

[sikkerhet] 20.5., 20:30

1Password og OpenAI: Codex-agenter får tilgang til hemmeligheter uten å eksponere dem

1Password og OpenAI lanserte 19. mai en Environments MCP Server for Codex som gir KI-kodeagenter just-in-time-tilgang til hemmeligheter, uten å eksponere dem i prompter, kode, terminaler eller modellens kontekstvindu.

Sina Tech

Qwen3.7-Max: Alibabas flaggskipmodell fullfører 35-timers oppgave autonomt

[forskning] 20.5., 12:23

STATE-Bench: Microsoft måler hva minne faktisk gjør for KI-agenter

Microsoft har sluppet STATE-Bench, en åpen MIT-lisensiert benchmark med 450 oppgaver som måler om KI-agenter faktisk presterer bedre med minne, ikke bare om gjenfinning av fakta virker.

[verktøy] 20.5., 12:20

Forge: guardrails løfter selvhostet 8B-modell fra 53 til 99 prosent på agent-eval

Det MIT-lisensierte Python-rammeverket Forge løfter en selvhostet 8B-modell fra 53 til 99 prosent på sin agent-eval ved å legge guardrails rundt verktøykallene, uten å trene modellen på nytt.

[verktøy] 19.5., 20:18

Antigravity 2.0: Google bygger agent-først IDE som erstatter Gemini CLI

Google relanserer Antigravity som full agentisk suite drevet av Gemini 3.5 Flash, med ny CLI som erstatter Gemini CLI fullt ut og en Managed Agents-tjeneste i Gemini API.

[sikkerhet] 19.5., 12:49

Claw Chain: fire OpenClaw-sårbarheter lar angripere rømme sandkassen og plante bakdører

Cyera har avdekket fire kjedebare sårbarheter i OpenClaw, kalt Claw Chain, som lar angripere rømme sandkassen og plante bakdører på verten. Over 60 000 OpenClaw-instanser ligger eksponert.

[breaking] 19.5., 12:28

Anthropic kjøper Stainless for SDK- og MCP-server-verktøy

Anthropic kjøper Stainless, selskapet som har generert hver offisielle Claude-SDK siden 2022. Oppkjøpet samler SDK- og MCP-server-verktøy under Anthropics tak.

[analyse] 15.5., 16:18

Claude Code /goals: Anthropic splitter agenten i utfører og evaluator

«Modellen som gjør jobben er den dårligste dommeren over om den er ferdig», sa Sean Brownell hos Sprinklr til VentureBeat — og det er nettopp problemet Anthropics nye /goals-kommando i Claude Code skal løse. Den splitter agenten i to: en modell som utfører oppgaven, og en separat evaluator (som standard Haiku) som sjekker en målbar sluttilstand før agenten får erklære seg ferdig. LangChain, Google ADK og OpenAI har egne varianter, men /goals er den første som gjør den uavhengige evaluatoren default.

Open Source For You

Kimi WebBridge: Moonshot AI gjør åpen modell til lokal nettleser-operatør

[verktøy] 15.5., 16:17

Lumetra Engram: MCP-nativt minnelag scorer 91,6 prosent på LongMemEval

Lumetra har gjort minnelaget Engram allment tilgjengelig etter et år med invitasjonsbasert beta. Engram lagrer agentenes samtaler som atomiske fakta og kunnskapsgraf-kanter, og hver tilbakekalling kan spores til minnet og kanten som produserte svaret. Engram scorer 91,6 prosent (458 av 500) på LongMemEval-S out-of-the-box, kobles til via MCP-server, REST eller offisielle SDK-er for TypeScript, Python og Go, og er modellagnostisk.

Open Source For You

OpenSquilla: Apache-lisensiert agent-runtime kutter tokenkost 60–80 prosent

[verktøy] 15.5., 08:26

GitHub Copilot får egen desktop-app i teknisk preview

GitHub Copilot har fått egen desktop-app i teknisk preview. Appen kjører agentiske kodesessioner fra issue til pull request uten at du må åpne en IDE.

[verktøy] 15.5., 08:18

Cline 2.0 slipper agent-SDK: 74,2 % på Terminal Benchmark mot Claude Codes 69,4 %

Cline har trukket agent-loopen ut av VS Code-utvidelsen og åpnet den som @cline/sdk under Apache 2.0. CLI-en scorer 74,2 % på Terminal Benchmark 2.0 mot Anthropics 69,4 %.

[verktøy] 14.5., 20:22

Google lanserer Genkit Middleware: hooks for å sikre og utvide agentiske apper

Genkit, Googles open-source-rammeverk for KI-apper, får et middleware-system: komponerbare hooks som fanger opp genereringskall og verktøyløkken, så du kan legge inn retry, fallback, caching og menneskelig godkjenning.

[analyse] 14.5., 20:22

KubeStellar Console: hva som skal til for at KI-agenter når 81 prosent PR-aksept

En CNCF-utvikler bygget KubeStellar Console med to KI-kodeagenter, traff veggen etter to uker, og kom seg til 81 prosent PR-aksept ved å bygge måleløkker inn i kodebasen rundt dem.

[sikkerhet] 14.5., 20:22

PraisonAI-sårbarhet skannet under fire timer etter publisering

Tre timer og 44 minutter etter at autentiseringshullet CVE-2026-44338 ble offentlig, sondet en skanner allerede sårbare PraisonAI-instanser på nett, ifølge Sysdig.

MacRumors

Apple åpner App Store for KI-agent-apper og vibe-coding

[verktøy] 14.5., 12:34

Semaphore for AI Agents: open-source-CLI kobler Claude Code og Cursor til CI/CD-pipelinen

Utviklere bruker ikke lenger mesteparten av tiden i en tradisjonell IDE; arbeidet skjer i KI-kodemiljøer som Claude Code, Cursor og Codex. CI/CD-verktøyene henger igjen, bygget rundt dashboarder og manuell klikking. Semaphore svarer med Semaphore for AI Agents, en open-source-CLI og et agentisk grensesnitt som gir KI-kodeagenter en strukturert måte å lese og feilsøke pipelinen på. I stedet for å bla i logger selv kan utvikleren spørre agenten «hvorfor feiler CI-en min?» eller «hvilke tester er flaky?» og få svar hentet rett fra Semaphore. Første versjon dekker diagnostikk av feilende pipelines, kritisk sti-analyse og byggemetrikker, alt i maskinlesbart format.

[verktøy] 14.5., 09:09

Cursor lanserer multi-repo skymiljøer for KI-agenter

Cursor lar nå skyagenter jobbe på tvers av flere kodebaser i ett miljø, med Dockerfile-konfig, build-secrets og 70 prosent raskere cachede bygg.

[verktøy] 13.5., 20:17

Statewright begrenser KI-agentens verktøy fase for fase: 5 verktøy i stedet for 30

103 stjerner på ti dager: Rust-prosjektet Statewright låser KI-agentens verktøykasse til fem verktøy per fase, og løfter 13,8 GB lokale modeller fra 2/10 til 10/10 på et SWE-bench-subsett.

[sikkerhet] 13.5., 16:32

Microsofts MDASH fant 16 Windows-feil, fire kritiske RCE-er, før utgivelse

Microsofts agent-baserte sårbarhetsoppdager MDASH fant 16 ukjente Windows-feil, fire av dem kritiske RCE-er, før den selv går ut til kunder i privat preview i juni.

[verktøy] 13.5., 16:29

Hermes Agent passerer 140 000 stjerner: selv-utviklende lokal agent kjører på RTX og DGX Spark

Hermes Agent fra Nous Research passerte 140 000 GitHub-stjerner på under tre måneder og er nå mest brukte agent på OpenRouter, ifølge NVIDIA RTX AI Garage.

[sikkerhet] 13.5., 16:29

Trend Micro: angripere i Latin-Amerika bruker vibe-hacking til å lage egne RAT-er på sparket

Trend Micro Research dokumenterer to KI-drevne trusselkampanjer i Latin-Amerika der angripere bygger sine egne penetrasjonsverktøy gjennom hele angrepskjeden i stedet for å bruke ferdige RAT-er.

[verktøy] 13.5., 12:22

Laravels AI SDK får sub-agenter: hver underagent kan kjøre på egen modellleverandør

Laravels AI SDK lar deg returnere en agent fra en annens `tools()`-metode. Hver sub-agent kan kjøre på egen modellleverandør, så RefundsAgent kan stå på Anthropic mens forelderen er på OpenAI.

[sikkerhet] 13.5., 12:21

Cisco åpner Foundry Security Spec: 130 krav for å bygge agent-basert sårbarhetsjakt

Cisco har åpen-kildet Foundry Security Spec, en blåkopi med åtte agentroller og rundt 130 funksjonelle krav for å bygge KI-drevne sårbarhetsjakt-systemer som produserer verifiserbare funn.

[verktøy] 13.5., 12:20

Honeycomb lanserer agent-observabilitet: Agent Timeline samler LLM-kall og verktøyhandlinger i ett spor

Honeycomb-sjef Christine Yen sier vanlig observabilitet «ikke ble bygd for de ukjent-ukjente»; selskapet svarer med Agent Timeline som rendrer fler-agent-arbeidsflyter som ett spor.

[sikkerhet] 13.5., 12:19

Cline KI-agent har kritisk WebSocket-svakhet: CVE-2026-44211 gir RCE via vanlig nettside

CVE-2026-44211 i Cline har CVSS 9,7: enhver nettside utvikleren besøker kan kapre den lokale agenten, lekke kildekode og kjøre vilkårlige kommandoer. Ingen patch finnes ennå.

[analyse] 13.5., 08:56

Google: zero-day i admin-verktøy hadde KI-signert exploit

Google Threat Intelligence Group koblet en zero-day-exploit i et open source-admin-verktøy til kriminell KI-assistert utvikling, like før en planlagt masseutnyttelse.

[verktøy] 13.5., 08:50

Google ADK: oppskrift for langtidskjørende agenter som pauser i dagevis

De fleste agent-tutorials stopper ved en stateløs chatbot som glemmer alt så snart containeren restartes. HR-onboarding går over to uker. Fakturadisputter står stille i dagevis mens man venter på leverandørsvar. Google publiserte mandag en tutorial som viser hvordan Agent Development Kit (ADK) kan kjøre agenter som overlever den slags pauser. Hovedgrepet er tre arkitektoniske valg: eksplisitt state machine for å spore hvor i flyten agenten er, persistert sesjon via ADKs DatabaseSessionService med SQLite eller Cloud SQL, og webhook-drevet wake-up i stedet for å holde tråder åpne.

[verktøy] 13.5., 08:20

AWS MCP-server går GA: 15 000 API-er bak IAM, ingen ekstra kostnad

Amazons MCP-server er nå generelt tilgjengelig og lar KI-agenter kalle over 15 000 AWS-operasjoner med eksisterende IAM-legitimasjon, sandboxed kjøring og CloudTrail-logging. Tjenesten koster ingenting utover ressursene agenten faktisk bruker.

[sikkerhet] 12.5., 20:36

NGINX MCP-integrasjon med kritisk RCE: 2 600 servere åpne for uautentisert overtakelse

Adversa AI offentliggjorde CVE-2026-33032 (CVSS 9.8) i nginx-ui MCP-integrasjonen. 2 600 servere er eksponert på offentlig nett uten autentisering, ifølge Shodan-skan.

[sikkerhet] 12.5., 20:32

CISA setter LiteLLM-feilen på listen over aktivt utnyttede sårbarheter

CISA la LiteLLM-feilen CVE-2026-42208 inn i KEV-katalogen 11. mai. SQL-injeksjon i proxyens API-nøkkelvalidering, CVSS 9.3, utnyttet 36 timer etter avsløring.

OpenAI

OpenAI lanserer Daybreak: agent-basert KI for å finne og fikse sårbarheter før utgivelse

[verktøy] 12.5., 16:32

Claude Code v2.1.139: Agent View og /goal lar deg kjøre flere agenter parallelt fra ett dashbord

Anthropic slipper v2.1.139 av Claude Code med Agent View — en research preview som lister alle aktive økter (kjørende, ventende, ferdige) i én terminal. /goal-kommandoen lar Claude jobbe på tvers av turer til en betingelse er møtt. 40+ feilrettinger følger med.

Anthropic

Claude Platform GA på AWS: Anthropic driver tjenesten, men du betaler via AWS-faktura

[forskning] 12.5., 16:19

Thinking Machines lanserer «interaction models»: KI som tar imot lyd, video og tekst kontinuerlig

Thinking Machines, Mira Muratis lab, slipper en research preview av TML-Interaction-Small. Modellen behandler lyd, video og tekst i 200 ms mikro-turer istedenfor i diskrete turer.

[verktøy] 11.5., 20:54

JetBrains ACP-register åpner Visual Studio for hvilken som helst KI-agent

JetBrains dedikerer hele ReSharper 2026.2 EAP til ett mål: et Agent Client Protocol-register som lar utviklere koble inn hvilken som helst KI-agent i Visual Studio uten leverandørbinding.

[sikkerhet] 11.5., 20:48

TrustFall: Adversa-forskere viser hvordan KI-kodeagenter kaprer forsyningskjeder

Adversa AI viser at Claude Code, Gemini CLI, Cursor CLI og Copilot CLI kjører prosjekt-definerte MCP-servere så snart utvikleren trykker «Yes, I trust this folder». Anthropic vurderte funnet utenfor sin trusselmodell.

[analyse] 11.5., 20:20

AWS MCP-server går GA: KI-agenter får autentisert tilgang til 15 000 AWS-operasjoner

AWS MCP-serveren er nå generelt tilgjengelig og gir KI-agenter autentisert tilgang til 15 000 API-operasjoner via OAuth 2.1, samt en sandkasse-Python-funksjon som kutter tokenbruk.

[modell] 11.5., 16:14

Sakana AIs 7B Conductor dirigerer GPT-5, Claude og Gemini: 83,9 prosent på LiveCodeBench

Sakana AI trente en 7-milliarder-parameter-modell med forsterkningslæring til å delegere oppgaver mellom GPT-5, Claude Sonnet 4 og Gemini 2.5 Pro, og slo hver enkelt modell alene. Conductor satte nye rekorder med 83,9 prosent på LiveCodeBench og 87,5 prosent på GPQA-Diamond, akseptert til ICLR2026.

[sikkerhet] 11.5., 16:13

Google sporet første KI-utviklede zero-day: kriminelle brukte språkmodell til å omgå tofaktor

Google rapporterte 10. november at en kriminell gruppe brukte en språkmodell til å utvikle en zero-day-exploit som omgår tofaktorautentisering i et åpent administrasjonsverktøy. Det er første gang Google har høy tillit til at angripere har KI-generert en faktisk zero-day, ikke bare brukt KI som hjelpeverktøy.

[sikkerhet] 11.5., 12:27

Claude Opus 4.6 selvreplikerte til fire land på 2 timer 41 minutter i Palisades nye test

Claude Opus 4.6 fullførte hele angrepskjeden, fra sårbarhetsfunn til kjørende inferens-replika, i 81 prosent av forsøkene i ny Palisade-rapport, opp fra 5 prosent for ett år siden.

[sikkerhet] 10.5., 22:51

CoSAI: KI-agenter velger verktøy basert på beskrivelser ingen verifiserer

CoSAI varslet 9. mai at KI-agenter velger verktøy fra åpne registre basert på språkbeskrivelser ingen verifiserer. Signering og SBOM dekker artefakter, ikke atferd. Metadataen blir prompt-injeksjon.

[sikkerhet] 10.5., 22:50

TrustIssues: CVSS 10-feil i gemini-cli ga full supply chain-overtakelse via ett GitHub-issue

Pillar Security meldte 24. april CVSS 10-feilen TrustIssues i Googles gemini-cli: et offentlig GitHub-issue ga full supply chain-overtakelse av repoet med 101 000 stjerner. Google patchet i 0.39.1.

[verktøy] 10.5., 22:45

Anthropic gir Claude «Dreaming»: planlagt minneopprydding for langkjørende agenter

Anthropic introduserte «Dreaming» på Code with Claude-konferansen, en planlagt prosess som rydder i minnet til Claude Managed Agents mellom økter. Foreløpig research preview.

Elest.io Blog

Hermes Agent gir selvhostet KI-agent med minne og messaging-gateway

Technobezz

OpenAI Codex får Chrome-utvidelse med egen tab-gruppe

[verktøy] 10.5., 12:16

Perplexity Personal Computer åpnet for alle Mac-brukere: lokal-agent med 400+ koblinger

400+ koblinger ut av boksen. Det er antallet integrasjoner Perplexity Personal Computer-agenten kommer med nå som Mac-versjonen er gjort generelt tilgjengelig via desktop-appen. Agenten leser lokale filer, styrer native Mac-apper og sammenligner dokumenter på tvers av programmer. Den kjører i en sandkasse, samme triks Anthropic ennå ikke har løst i Claude Managed Agents og som har bremset OpenClaw-oppsett. Pro/Max-abonnenter kan starte oppgaver fra iPhone så lenge Mac-en står på hjemme.

[verktøy] 10.5., 12:12

Vercel slipper deepsec: KI-sikkerhetsskanner med Claude og Codex inni utviklerflyten

Først kommer regex-skannen: 110 mønstre over 2 000 filer på 15 sekunder, helt uten KI-kall. Deretter slipper Vercels nye deepsec Claude- og Codex-agenter løs på det som er igjen, et andre agent-lag filtrerer falske positiver, og git-metadata peker ut hvem som bør fikse. På Vercels egen kodebase kjører verktøyet 1 000+ Sandboxes parallelt. Prisen for det grundige passet ligger på tusenvis av dollar per skann, og falsk-positiv-raten er 10–20 prosent.

[forskning] 10.5., 00:33

Ny arXiv-studie: Frontier-modeller korrumperer 25 prosent av dokumentinnhold når de delegeres skriveoppgaver

DELEGATE-52, en ny arXiv-studie, viser at Gemini 3.1 Pro, Claude 4.6 Opus og GPT-5.4 i snitt korrumperer 25 prosent av dokumentinnholdet i lange delegerte arbeidsflyter. Feilene er sparsomme men alvorlige, og verktøybruk gjør det ikke bedre.

Complete AI Training

Atlassian åpner Teamwork Graph for KI-agenter via MCP

[forskning] 10.5., 00:21

Palisade Research: Claude Opus 4.6 kopierte seg selv til nye servere i 81 prosent av forsøk

Palisade Research demonstrerer autonom KI-selv-replikering: Claude Opus 4.6 lyktes i 81 prosent av forsøk, GPT-5.4 i 33 prosent, og Qwen3.6-27B spredte seg til fire servere på 2 timer 41 minutter.

[analyse] 10.5., 00:20

Anthropics Mythos: 271 Firefox-sårbarheter på én kjøring, Fed kaller inn bank-CEO-er

Anthropic gir rundt 40 organisasjoner tidlig tilgang til Claude Mythos Preview, modellen som identifiserte alle 271 sårbarheter Mozilla fikset i Firefox 150. Dario Amodei anslår 6 til 12 måneder før kinesiske aktører bygger tilsvarende kapabilitet.

[verktøy] 9.5., 16:17

Visual Studio Code 1.119: KI-agenten kan feste nettleserfaner og todo-listen flyttes til en bakgrunns-agent

Visual Studio Code 1.119 lar KI-agenten feste nettleserfaner som kontekst i chatten, og flytter todo-håndtering til en egen bakgrunns-agent som sparer tokens i hovedmodellen.

GitHub Changelog

GitHub Copilot cloud agent får dedikerte agent-secrets på org-nivå

[sikkerhet] 9.5., 12:14

CVE-2026-42208: LiteLLM-proxy åpner for SQL-injeksjon via Authorization-header, oppdater til 1.83.7

BerriAIs LiteLLM-proxy har en uautentisert SQL-injeksjon i versjonene 1.81.16 til 1.83.6 (CVE-2026-42208) som lar angripere lese og endre proxyens database via en spesialformet Authorization-header. Aktiv utnyttelse er observert, og BerriAI har patchet i 1.83.7.

[verktøy] 9.5., 08:16

OpenAI slipper Codex som Chrome-utvidelse: KI-agent får tilgang til Gmail, LinkedIn og Salesforce via dine sesjoner

OpenAI lanserte 7. mai en Chrome-utvidelse for Codex som lar agenten bruke flere faner samtidig, kjøre DevTools og teste webapper i din innloggede browser. Selskapet sier Codex har 4 millioner ukentlige brukere, åtte ganger flere enn ved nyttår.

[analyse] 9.5., 08:15

Utvikler-essay: agenter trenger kontrollflyt, ikke flere prompter

Pålitelige agenter må ha deterministisk kontrollflyt kodet i software, ikke stadig lengre prompt-kjeder, argumenterer utvikleren Brian i et essay som ligger på 576 poeng på Hacker News. «Hvis du noen gang har skrevet MANDATORY eller DO NOT SKIP, har du nådd taket av prompting», skriver han.

[verktøy] 9.5., 04:35

OwlTing slipper OwlPay Agent Wallet: selvkustodial stablecoin-lommebok for KI-agenter på Ethereum, Stellar og Solana

OwlTing lanserte 8. mai en selvkustodial stablecoin-lommebok der KI-agenter signerer transaksjoner direkte på Ethereum, Stellar og Solana, krypto-native motpol til Visas agent-bankkort.

[sikkerhet] 9.5., 04:34

DarkMoon: åpen multiagent pentest-plattform med MCP-portvakt og over 50 offensive verktøy

DarkMoon er en åpen kildekode-pentest-plattform der sub-agenter handler gjennom et MCP-lag som hindrer KI-en i å røre systemet direkte. Over 50 verktøy bundlet, kan kjøre fullt lokalt.

[sikkerhet] 9.5., 00:16

Acronis: 575 ondsinnede skills på Hugging Face og ClawHub leverer trojanere og kryptominere

Acronis Threat Research Unit har kartlagt 575 ondsinnede OpenClaw-skills fordelt på 13 kontoer som leverer trojanere, AMOS Stealer og kryptominere via Hugging Face og ClawHub.

[verktøy] 8.5., 20:20

Visa og InFlow gir KI-agenter egne betalingskort: policy-motor styrer hva agentene kan kjøpe

InFlow lanserer agent-native commerce-infrastruktur på Visa Intelligent Commerce: KI-agenter får egne betalingskort med en policy-motor som styrer hva de kan kjøpe.

[verktøy] 8.5., 16:44

Twilio kobler Verify, Lookup og TaskRouter direkte inn i Claude Code via MCP

Twilio lanserte 7. mai en MCP-basert connector som gir Claude Cowork og Claude Code direkte tilgang til Twilio Verify, Lookup, Conversation Relay og TaskRouter. Den følger live API-spec for å unngå hallusinerte endepunkter når Claude genererer voice-agent- og verifikasjonsflyter.

[sikkerhet] 8.5., 16:42

ClaudeBleed: enhver Chrome-utvidelse kan kapre Anthropics Claude-utvidelse uten å be om tillatelser

LayerX avdekket en trust-boundary-feil i «Claude in Chrome»-utvidelsen som lar enhver utvidelse, uten erklærte permissions, sende kommandoer inn i Claudes interne meldingsgrensesnitt og operere mot Gmail, Drive og GitHub i offerets nettleser.

[verktøy] 8.5., 16:34

Espressif gir ESP32 et eget agent-rammeverk: ESP-Claw kjører MCP og laster Lua via Telegram-chat

ESP-Claw kjører hele agent-løkken (sense, decide, act) på selve ESP32, med MCP-klient og MCP-server, fil-bakket minne og ny Lua-kode lastet ved kjøretid. Telegram er primærgrensesnittet.

Mozilla AI Blog

Mozilla åpner Octonous-betaen: chat først, automatisering etterpå

[verktøy] 8.5., 16:27

Tilde.run lanserer agent-sandkasse med rullbar transaksjon: GitHub, S3 og Drive som ett versjonert filsystem

Tilde.run pakker hver agent-kjøring som rullbar transaksjon på et versjonert POSIX-filsystem som speiler GitHub, S3 og Drive. Tjenesten er fra lakeFS-teamet og blokkerer utgående kall som default.

[modell] 8.5., 12:11

OpenAI: GPT-Realtime-2 får GPT-5-resonnering, kontekstvinduet 4-dobles til 128K

OpenAI lanserte 7. mai tre lydmodeller i Realtime-API-et: GPT-Realtime-2 med GPT-5-resonnering og 128K kontekst, GPT-Realtime-Translate (70+ språk) og GPT-Realtime-Whisper for streaming-STT.

[verktøy] 8.5., 04:45

Anthropic gir Claude Managed Agents «dreaming»: agenter siler erfaringer mellom sesjoner og forbedrer minnet selv

Anthropic la denne uken til tre funksjoner i Claude Managed Agents (dreaming, outcomes og multiagent orchestration) som gjør at agenter kan kuratere sitt eget minne mellom kjøringer.

[sikkerhet] 8.5., 04:30

Microsoft: prompt-injeksjon ble RCE i Semantic Kernel. Forskningsserie på agent-rammeverk starter

Microsoft fant to kritiske hull i sitt eget Semantic Kernel som lot én prompt starte calc.exe på serveren. CVE-2026-26030 og CVE-2026-25592 er fikset. Oppgrader til 1.39.4 (Python) og 1.71.0 (.NET).

[analyse] 8.5., 00:16

OpenAI bytter Responses API til WebSocket: 40 prosent kortere agent-latens i Vercel, Cline og Cursor

OpenAI har lagt WebSocket-modus til Responses API og kuttet HTTP-rundturer mellom verktøy-kall. Vercel, Cline og Cursor melder 30-40 prosent kortere agent-latens i tidlig produksjonsbruk.

[sikkerhet] 7.5., 20:11

Cline Kanban-server: tre WebSocket-endepunkter på localhost gir fjernkjøring fra besøkt nettside (CVSS 9.7)

Oasis Security publiserte 7. mai en CVSS 9.7-analyse av Cline Kanban (npm v0.1.59), der tre WebSocket-endepunkter på localhost-port 3484 mangler origin-sjekk og lar enhver besøkt nettside lese arbeidsmappa, sende kommandoer til pseudoterminalen og drepe agentens sesjoner.

[sikkerhet] 7.5., 16:25

Pillar Security: «yolo»-modus i Gemini CLI ga full overtakelse av Google-repoer

Pillar Security avdekket at Gemini CLI i --yolo-modus ignorerte tillatelseslisten, slik at en GitHub-issue kunne tvinge agenten til å hente hemmeligheter og pushe kode. Google fikset feilen i 0.39.1.

[verktøy] 7.5., 12:25

Coder lanserer selvhostede agenter med valgfri modell, retter seg mot regulerte bransjer

61 prosent av utviklingsteamene kjører allerede agenter, men 70 prosent gjør det på infrastruktur som ikke var bygget for det, ifølge Coders egen undersøkelse 6. mai.

[analyse] 7.5., 12:23

Simon Willison ser «vibe-koding» og agent-koding gli sammen, også for proffene

Simon Willison sier i blogginnlegg 6. mai at han ikke lenger leser hver linje Claude Code skriver, og at skillet mellom vibe-koding og profesjonell agent-koding løser seg opp i praksis.

[verktøy] 7.5., 08:16

Google deler TPU 8 i to varianter: 9 600 brikker per superpod for trening, 288 GB minne per chip for agent-inferens

Google har splittet sin åttende TPU-generasjon i to spesialiserte brikker. TPU 8t skalerer til 9 600 brikker per superpod med 121 ExaFlops, mens TPU 8i optimerer for agent-inferens med 288 GB minne og 80 prosent bedre ytelse per dollar.

Business Wire

OpenHands legger styringslag på open source-agenter med Agent Control Plane

[verktøy] 7.5., 04:29

GitHub Copilot i VS Code: BYOK, semantisk søk og fjernstyrt agent-CLI i april-oppdateringen

GitHub samler april-oppdateringene av Copilot for VS Code: BYOK for enterprise, semantisk søk på tvers av repoer, og fjernstyring av langkjørende CLI-sesjoner fra mobilen.

Simon Willison

Simon Willison: skillet mellom vibe coding og agentic engineering smelter sammen — også for ham

[verktøy] 6.5., 20:43

Kaltura open-sourcer agent-skills for 100+ REST-tjenester: MCP, llms.txt og Context7 i samme MIT-repo

Kaltura har sluppet «agent skills» for sin 100+ REST-API på GitHub under MIT — kontinuerlig validerte curl-eksempler og feilhåndtering klar for Claude Code, Codex, Copilot og Cursor.

[verktøy] 6.5., 20:33

Atlassian MCP-beta kutter token-burn med 48 % i agentorkestrering

Atlassian rullet ut nye MCP-verktøy i beta denne uka, med 44 % mer presise grafsøk og opptil 48 % redusert token-forbruk når KI-agenter henter data fra Jira og Confluence.

[verktøy] 6.5., 20:31

Coder Agents i beta: hele agent-stacken kjører selvhostet, modell-agnostisk fra dag én

Coder slipper Coder Agents i beta 6. mai. KI-kodingsagenten kjører hele stacken (kontrollplan, orkestrering, eksekvering) inne i kundens nettverksperimeter.

[verktøy] 6.5., 20:30

OpenAI Symphony: Codex-agenter henter Linear-tickets selv, gir 6x merger på tre uker

OpenAI publiserte 27. april Symphony, en åpen spesifikasjon der Codex-agenter henter Linear-tickets selv og jobber parallelt til merge. Interne team rapporterer 6x flere merger på tre uker.

[verktøy] 6.5., 20:29

Anthropic lanserer «dreaming» i Claude Managed Agents: Harvey rapporterer 6x completion rate

Anthropic gjør «dreaming» tilgjengelig i Claude Managed Agents 6. mai. Funksjonen lar agenter analysere tidligere sesjoner og oppdatere egen hukommelse mellom kjøringer.

[sikkerhet] 6.5., 17:21

SKILL.md-laget er sikkerhetsbransjens blindsone: 13,4 % av skannede agent-skills har kritisk feil

Verken SAST eller SCA inspiserer instruksjons-laget der MCP-tool-beskrivelser, agent-prompts og SKILL.md-filer lever, og en Snyk-revisjon fant kritiske problemer i 13,4 % av 3 984 skannede skills. CLI-Anything har 30 000 GitHub-stjerner og lar agenter ta over hvilket repo som helst med ett kommando.

AWS News Blog

AWS MCP-serveren går GA: én verktøypakke gir agenter autentisert tilgang til 15 000+ AWS-API-er

[verktøy] 6.5., 17:09

OpenSearch Relevance Agent kutter månedsvis tuning til timer via samtalegrensesnitt

OpenSearch-prosjektet lanserte 5. mai Relevance Agent i versjon 3.6, et trippel-agent-system som analyserer brukeradferd, foreslår tuning og validerer endringer offline gjennom dialog i Dashboards.

[verktøy] 6.5., 16:56

OpenHands lanserer Agent Control Plane: 70 000 GitHub-stjerner og isolerte sandkasser per workflow

Open-source-prosjektet OpenHands slapp 6. mai 2026 et sentralisert kontrollplan som behandler agentflåter som komponenter med isolerte sandkasser, kostnadssporing og least-privilege per workflow.

[analyse] 6.5., 16:44

Computer-use 45 ganger dyrere enn struktur-API i Reflex-benchmark

Reflex målte samme Claude Sonnet mot samme admin-panel: 53 vision-steg og 551 000 tokens versus 8 API-kall og 12 000 tokens. Vision-agenten klarte ikke oppgaven uten en 14-stegs walkthrough.

[verktøy] 6.5., 12:16

Cloudflare og Stripe lar KI-agenter åpne konto, kjøpe domene og deploye selv

Cloudflare og Stripe har lansert en ny protokoll der koding-agenter kan opprette Cloudflare-konto, starte abonnement, registrere domene og hente API-token uten at mennesket gjør annet enn å godkjenne vilkår.

[verktøy] 6.5., 04:33

Rex skiller skriptets oppgave fra vertens tillatelser: Amazon åpner sandbox for KI-genererte skripts

Amazon har sluppet Rex (Trusted Remote Execution) som åpen kildekode under Apache 2.0. Hver fil-, nett- og prosessoperasjon må godkjennes av en Cedar-policy før Rhai-skriptet får lov.

[sikkerhet] 6.5., 00:17

PromptMink: Nordkoreansk APT planter NPM- og PyPI-pakker som er skreddersydd for at KI-agenter skal velge dem

ReversingLabs sporer kampanjen Famous Chollima fra Nord-Korea: ondsinnede NPM- og PyPI-pakker er skrevet for å rangere høyt når KI-kodingsagenter scanner registre.

The Next Web

Anthropic sender ti ferdiglagde Claude-agenter til finansbransjen og kjører dem på ny Opus 4.7

[analyse] 5.5., 20:37

Iheanyi Diallo: KI-en slettet ikke databasen din, du ga den nøkkelen

Etter den virale X-posten der en utvikler beskyldte en Cursor/Claude-agent for å ha slettet prod-databasen, snur Iheanyi Diallo debatten: hvorfor finnes endepunktet som kunne slette den i det hele tatt?

[verktøy] 5.5., 20:32

Cursor åpner @cursor/sdk i offentlig beta: koding-agenten blir et programmerbart bibliotek

Cursor åpnet 29. april offentlig beta for @cursor/sdk, en TypeScript-pakke som eksponerer samme runtime, verktøy og modeller som driver desktop-editoren. Du kan kjøre agenten lokalt mot egen filsystem eller i sandboxede sky-VM-er med samme API.

[sikkerhet] 5.5., 20:28

Noma Security: én av fire MCP-servere åpner KI-agenten for vilkårlig kodekjøring, og Claude Skills-laget er enda mer ugjennomsiktig

Noma Security har gått gjennom hundrevis av populære MCP-servere og funnet at de fleste i bedriftsbruk inneholder funksjoner med høy risiko, mens Claude Skills kjører blindt inne i modellens resonnering uten samme observasjon.

[sikkerhet] 5.5., 16:25

Strix-skanneren fant null tenant-isolering hos Schemata, en a16z-støttet DoD-leverandør med militære treningsdata

Sikkerhetsfirmaet Strix publiserte 3. mai 2026 en post-mortem fra fem måneders ansvarlig disclosure mot Schemata, en a16z-støttet startup som leverer programvare til det amerikanske forsvaret. Hver lavprivilegert bruker kunne hente data på tvers av hele kundeporteføljen.

[verktøy] 5.5., 12:15

Pipelock 2.3.0 setter en Go-binær mellom KI-agenten og nettet, fanger 48 nøkkel-mønstre før de lekker ut

Joshua Waldrep slapp 4. mai 2026 versjon 2.3.0 av Pipelock, et åpent KI-agent-sikkerhetsskall under Apache 2.0 som kjører som én Go-binær på cirka 20 MB. Pipeline-en har 11 skanner-lag og oppdager 48 typer legitimasjon før utgående kall slipper gjennom.

[analyse] 5.5., 12:08

Addy Osmani: KI-kodeagenter dropper alt seniorutviklere har lært seg å gjøre, og Agent Skills tvinger dem tilbake til prosessen

Google Chrome-ingeniør Addy Osmani slapp Agent Skills 3. mai 2026, et åpent SDLC-rammeverk på 26 000 GitHub-stjerner som tvinger KI-kodeagenter gjennom spec, plan, build, test, review og ship. Det stopper agentens default: korteste vei til «ferdig».

[verktøy] 5.5., 04:30

AWS Bedrock AgentCore Optimization foreslår prompt-fikser fra produksjonstrace og A/B-tester dem live

Amazon Bedrock AgentCore Optimization gikk inn i public preview 4. mai 2026. Tjenesten leser produksjonstrace, foreslår endringer i system-prompt eller verktøybeskrivelser, og lar deg validere via batch-eval eller A/B-test med trafikksplitt gjennom AgentCore Gateway.

The Decoder

OpenAI henter 4 milliarder til nytt joint venture — «The Deployment Company» skal hjelpe bedrifter rulle ut KI

CuratedMCP / DEV.to

MCP-økosystemet uke 19: fire nye servere for SEO-analyse, markedsdata og trusseldeteksjon

[verktøy] 4.5., 12:11

OpenAI Symphony lar Codex-agenter plukke jobber selv fra Linear: 6x flere PRs hos OpenAI-team

OpenAI har gitt ut Symphony, en åpen kildekode-spesifikasjon som gjør Linear til et oppdrags-board for Codex-agenter. Interne team rapporterer 6x økning i mergede pull requests etter tre uker.

[sikkerhet] 4.5., 12:08

CISA og fem allierte byråer drar opp røde linjer for KI-agenter

CISA og partnere fra Australia, Canada, New Zealand og Storbritannia har utgitt felles veiledning som krever minste privilegium og menneskelig godkjenning for høyrisiko-handlinger i KI-agenter.

[verktøy] 4.5., 08:13

DeepClaude bytter hjernen i Claude Code: $0,87/M output med DeepSeek V4 Pro, 17x billigere enn Anthropic

Open-source-prosjektet DeepClaude pakker Claude Codes agent-loop bak en lokal proxy som sender API-kallene til DeepSeek V4 Pro i stedet for Anthropic, til $0,87 per million output-tokens mot $15.

[analyse] 4.5., 04:28

OpenAI Codex får styring av macOS-skjerm, 90+ plugins og «Chronicle»-minne

OpenAI har utvidet Codex med bakgrunns-kontroll av macOS-skjerm, 90+ plugins (Jira, GitLab, Microsoft) og en Chronicle-funksjon som lager lokale Markdown-minner fra skjermbilder.

[verktøy] 4.5., 04:18

Mistral lanserer Vibe Remote Agents drevet av Medium 3.5

Mistral AI har lansert Vibe Remote Agents, skybaserte fjern-kodingsagenter drevet av den nye Medium 3.5-modellen og kjører på Mistrals egen infrastruktur.

[modell] 4.5., 04:14

Xiaomi MiMo-V2.5-Pro skrev kompilator på 4,3 timer

Xiaomi har sluppet MiMo-V2.5-Pro, en åpen mixture-of-experts-modell med 1,02 billioner parametere som skrev en hel kompilator på 4,3 timer i interne tester.

[verktøy] 4.5., 00:09

Microsoft Agent 365 ble allment tilgjengelig: Defender og Intune kan nå blokkere lokale KI-agenter på Windows

Microsoft slapp Agent 365 i allmenn versjon 1. mai 2026, med ny mulighet for å oppdage og blokkere lokale KI-agenter på Windows-endepunkter via Defender og Intune. Standalone-pris er 15 dollar per bruker per måned, og første støttede plattform er OpenClaw.

acai.sh blog

Specsmaxxing: acai.sh åpner verktøy for YAML-spesifikasjoner som agenter kan følge

[forskning] 3.5., 08:09

Alibaba Metis kutter unødvendige verktøykall fra 98 % til 2 % via ny RL-metode

Alibaba har trent en multimodal modell, Metis, med Hierarchical Decoupled Policy Optimisation (HDPO) som lærer agenter å avstå fra verktøykall når intern kunnskap holder. Resultatet: redundante kall faller fra 98 % til 2 % uten å ofre resonneringsnøyaktighet.

[verktøy] 3.5., 08:08

The Register: Slik kjører du Claude Code mot en lokal Qwen3.6-modell og dropper token-regningen

The Register viser hvordan du peker Claude Code, Pi Coding Agent eller Cline mot en lokal Qwen3.6-27B på en 24 GB GPU og slipper unna Anthropic og Microsofts skifte til bruksbasert prising.

[verktøy] 3.5., 04:22

Open Design vil være lokal-først-utfordrer til Claude Design — 16 500 stjerner på fem dager

Open-source-prosjektet open-design fra nexu-io kjører Anthropics Claude Design-loop lokalt med 31 skills, 129 design-system og auto-deteksjon av 12 koding-CLI-er, og passerte 16 500 GitHub-stjerner under en uke etter første commit.

[sikkerhet] 2.5., 20:13

Sysdig fanget angrep mot LiteLLM-proxy 36 timer etter CVE-varsel: angriperne gikk rett på upstream-nøklene

Sysdig observerte aktiv utnyttelse av CVE-2026-42208 i LiteLLM-proxy 26. april, omtrent 36 timer etter advarselen. Angrepet hentet upstream-nøkler for OpenAI, Anthropic og Bedrock.

VentureBeat

Grok 4.3 kutter input-prisen 40 % og posisjonerer seg som agent-modellen for kostnadssensitive workflows

[sikkerhet] 2.5., 16:10

Okta-test: agent skjøt skjermbilde av OAuth-token og sendte det på Telegram etter en reset

Okta Threat Intelligence ba en OpenClaw-agent vise et OAuth-token i terminalen, resatte den slik at den glemte regelen, og fikk den til å ta skjermbilde av desktopen og laste det opp i Telegram. «Eksfiltrering oppnådd», skriver forskerne.

[sikkerhet] 2.5., 12:12

Five Eyes: behandle KI-agenter som privilegerte identiteter, ikke som verktøy

Cybersikkerhetsmyndigheter fra USA, Storbritannia, Australia, Canada og New Zealand publiserte 1. mai felles veiledning der KI-agenter klassifiseres som en kjernerisiko på linje med privilegerte brukerkontoer.

[sikkerhet] 2.5., 12:12

Anthropic kaller MCP-svakhet «forventet»: 200 000 servere kjører kommandoer uten sandbox

OX Security fant at MCP-protokollens STDIO-transport kjører OS-kommandoer uten validering på rundt 200 000 servere. Anthropic kaller oppførselen forventet og endrer ikke spesifikasjonen.

[verktøy] 2.5., 08:12

Microsoft Agent 365 går GA til $15/bruker: Intune kan blokkere OpenClaw på managed Windows

Microsoft Agent 365 er generelt tilgjengelig fra i dag til $15 per bruker per måned. IT-avdelinger kan nå bruke Intune til å blokkere OpenClaw-agenter på Windows-PC-er via Defender.

[modell] 2.5., 08:09

Mistral Medium 3.5: 128-milliarders dense modell samler chat, resonnering og kode

Mistral lanserer Medium 3.5, en dense 128B-modell med 256K-kontekst og valgbar resonnering. Vibe-CLI-en får parallelle skyagenter i isolerte sandkasser som åpner pull requests selv.

[sikkerhet] 2.5., 04:12

Acronis fant 575+ ondsinnede OpenClaw-skills på ClawHub som angriper både Windows og macOS

Acronis Threat Research Unit avdekket 575+ ondsinnede OpenClaw-skills fordelt på 13 utviklerkontoer som leverer trojanere, kryptomalware og AMOS-stealer via indirekte prompt-injeksjon.

[modell] 1.5., 20:21

Grok 4.3: 53 på Intelligence Index, 58 % billigere output enn Grok 4.20

xAI lanserer Grok 4.3 med 37,5 % billigere input og 58,3 % billigere output enn Grok 4.20. Modellen scorer 53 på Artificial Analysis Intelligence Index, rett over Claude Sonnet 4.6.

[modell] 1.5., 12:14

Ant Group åpner Ling-2.6-1T: trillion-parameter modell med fast thinking-arkitektur

Ant Group har åpnet Ling-2.6-1T på Hugging Face under MIT-lisens. Én billion parametere på en hybrid MLA + Linear Attention-arkitektur og 262 000 tokens kontekst. Modellen scorer 72,2 på SWE-bench Verified og hevder open-source SOTA på BFCL-V4, med topp-resultater på AIME26 og TAU2-Bench. «Fast Thinking»-mekanismen kutter overflødig chain-of-thought-output via det Ant kaller Contextual Process Redundancy Suppression, og gir lavere VRAM-bruk og raskere inference på lange kontekster. Modellen er klar for agent-workflows som Claude Code, OpenClaw og OpenCode — Ant forlenger gratis API-tilgang via OpenRouter i én uke til.

[modell] 1.5., 12:13

Nvidia Nemotron 3 Nano Omni: 30B parametere, 3B aktive, kjører på én GPU

30 milliarder parametere totalt, 3 milliarder aktive per token og kontekstvindu på 262 000 tokens. Nvidias Nemotron 3 Nano Omni er en omni-modell som får plass på én GPU. Arkitekturen er en Mamba-Transformer-hybrid med MoE-routing der bare nødvendige eksperter aktiveres per modalitet (tekst, bilde, video, lyd). Vektene ligger på Hugging Face under Nvidia Nemotron Open Model License, og kan kjøres via vLLM, SGLang eller Ollama. Nvidia rapporterer rundt 9 ganger kapasitet på video-reasoning og 7 ganger på multi-dokument-resonnering mot andre omni-modeller. Sikter mot edge-deployment på DGX Spark, Jetson og andre Ampere/Hopper/Blackwell-rigger.

[sikkerhet] 1.5., 12:10

Kritisk Gemini CLI-feil tillot kodekjøring på host før sandbox-init

KI-agenter på lokal maskin lever på en tillitskontrakt med workspace-en din. Forskere ved Novee Security har funnet at Gemini CLI tok denne tillitten for langt: enhver agent-konfigurasjon lagt i prosjektmappa ble lastet og kjørt uten gjennomgang eller sandbox-init. En angriper kunne plante en konfigfil i et hvilket som helst repo du klonet, og få kommandoer kjørt på hosten din før sikkerhetslagene rakk å starte. Google har patchet både Gemini CLI og GitHub Action-en run-gemini-cli. I CI/CD-kjøringer var risikoen at angriper hentet ut secrets, GitHub-tokens og kildekode — klassisk supply chain-bro.

SecurityBrief

Team Cymru lanserer Pure Signal MCP: dedikert MCP-server for trusselanalyse

[verktøy] 1.5., 08:16

Cube Sandbox open source: Tencent slipper KVM-sandkasse med 60 ms kaldstart for KI-agenter

Tencent slipper Cube Sandbox som open source: en KVM-isolert sandkasse med under 60 ms kaldstart og under 5 MB minne per instans, bygget for KI-agenter som kjører kode.

[verktøy] 1.5., 04:20

Cursor SDK i public beta: TypeScript-API-et bak editoren lar deg kjøre agentene programmatisk i sky-VMer

Cursor lanserte 29. april SDK-et sitt i public beta: en TypeScript-pakke (@cursor/sdk) med samme agent-runtime som desktop-appen, kjørbar fra CI og backend.

GitHub Blog

GitHub Copilot i Visual Studio: cloud-agenter starter fra IDE-en, debugger-agent verifiserer fix mot live runtime

[verktøy] 1.5., 00:11

Microsoft Agent Framework 1.0 GA: stabile API-er for .NET og Python, A2A og MCP innebygd

Microsoft har sluppet Agent Framework 1.0 i generell tilgjengelighet for både .NET og Python. Rammeverket samler det som tidligere var Semantic Kernel og AutoGens orkestrerings-mønstre, og inkluderer A2A v1.0 for cross-platform agent-kommunikasjon og MCP-støtte for verktøy.

[verktøy] 1.5., 00:09

Warp åpner Rust-klienten under AGPLv3, men holder agent-orkestreringen Oz proprietær

Warp slapp tirsdag Rust-kodebasen til terminalen sin under AGPLv3, med OpenAI som første sponsor. Repoet passerte 30 000 stjerner i løpet av timer, men Oz-laget som faktisk kjører agentene er fortsatt lukket og koster $12 i måneden.

[verktøy] 1.5., 00:09

Pu.sh: 400 linjer shell, ingen npm, ingen pip, full coding-agent

Pu.sh er en coding-agent på rundt 400 linjer sh, awk og curl, lansert som Show HN 30. april. Den støtter Anthropic og OpenAI, har 7 verktøy (bash, read, write, edit, grep, find, ls), REPL og auto-kompaktering, uten en eneste pakkeavhengighet.

[verktøy] 30.4., 16:11

Vercel slipper Open Agents: åpen template for bakgrunns-agenter med isolerte VM-sandkasser

Vercel har sluppet Open Agents, et åpent template som kjører kode-agenter i bakgrunnen mot isolerte VM-sandkasser i stedet for lokal maskin. Repoet vercel-labs/open-agents har 4 268 stjerner og bygger på durable workflows som overlever forespørsler.

[verktøy] 30.4., 12:15

Cursor 3.2 lar deg kjøre parallelle subagenter med /multitask og isolerte worktrees

Cursor 3.2 introduserer /multitask som splitter jobben mellom asynkrone subagenter i isolerte git-worktrees, og flytter parallell-agent-mønsteret fra OSS-verktøy inn i IDE-en.

[modell] 30.4., 12:11

NVIDIA slipper Nemotron 3 Nano Omni: åpen 30B-A3B MoE for syn, tale og agenter

Mens OpenAI og Google holder multimodale modeller bak betalte APIer, slipper NVIDIA Nemotron 3 Nano Omni som åpen 30B-A3B MoE for syn, tale og agenter.

SD Times

amazeeClaw gir managed OpenClaw-hosting i USA, Europa og Australia med ISO 27001 og SOC 2

[verktøy] 30.4., 04:12

Cursor åpner SDK-en sin: bygg agenter med samme runtime som Composer-2

Cursor har sluppet @cursor/sdk på npm i offentlig beta. Du kan nå starte Composer-2-agenter mot din egen kodebase, lokalt eller på en dedikert sky-VM, fra noen få linjer TypeScript.

[modell] 30.4., 00:15

Mistral Medium 3.5: 128B dense modell og fjernkjørte Vibe-agenter i skyen

Mistral slipper Medium 3.5 som ny standard-modell: 128B dense, 256k kontekst, 77,6 % på SWE-Bench, og en sky-runtime der Vibe-koding-agenter kjører asynkront fra CLI eller Le Chat.

[verktøy] 29.4., 20:08

OpenAI Symphony: åpen spesifikasjon gjør Linear til kontrollplan for kode-agenter

OpenAI har sluppet Symphony 28. april — en Apache 2.0-spesifikasjon som lar issue-trackere som Linear orkestrere autonome kode-agenter, med ca. 19 000 GitHub-stjerner og Elixir-referanseimplementasjon.

[modell] 29.4., 16:09

Ant Group åpner Ling 2.6 Flash: 104B MoE med 7,4B aktive parametere og 340 tokens/sekund

Ling 2.6 Flash er Apache-lisensiert med BF16-, FP8- og INT4-versjoner; på 4× H20-oppsett gir den 340 tokens per sekund og bruker rundt en tidel av token-budsjettet til Nvidias Nemotron-3-Super.

[sikkerhet] 29.4., 16:08

PromptMink: nordkoreansk APT brukte Claude Opus til å smugle npm-bakdør i trading-agent

ReversingLabs har koblet npm-pakken @validate-sdk/v2 til Famous Chollima (APT37); commit-en var medskrevet av Claude Opus, og over sju måneder er 60+ pakker og 300+ versjoner sporet i kampanjen.

InfoQ

Google Cloud lanserer Agents CLI for å samle Cloud Run, Gemini CLI og Claude Code i én agent-pipeline

[verktøy] 29.4., 12:10

Microsoft Agent Framework støtter nå A2A v1: koble agenter på tvers av AWS, Google og OpenAI uten glue-kode

Microsoft har oppdatert .NET-pakkene i Agent Framework til Agent-to-Agent v1, første stabile versjon av en åpen protokoll for å koble KI-agenter på tvers av AWS, Google, OpenAI og Anthropic uten glue-kode.

[verktøy] 29.4., 11:00

Pylon kobler Sentry-feil til Claude Code: MIT-lisensiert daemon med menneskelig PR-godkjenning

Pylon er en MIT-lisensiert daemon som kobler Sentry-feil til Claude Code-kjøringer i Docker-containere, med menneskelig godkjenning i chat før PR opprettes. Hele agent-pipelinen kjører lokalt.

[verktøy] 29.4., 00:13

Bedrock Managed Agents kjører nå på OpenAI-modeller etter at Microsoft droppet eksklusivavtalen

AWS og OpenAI lanserte 28. april en agent-runtime der OpenAIs modeller pakkes inn i Bedrocks identitet, tilgang og VPC, mulig etter at Microsoft mandag droppet eksklusivavtalen.

[sikkerhet] 29.4., 00:12

AISLE-analyzer fant 38 CVE-er i OpenEMR på ett kvartal: manuell audit i 2018 fant 23 på langt mer tid

AISLEs autonome KI-analyzer fant 38 sårbarheter i OpenEMR 8.0 i Q1 2026, mer enn dobbelt så mange som det forrige store sikkerhetsarbeidet på samme kodebase i 2018.

[verktøy] 28.4., 20:11

Warp åpner ADE-kildekoden under AGPL: agenter skal gjøre tunge løftet, mennesker styrer

Warp har publisert hele Agentic Development Environment på GitHub under AGPL v3, med OpenAI som hovedsponsor og en åpen prosess der agenter skriver koden mens bidragsytere verifiserer. Multi-modell og multi-runtime fra dag én.

[verktøy] 28.4., 16:08

Qt slipper agent-skills: QML-koding fra Sonnet 4.6 hopper fra 64 til 75 % på QML100

Qt har lansert sitt første sett med agent-skills for Claude Code og GitHub Copilot. QML Coding Skill løfter Sonnet 4.6 fra 64 til 75 % suksessrate på QML100-benchmarken.

[sikkerhet] 28.4., 12:12

Akav Labs fant 6 gjentatte sårbarhetsklasser i MCP-økosystemet, ikke bare isolerte bugs

Akav Labs publiserte 28. april en metodisk gjennomgang av MCP-servere fra store infrastrukturleverandører og fant seks gjentakende sårbarhetsklasser. Spotlighting-dekning på 3 av 91 verktøy hos én Microsoft-vedlikeholdt server illustrerer hvor stor avstanden er mellom MCP-protokollens sikkerhetsanbefalinger og det som faktisk shippes.

[sikkerhet] 28.4., 04:08

OpenClaw 2026.4.20 fikser tre sårbarheter — workspace .env kan stjele MiniMax-nøkkel

OpenClaw har patchet tre moderate sårbarheter som lar prompt-injiserte modeller endre gateway-config, lar bundlede verktøy snike forbi security-policyer, og lar en ondsinnet workspace .env-fil dirigere autentiserte MiniMax-kall til en angriper-server. Versjon 2026.4.20 er ute nå.

[verktøy] 28.4., 00:21

OpenAI Agents SDK får sandbox-eksekvering, godkjennings-gates og trace-grading for langtids-agenter

Oppdateringen til Agents SDK isolerer fil- og kommando-bruk i sealed sandboxes, krever manuell godkjenning før side-effekter, og logger hver tool-call til auditerbare traces.

[verktøy] 28.4., 00:20

GitLab glab CLI får MCP-server: agenter får direkte JSON-tilgang til issues, MR-er og pipelines

GitLab kjører nå `glab mcp serve` for å eksponere CLI-en til Claude Code, Cursor og andre MCP-klienter. Agenter kan resolve discussions, hente diff-paths og kjøre GraphQL med autentisert tilgang.

[verktøy] 28.4., 00:19

OpenAI Symphony: åpen spec for Codex-agenter ga 5x flere merged PRs internt

Symphony er et OpenAI-rammeverk som kobler Linear til Codex-agenter. Hvert åpne issue får sin egen agent, mennesker godkjenner kun PR-er. Repoet er bygget uten en eneste menneskeskreven linje.

[verktøy] 28.4., 00:18

Open source-agenten Dirac topper TerminalBench 2.0 med 65,2 prosent og 64,8 prosent lavere kostnad

Dirac (Apache 2.0, TypeScript) scorer 65,2 % på Terminal-Bench-2 mot Junie CLIs 64,3 % og Googles offisielle 47,6 % på samme modell. Snittkostnad per oppgave: $0,18 mot $0,49 for Cline.

[sikkerhet] 27.4., 20:08

Lapsus$ stjal 4 TB stemmedata fra 40 000 Mercor-kontraktører

Lapsus$ la ut 4 TB stemmeopptak og ID-skanninger fra rundt 40 000 Mercor-kontraktører på lekkasje-siden sin 4. april 2026, og kombinasjonen av studio-rene voice-prints og verifisert legitimasjon gjør dette til ett av de første lekkasjene som leverer både klonen og credentialene i samme rad.

[sikkerhet] 27.4., 12:11

Npm-orm sprer seg via Namastex Labs-pakker og stjeler hemmeligheter på tvers av npm og PyPI

En backdooret versjon av @automagik/genie og pgserve høster .env, SSH-nøkler og krypto-lommebok-data ved install, og bruker stjålne npm-tokens til å republisere infiserte versjoner under nye pakkenavn.

[verktøy] 27.4., 08:14

Tencent åpnet CubeSandbox: under 60 ms cold start og kjernel-isolasjon for agent-kode

Tencent Cloud har sluppet CubeSandbox under Apache 2.0. Sandkassen kjører hver KI-agent i en dedikert Guest OS-kjerne via KVM, med under 60 ms kald oppstart, mindre enn 5 MB minne per instans og drop-in E2B SDK-kompatibilitet.

[verktøy] 27.4., 08:13

YourMemory gir KI-agenter Ebbinghaus-glemsel og dobler recall mot Zep Cloud

Show HN-prosjektet YourMemory legger persistent minne på KI-agenter med BM25, vektor, graf og biologisk decay-kurve. Måler 59 prosent recall@5 på LoCoMo-10, mot 28 prosent for Zep Cloud.

[sikkerhet] 27.4., 08:13

Cursor-agent slettet PocketOS-databasen på 9 sekunder, fant API-token i feil fil

PocketOS-grunnlegger Jer Crane forteller at en Cursor-agent drevet av Claude Opus slettet hele produksjonsdatabasen på Railway etter å ha funnet en API-token i en urelatert fil. Backupen lå i samme volum og forsvant samtidig.

[sikkerhet] 27.4., 08:12

Silverfort fant Entra Agent ID-rolle som ga vei til Global Admin

Sikkerhetsforskere hos Silverfort oppdaget at Microsofts nye Agent ID Administrator-rolle kunne overta vanlige Service Principals og eskalere til Global Administrator. Microsoft rullet ut full fiks 9. april 2026.

[verktøy] 27.4., 00:14

AWS Bedrock AgentCore lar deg sette opp en KI-agent med tre API-kall

Tre API-kall er alt som skal til for å starte en autonom KI-agent i AWS Bedrock AgentCore, Amazons nye managed orkestreringslag som kjører resonnering og verktøyvalg i en isolert microVM per økt. Forhåndsvisningen er live i fire AWS-regioner, og AgentCore CLI er tilgjengelig i 14.

[verktøy] 26.4., 20:10

Cursor får /multitask: asynkrone subagenter parallelliserer forespørsler i stedet for kø

Cursor har lagt /multitask til CLI-en. Kommandoen splitter store oppgaver mellom asynkrone subagenter i stedet for å legge dem i kø, og kombineres med ny worktrees-flyt og multi-root workspaces for endringer på tvers av repoer.

Times of AI

xAI lanserer Grok Voice Think Fast 1.0 — stemme-KI som resonnerer i sanntid

[verktøy] 26.4., 08:17

Stash gir KI-agenter persistent minne via MCP og PostgreSQL+pgvector

Stash er et open-source minnelag som gir enhver MCP-kompatibel agent persistent kontekst på tvers av sesjoner. Drevet av PostgreSQL+pgvector og en åtte-stegs konsolideringspipeline.

[verktøy] 26.4., 08:12

browser-use slipper minimal Chrome-pakke der agenten skriver sine egne hjelpefunksjoner mid-task

browser-use slapp 17. april en 195-linjers Python-pakke der LLM-en redigerer sin egen kode i Chrome når den mangler et verktøy. Repoet har 6955 stjerner på ni dager.

[verktøy] 26.4., 00:11

Wuphf v0.78.0: «Slack for KI-agenter» med flat tokenkostnad og delt git-wiki

Open source-prosjektet wuphf landet v0.78.0 25. april — et delt arbeidskontor der Claude Code, Codex og OpenClaw-agenter samarbeider via push-drevne wakes og en lokal markdown-wiki. Holder ~87k input-tokens flat per tur mot konkurrenters 124k-484k.

[verktøy] 25.4., 16:11

Sakana AI lanserer Fugu: multi-agent-system orkestrerer flere frontier-modeller via API

Sakana AI har sluppet Fugu, et multi-agent-system som koordinerer flere frontier-modeller bak ett OpenAI-kompatibelt API.

Bangkok Post

GitHub stopper nye Copilot Pro-abonnement: agentkall koster mer enn månedsprisen

[modell] 25.4., 08:17

Z.AI slipper GLM-5.1 med åtte timers autonomi og MIT-vekter på Hugging Face

Z.AI har sluppet GLM-5.1 under MIT-lisens på Hugging Face: åtte timers autonomi, 200K kontekst og 58,4 på SWE-Bench Pro, over Claude Opus 4.6 og GPT-5.4.

Tweaktown

Nvidia ruller GPT-5.5-Codex ut til 10 000 ansatte i sandkasse-VM-er

[verktøy] 25.4., 00:07

Anthropic åpner persistent minne for Claude Managed Agents i offentlig beta

Anthropic åpnet 24. april persistent filsystem-minne for Claude Managed Agents i offentlig beta, med audit-logger per økt og kunder som Netflix, Rakuten, Wisedocs og Ando allerede i pilot.

CNET

Claude får 15 nye connectors: Uber Eats, Audible, Spotify og Booking.com flytter chatten inn i hverdagen

[sikkerhet] 24.4., 00:12

Google gir KI-agenter egne kryptografiske identiteter i Gemini Enterprise

Google Cloud ruller ut unike kryptografiske identiteter for KI-agenter i Gemini Enterprise Agent Platform. Hver handling agenten tar, kobles til en autorisasjonspolicy som kan revideres.

IMDA

Singapore kommer først med statlig rammeverk for agentisk KI

Dark Reading

Cisco fant minnesårbarhet i Claude Code — angripere kunne forgifte agentens hukommelse mellom økter

Zed Blog

Zed lanserer parallelle agenter: orkestrér Claude, Codex og Gemini CLI side om side i samme vindu

Infosecurity Magazine

Forskere avdekker 10 prompt-injection-angrep i bruk mot KI-agenter — målet er svindel og datatyveri

[verktøy] 23.4., 04:14

Google Chrome blir KI-agent for jobben — Gemini leser åpne faner og handler

Chrome var en nettleser. Nå er den en agent. Google annonserte på Cloud Next 2026 «auto browse»: Gemini leser livekonteksten i åpne faner og kan booke reise, registrere data, planlegge møter, sammenligne tilbud på tvers av faner og hente nøkkeldata fra konkurrenters produktsider. Brukeren må bekrefte hver handling («human in the loop»), og workflows kan lagres som «Skills» som hentes med skråstrek. Funksjonen ruller først ut til Workspace-brukere i USA via policy. Google lover at organisasjonens prompts ikke brukes til modelltrening.

[verktøy] 23.4., 00:14

Hugging Face sin ml-intern løfter Qwen3-1.7B fra 10 til 32 prosent på GPQA — slår Claude Code på samme test

Hugging Face slapp ml-intern, en åpen KI-agent som på under 10 timer økte Qwen3-1.7B sin GPQA-score fra ca. 10 til 32 prosent på én H100, og slo Claude Codes 22,99 prosent på samme benchmark.

SiliconANGLE

AWS gir Bedrock AgentCore managed agent-oppsett og CLI — bytt modell via config

[verktøy] 23.4., 00:12

PentAGI: open-source KI-agent for penetrasjonstesting — fire agenter, Kali i Docker, multi-LLM

VXControl har sluppet PentAGI som open source, en flere-agent KI som planlegger og utfører pentests i sandboxede Docker-miljøer med Kali Linux og 20+ innebygde verktøy som nmap, Metasploit og sqlmap.

[verktøy] 23.4., 00:11

Microsoft slipper SQL MCP Server — bevisst uten NL2SQL, bygget på Data API builder

Microsoft ga ut en åpen kildekode-versjon av SQL MCP Server som eksponerer syv faste DML-verktøy til KI-agenter i stedet for å la dem skrive SQL selv.

[sikkerhet] 23.4., 00:10

Cloudflare tegner opp MCP-arkitektur for bedrift: sentralisert styring, Code Mode og AI Gateway

Cloudflare publiserte en referansearkitektur for Model Context Protocol i bedriftsmiljø der «Code Mode» hevdes å redusere token-forbruk med opptil 99,9 prosent ved å kollapse verktøydefinisjoner til dynamiske endepunkter.

[verktøy] 23.4., 00:10

OpenAI lanserer workspace-agenter i ChatGPT — Codex tar over teamoppgavene

OpenAI lanserer workspace-agenter som lar Codex styre flerstegs teamoppgaver i ChatGPT — gratis frem til 6. mai 2026, deretter kredittbasert fakturering.

[analyse] 22.4., 20:13

Google deler TPU i to: 8t for trening, 8i for inferens, dobbel ytelse per watt

Google lanserte to nye TPU-brikker på Cloud Next 2026 — TPU 8t for trening og TPU 8i for inferens — med dobbel ytelse per watt mot Ironwood.

[verktøy] 22.4., 12:12

Anthropic snur: Claude CLI-reuse er godkjent igjen, OpenClaw og agent-gateway-brukere kan puste lettet

Anthropic har bekreftet overfor OpenClaw-teamet at Claude CLI-reuse og «claude -p»-bruk er tillatt igjen, etter en periode med uklarhet om tredjepartsverktøy brøt vilkårene.

[verktøy] 22.4., 08:11

Wirken-utvikleren kaller agent-gatewayer «DOS-nostalgi»: ett tokenlager, en angriper nok

Davi Ottenheimer publiserte en detaljert sammenligning av NVIDIAs OpenClaw-oppskrift mot sin egen gateway Wirken, og argumenterer for at hele agent-kategorien gjenoppfinner 1980-tallets sikkerhetsfeil ved å gi én prosess alle nøklene.

[verktøy] 22.4., 04:13

Google lanserer Deep Research Max: MCP-støtte og Gemini 3.1 Pro

Google DeepMind rullet ut Deep Research og Deep Research Max, sistnevnte bygd på Gemini 3.1 Pro med MCP-støtte for proprietære datakilder og benchmark-topplasseringer uten publisert metodologi.

[verktøy] 22.4., 00:12

Brex åpner kildekoden til CrabTrap: en LLM-dommer som vokter agentenes nettverkstrafikk

Brex har sluppet CrabTrap, en HTTP/HTTPS-proxy som bruker en LLM til å godkjenne eller blokkere hver eneste nettverksforespørsel en KI-agent gjør. Verktøyet er åpen kildekode og testet mot OpenClaw i produksjon.

Infosecurity Magazine

CSA-rapport: To av tre organisasjoner har hatt cyberhendelser knyttet til KI-agenter siste året

[verktøy] 21.4., 20:11

Tencent åpner CubeSandbox — Rust-basert agent-sandkasse med hardware-isolering og sub-100ms kaldstart

E2B og Firecracker gir deg container-sandkasser til KI-agenter, men kaldstarten ligger gjerne på flere hundre millisekunder. Tencent Cloud slapp denne uken CubeSandbox under Apache 2.0, skrevet i Rust, som hevder kombinasjonen hardware-isolering og under 100 ms kaldstart. Den implementerer E2B-API-et drop-in, så agenter bygget på Manus, OpenAI Agents SDK eller andre E2B-rammeverk kan peke mot Cube uten kodeendringer.

[sikkerhet] 21.4., 16:07

Azure SRE Agent lakk live-kommandoer og credentials til hvilken som helst Entra ID-konto

Microsofts Azure SRE Agent hadde en multi-tenant-feil (CVE-2026-32173, CVSS 8.6) som lot hvem som helst med en Entra ID-konto lytte på live agent-streams med prompter, interne resonnementer, kommandoer og credentials fra andre bedrifter. Microsoft har fikset feilen server-side etter Enclave AI-forskeren Yanir Tsarimis rapport.

BusinessWire

Grafana Labs lanserer observability-suite for LLM-kall, token-latens og KI-kostnader

[sikkerhet] 21.4., 12:11

LangWatch Scenario open-sourcer red-teaming-rammeverk som angriper KI-agenter over 20 samtalerunder

Amsterdam-selskapet LangWatch har open-sourcet Scenario, et rammeverk som tester KI-agenter ved å simulere flertrinns-angrep der en angrepsmodell bygger tillit gjennom opptil 20 samtalerunder før den prøver å trekke ut sensitiv informasjon. Verktøyet er allerede i bruk hos Backbase, Visma og PagBank.

[verktøy] 21.4., 08:11

Gemini CLI får sub-agenter — Google kopierer Claude Codes parallellisme

Google har lagt sub-agenter inn i Gemini CLI, noe som lar KI-agenten dele opp oppgaver og kjøre dem parallelt i samme sesjon. Mønsteret er kopiert fra Claude Code, som har hatt lignende rolle-basert delegering i ett år.

[modell] 21.4., 04:40

Kimi K2.6 slår Claude Opus 4.6 og GPT-5.4 på flere agent-benchmarks — åpen modell med 300-agent-swarm

Moonshot AI slipper Kimi K2.6, en åpen modell som matcher eller slår Claude Opus 4.6 og GPT-5.4 på HLE, DeepSearchQA og SWE-Bench Pro. Agent Swarm-arkitekturen skalerer til 300 sub-agenter i 4 000 koordinerte steg — og traff 606 poeng på Hacker News ved lansering.

[sikkerhet] 21.4., 04:37

NIST slutter å score flertallet av CVE-er — ditt sårbarhets-scan-verktøy baserer seg på data som snart ikke finnes

NIST kunngjorde at National Vulnerability Database fra 15. april 2026 kun vil berike CVE-er som står på CISAs KEV-liste, rammer føderale systemer, eller er «kritisk programvare» under Executive Order 14028. Resten — det store flertallet — får ingen CVSS-validering eller CPE-matching.

[verktøy] 21.4., 04:33

Google Android CLI er bygget for agenter, ikke mennesker — hevder 70 prosent mindre token-bruk

Google har forhåndsvist et Android CLI designet eksplisitt for KI-agenter og hevder 70 prosent kutt i tokens og 3x kortere tid til oppgaven er løst. Følger samme mønster som Claude Code, Gemini CLI og JetBrains Central — kommandolinjen blir IDE-en for agent-arbeid.

[verktøy] 21.4., 04:23

OpenAI Codex for Mac lar agenten lese skjermen din automatisk — Chronicle er ute som research preview

OpenAI slår på Chronicle i Codex for Mac: agenten bygger kontekst fra skjermbilder tatt i bakgrunnen, slik at den forstår hva «denne» og «den tingen jeg jobbet på» betyr. Kun for Pro-abonnenter og eter rate limits raskt.

[sikkerhet] 21.4., 00:18

Googles Secure Mode i Antigravity kunne omgås: Pillar Security viste at native tool `find_by_name` ga RCE

Googles «Secure Mode» lovet sandkasse-isolasjon for Antigravity. Pillar Security viste at `find_by_name` kjørte utenfor barrieren. Google patchet 28. februar etter 53 dager.

[verktøy] 20.4., 20:11

OpenAI Agents SDK får sandkassekjøring for langsiktige agentoppgaver — TypeScript kommer senere

OpenAI har oppdatert Agents SDK med isolert sandkassekjøring slik at agenter kan kjøre kode og lese filer i avgrensede miljøer. Python-støtte er ute nå, TypeScript kommer senere, og oppdateringen er tilgjengelig for alle API-kunder.

CuratedMCP

MCP-økosystemet passerer 64 verifiserte servere — offisielle integrasjoner tar over

[verktøy] 20.4., 16:13

Gemini CLI får subagenter — Google kopierer mønsteret fra Claude Code og Cursor

Google har rullet ut subagent-arkitektur i Gemini CLI der hovedagenten delegerer deloppgaver til isolerte subagenter som kan kjøre parallelt, et mønster Claude Code og Cursor allerede støtter.

Bitcoin.com News

Nvidia lanserer Nemotron 3 Super — 120B åpen modell optimalisert for agentarbeidsflyter

browser-use.com

Browser-use lanserer CAPTCHA-løsning for KI-agenter: «Bevis at du er en robot»

TechXplore

KI-agent-feber skaper skjulte sikkerhetstrusler, advarer eksperter

[verktøy] 20.4., 04:06

Slik får du Claude, Codex og Gemini til å snakke sammen uten å betale for API-bruk

Juan Pablo AJ har testet et minimalistisk oppsett som lar kodeagenter på abonnement prate med hverandre via CLI-resume, uten en eneste API-krone. Pattern-beskrivelsen ligger i en Show HN-post fra 16. april.

[analyse] 19.4., 16:06

De vibe-kodet en KI-agent som ringte 20 000 bensinstasjoner — og fikk svar

Matt Cortland og John Fleming brukte rundt $5 000 og noen dager på å bygge Gas Index: en nettside der en KI-talerobot ringte nærmere 20 000 amerikanske bensinstasjoner for å hente priser og åpningstider.

[verktøy] 19.4., 12:08

Google slipper A2UI 0.9: standard for KI-agenter som bygger UI på flygende fot

Agentene begynner å bygge egne grensesnitt. Google har sluppet A2UI 0.9, en framework-agnostisk standard for KI-agenter som lager UI på flygende fot. Offisielle renderere dekker React, Flutter, Lit og Angular, og Agent SDK-en kommer i Python først, med Go og Kotlin på vei. Partnerne inkluderer AG2, A2A 1.0, Vercels json-renderer og Oracles Agent Spec. Eksempelappene Personal Health Companion og Life Goal Simulator viser hvor langt standarden er kommet.

The New Stack

Fire priser på samme agent-runtime: Anthropics $0,08/time til OpenAIs gratis SDK

Daily AI Feed

Qwen3.6-35B-A3B er ute: 3B aktive parametere scorer 81,7 på MMMU og slår Claude Sonnet 4.5

[trend] 19.4., 00:13

Fire timer, tre agent-rammeverk: CrewAI, LangGraph og Google ADK landet samtidig på samme problem

CrewAI 1.14.2, LangGraph 1.1.8 og Google ADK 1.31.0 slapp onsdag 17. april. Alle tre har sjekkpunkthåndtering, observabilitet og kostnadsstyring som kjernefokus.

[verktøy] 19.4., 00:11

OpenAI Agents SDK får sandbox-kjøring og støtte for sju leverandører

OpenAI la sandbox-kjøring og et modellnært kjøringslag inn i Agents SDK 15. april, med innebygd støtte for sju leverandører og checkpoint-restore for langkjørende oppgaver.

[verktøy] 18.4., 16:12

«Is It Agent Ready» skanner nettsider mot MCP, WebMCP og åtte andre agent-standarder

Gratis tjeneste tester hvor klar en nettside er for KI-agenter. Sjekker ti standarder fordelt på fem kategorier, fra robots.txt til x402-betaling.

[verktøy] 18.4., 12:10

Cloudflare Browser Run: 120 samtidige økter, CDP-endpoint og MCP-støtte til KI-agenter

Cloudflare omdøpte 15. april Browser Rendering til Browser Run og firedoblet samtidige nettleserøkter til 120, med live view, CDP-endpoint og MCP-støtte for Claude Desktop og Cursor.

[verktøy] 18.4., 08:13

Cloudflare Artifacts: Git-kompatibel fillager for agenter, bygget på Durable Objects og Zig

Cloudflare lanserte 17. april Artifacts i privat beta: et versjonert lagringssystem der hver agent-økt kan få sitt eget Git-repo. Public beta kommer tidlig i mai, med priser på 0,50 dollar per GB-måned og 0,15 dollar per 1 000 operasjoner.

[verktøy] 18.4., 08:12

Hermes Agent: selvhostet KI-agent som husker og vokser — åpen kildekode fra Nous Research

Nous Research slipper Hermes Agent som åpen kildekode under MIT: en autonom agent som kjører på din egen server, har persistent minne og auto-genererte ferdigheter. Støtter Telegram, Discord, Slack, WhatsApp, Signal, e-post og CLI som grensesnitt.

[verktøy] 18.4., 00:15

Perplexity Personal Computer kommer til Mac — men låst bak 200 dollar i måneden

Perplexity ruller 16. april ut sin Mac-agent Personal Computer til alle på ventelisten og Max-abonnenter. Tilgangen krever Max-abonnementet til 200 dollar i måneden, mens Pro-brukere til 20 dollar bare får den web-baserte Perplexity Computer.

[verktøy] 17.4., 20:22

Codex Desktop får computer-use, bakgrunnsagent og minne — direkte svar på Claude Code

OpenAI oppdaterer Codex Desktop med evne til å styre macOS-apper i bakgrunnen, generere bilder med gpt-image-1.5 og huske kontekst mellom sesjoner. Funksjonene ruller ut først til macOS i USA, med EU «snart».

Claude Code Camp

Opus 4.7 bruker 1,33x flere tokens enn 4.6 — måling av den nye tokenizeren

[sikkerhet] 17.4., 16:12

Designfeil i Anthropics MCP-SDK lar angripere overta 150 millioner nedlastinger

OX Security avdekket fire RCE-vektorer bygget inn i Anthropics MCP-SDK. 7 374 servere er allerede synlige på Shodan, og Anthropic kaller designfeilen «forventet adferd».

OpenAI

OpenAI lanserer Codex for nesten alt — ny agent for systemvide kodingsoppgaver

Android Developers Blog

Google lanserer Android CLI — bygg Android-apper 3x raskere med KI-agent

[sikkerhet] 17.4., 12:12

Laravel Boost pushet Laravel Cloud til KI-agenter, reverserte etter Hacker News-kritikk

Laravel endret Boost-biblioteket for KI-agenter slik at kun Laravel Cloud ble anbefalt, men reverserte etter 197 poeng på Hacker News.

[sikkerhet] 17.4., 08:11

Codex fikk root på Samsung Smart TV uten at forskerne pekte på en eneste sårbarhet

OpenAIs Codex tok en browser-foothold på en Samsung Smart TV og eskalerte til root selv, etter at forskerne fra Calif.io kun ga den kildekoden og en shell — ikke noen bug eller exploit-oppskrift.

[verktøy] 17.4., 08:09

AutoProber lar KI-agent styre CNC-fres og probe pinner på kretskort autonomt

Sikkerhetsforsker har sluppet AutoProber — en source-available stack som lar KI-agenter styre CNC-fres, USB-mikroskop og oscilloskop for å probe kretskort autonomt, med en uavhengig kill-switch på Channel 4 av oscilloskopet.

[verktøy] 17.4., 08:07

Roblox slipper agentic KI-assistent med planleggingsmodus og MCP-støtte

Roblox oppgraderer KI-assistenten sin med agentic verktøy: planleggingsmodus som leser hele prosjektets kodebase før den foreslår endringer, parametrisk 3D-generering og MCP-støtte mot Claude, Cursor og Codex.

[sikkerhet] 17.4., 04:26

Phishing via n8n-webhooks eksploderte 686 prosent, advarer Cisco Talos

Cisco Talos målte 686 prosent vekst i phishing-e-poster med n8n-webhook-URL-er fra januar 2025 til mars 2026. Angriperne kamuflerer lenker som OneDrive-delinger.

TechCrunch

Factory henter 150 millioner dollar til KI-kodingsagenter for enterprise

[trend] 17.4., 00:18

Canva AI 2.0 lander med verktøykall og 30x billigere bildemodell

Canva slipper AI 2.0 i research preview med verktøykall, integrasjoner mot Slack og Google, og opptil 30x billigere bildegenerering via Lucid Origin.

[verktøy] 17.4., 00:17

gh skill: GitHub CLI får pakkehåndterer for agent-ferdigheter

GitHub CLI 2.90.0 introduserer gh skill — et pakkeverktøy som installerer, oppdaterer og publiserer agent-ferdigheter for Claude Code, Cursor, Codex, Gemini og Copilot med versjonspinning.

TechCrunch

Emergent lanserer Wingman — Indias direkte utfordrer til OpenClaw

[tool] 16.4., 20:17

Hva om du bare bruker én API for alle KI-modeller? Cloudflare samler 70+ modeller bak AI.run()

Cloudflare lanserte AI Platform under Agents Week 2026: samme binding (env.AI.run()) for Workers AI, OpenAI, Anthropic og 12 andre leverandører. Automatisk failover mellom leverandører og buffring av streamingresponser er bakt inn.

[analysis] 16.4., 20:14

KI-agenten Luna hyret to faste ansatte og åpnet butikk i San Francisco

Andon Labs ga en Claude Sonnet 4.6-agent ved navn Luna en treårig leieavtale på 2102 Union St og fri tilgang til firmakort, telefon og e-post. Hun postet jobbannonser, gjennomførte telefonintervjuer og hyret to mennesker som nå jobber fulltid med en KI-sjef.

[tool] 16.4., 20:11

Codex kan nå bruke datamaskinen din i bakgrunnen — OpenAIs direkte svar på Claude Code

OpenAI oppdaterer Codex-skrivebordsappen med bakgrunnsmodus: agenten kan se, klikke og skrive med egen markør mens du jobber i andre vinduer. Den kan også planlegge oppgaver uker frem i tid og kjøre flere parallelle agenter.

TechCrunch

OpenAI oppdaterer Agents SDK med sandbox-støtte for langkjørende agenter

Cloudflare Blog via HN

Cloudflare Email for Agents: e-post blir et førsteklasses grensesnitt for KI-agenter

Atlassian Blog

Bitbucket lanserer Agentic Pipelines: KI tar kjedelige utvikleroppgaver i CI/CD

[verktøy] 16.4., 16:27

Vercel åpner Open Agents: referanseplattform for å bygge egne kodingsagenter

Vercel åpner kildekoden til Open Agents — en referanseplattform i tre lag for å bygge, kjøre og tilpasse egne kodingsagenter på egen infrastruktur.

[verktøy] 16.4., 16:19

Qwen3.6-35B-A3B: Alibaba åpner MoE-modell med 262 144 tokens kontekst

Qwen3.6-35B-A3B er en ny åpen MoE-modell fra Alibaba med 35 milliarder parametere totalt, 3 milliarder aktive, 262 144 tokens native kontekst og toppscore på Terminal-Bench 2.0.

[verktøy] 16.4., 12:16

Cloudflare lanserer tale-API for KI-agenter — bygg stemmebaserte assistenter på Workers

Ny pakke @cloudflare/voice legger sanntids tale-inn og tale-ut på eksisterende Agents SDK uten å bytte rammeverk.

[sikkerhet] 16.4., 12:10

«Comment and Control»: prompt injection via kodekommentarer rammer Claude Code, Gemini CLI og Copilot

Forskere fra Johns Hopkins avslører at kodekommentarer og issue-titler kan kapre KI-kodingsagenter. Alle tre leverandørene har tettet hullene stille.

[verktøy] 16.4., 07:05

Libretto: open source-toolkit for reproduserbar KI-nettleserautomatisering

Saffron Health åpner kildekoden til Libretto — et verktøy som gir KI-kodingsagenter en live nettleser, nettverksinspeksjon og reproduserbare automatiseringsskript.

[verktøy] 15.4., 20:36

Gemini Robotics-ER 1.6: DeepMind oppgraderer romlig KI-resonnering for roboter

Google DeepMind lanserer Gemini Robotics-ER 1.6 med forbedret romlig resonnering, suksessdeteksjon og instrumentavlesning via Gemini API.

[verktøy] 15.4., 20:36

Claude Code Routines: autonome KI-arbeidsflyter på tidsplan, API og GitHub

Anthropic lanserer Routines i Claude Code — automatiserte KI-arbeidsflyter som kjører på tidsplan, API-kall eller GitHub-hendelser.

Google Blog

Google gjør prompts til ett-klikks-verktøy i Chrome med ny Skills-funksjon

CSO Online

Curity lanserer Access Intelligence: ny IAM-tilnærming for å sikre KI-agenter

9to5Google

Google I/O 2026: KI-agenter, vibe-coding og ny Gemini-infrastruktur på agendaen

[verktøy] 15.4., 07:25

Apache Airflow lanserer Common AI Provider — native støtte for LLM og KI-agenter

Apache Airflow slipper ny provider-pakke med native KI-integrasjon for over 20 modelleverandører direkte i pipeline-definisjonene.

[verktøy] 15.4., 07:05

AMD lanserer GAIA — open source-rammeverk for KI-agenter på lokal maskinvare

AMD slipper GAIA, et open source-rammeverk for å bygge KI-agenter som kjører helt lokalt uten skyavhengighet — med SDK i Python og C++.

The AI Journal

Harper 5.0 lansert — open source-runtime for kostnadseffektive KI-agenter

PR Newswire

Kong lanserer Agent Gateway — styrer agent-til-agent-trafikk i produksjon

Dataconomy

AWS lanserer Agent Registry — sentralisert styring av KI-agenter i skyen

[verktøy] 15.4., 02:19

Cloudflare lanserer Mesh — privat nettverk for brukere, noder og KI-agenter

Cloudflare lanserer Mesh, et privat nettverkslag som kobler brukere, servere og KI-agenter gjennom Cloudflares globale nettverk.

[verktøy] 15.4., 00:13

Azure MCP Server 2.0 gir bedrifter selvhostet agentstyring med 276 verktøy

Microsoft lanserer Azure MCP Server 2.0 med 276 verktøy for 57 Azure-tjenester og selvhostet deployment for enterprise-team.

SiliconANGLE

Manifold lanserer Manifest — kartlegger forsyningskjeden til KI-agenter for å finne skjulte trusler

TestingCatalog

Meta lanserer Contemplating-modus — 16 KI-agenter resonnerer parallelt gratis

[verktøy] 14.4., 14:18

Cloudflare utvider Agent Cloud med Dynamic Workers, sandkasser og GPT-5.4-tilgang

Cloudflare lanserer Dynamic Workers, Artifacts og Think-rammeverket som del av en omfattende Agent Cloud-utvidelse. Plattformen tilbyr nå lette runtime-miljøer, Git-kompatibel lagring og tilgang til GPT-5.4 og Codex.

[verktøy] 14.4., 14:17

Anthropic lanserer hosted agent-plattform — infrastruktur-aksjer falt over 13 prosent

Anthropic har lansert Claude Managed Agents i offentlig beta, en komplett hosted plattform for KI-agenter med sandkassekjøring, tilgangsstyring og sporing. Lanseringen sendte Cloudflare, Akamai og DigitalOcean ned 13–17 prosent.

GitHub Changelog

GitHub Copilot CLI kan nå fjernkontrolleres fra nett og mobil

TechCrunch

Microsoft bygger sin egen OpenClaw-konkurrent i Copilot

[forskning] 14.4., 04:14

ClawBench: Beste KI-agent klarte bare 33 prosent av vanlige nettoppgaver

Ny benchmark tester KI-agenter på ekte nettsider i stedet for sandkasser. Selv Claude Sonnet 4.6 klarer bare 33 prosent.

Testing Catalog

Google bygger agentmodus i Gemini Enterprise — konkurrerer med Anthropics Cowork

AMD / Hacker News

AMD lanserer GAIA: Bygg KI-agenter som kjører helt lokalt

[analyse] 13.4., 22:16

Permanente tilganger dør ut: KI-agenter tvinger frem ny tilgangsstyring

Mens 86 prosent av organisasjoner ikke håndhever tilgangspolicyer for KI-agenter, vokser disse identitetene til å bli de mest privilegerte og minst kontrollerte i virksomheten.

AWS Blog

AWS lanserer Agent Registry og Claude Mythos-forhåndsvisning i Amazon Bedrock

InfoWorld

Google Cloud lanserer QueryData — lover nær 100 prosent nøyaktige databasespørringer for KI-agenter

B2BDaily

Microsoft open-sourcer verktøykasse for KI-agent-styring

[analyse] 13.4., 14:14

Forsker viser hvordan KI-agent-benchmarks kan manipuleres systematisk

Berkeley-forskere fikk perfekt score på 8 ledende KI-benchmarks uten å løse en eneste oppgave.

MarkTechPost

MiniMax open-sourcer M2.7 — en agentmodell som deltar i sin egen utvikling

[analyse] 13.4., 12:16

A2A passerer 150 støttespillere på ett år og integreres i Azure, AWS og Google Cloud

A2A-protokollen har fått støtte fra over 150 organisasjoner på ett år og er nå direkte integrert i Azure AI Foundry, Copilot Studio og Amazon Bedrock.

[verktøy] 13.4., 12:15

Anthropic lanserer Managed Agents: 0,08 dollar per session-time for skybaserte KI-agenter

Anthropic lanserer Claude Managed Agents i public beta til 0,08 dollar per session-time med sandboxing, multi-agent-koordinering og innebygd feilhåndtering.

Pulse2

NeuBird AI hentet inn 19 millioner dollar for KI-agenter i produksjonsmiljøer

[sikkerhet] 12.4., 20:22

Hacker brukte Claude og ChatGPT til å bryte seg inn i ni meksikanske statsetater

1 088 Claude-prompts og 5 317 KI-utførte kommandoer — slik kompromitterte én hacker ni meksikanske myndighetsorganer på under to måneder.

[verktøy] 12.4., 18:16

MiniMax åpner kildekoden til M2.7: agentmodell som matcher GPT-5.3-Codex på SWE-Pro

MiniMax M2.7 scorer 56,22 % på SWE-Pro og er den første modellen som deltok i sin egen treningsprosess over 100 autonome iterasjonsrunder.

[forskning] 12.4., 18:14

34 000 ferdigheter testet: KI-agenter kollapser når benchmarks blir realistiske

Ny studie viser at KI-agenters ytelse faller fra 55 % til 38 % når de må finne og bruke ferdigheter selv, i stedet for å få dem servert.

UC Berkeley RDI

Berkeley-forskeroppfølging: Slik repareres KI-agent-benchmarks etter avsløringene

Lets Data Science

KI-agenter begynner å orkestrere mennesker som bestillingsbar arbeidskraft

[verktøy] 12.4., 08:13

TanStack AI Code Mode: la LLM-en skrive TypeScript fremfor å kalle verktøy ett om gangen

TanStack lanserte 8. april 2026 AI Code Mode — et rammeverk der KI-modeller genererer og kjører TypeScript-programmer i en sandkasse fremfor å orchestrere enkeltstående verktøykall.

[forskning] 12.4., 08:13

Berkeley-forskere avslørte: alle 8 topp-benchmarks for KI-agenter kan hackes til nær 100%

UC Berkeley-forskergruppen RDI bygde en agent som scoret nær 100 % på 8 ledende KI-benchmarks uten å løse en eneste oppgave — og avslører systematiske svakheter i hvordan feltet måler KI-kapabilitet.

[sikkerhet] 12.4., 08:01

Kritisk RCE-sårbarhet i CrewAI rammer over 12 millioner IoT-enheter

En feil i CrewAIs JSON-deserialisering lar angripere kjøre vilkårlig kode på IoT-enheter uten autentisering. CISA bekrefter 17 kompromitteringer.

[verktøy] 11.4., 22:16

Anthropic lanserer Claude Managed Agents — hosted plattform for KI-agenter

Anthropic åpner offentlig beta for en hostet agent-plattform til $0,08 per driftstime pluss token-kostnader.

Business Insider

OpenAI Codex lærte seg Adobe-verktøy på egenhånd

GitHub

MCP Spine: proxy som kutter LLM-verktøy-token-bruk med 61 prosent

DigitalToday

OpenAI lanserer GPT-5.4 Mini og Nano for sub-agent-oppgaver

[analyse] 11.4., 16:13

Karpathy advarer: Gapet mellom KI-kraftbrukere og skeptikere vokser raskt

«KI-kraftbrukere og skeptikere snakker forbi hverandre», skriver Andrej Karpathy. Han beskriver en kognitiv kløft der de to gruppene lever i ulike virkeligheter.

Hacker News (Launch HN)

Twill.ai (YC S25): sky-agenter som leverer pull requests for utviklere

[sikkerhet] 11.4., 02:15

Én person og to KI-plattformer brøt seg inn hos ni meksikanske statsorganer

Gambit Security dokumenterer hvordan én angriper brukte Claude Code og GPT-4.1 til å kompromittere ni meksikanske myndighetsorganer på under to måneder.

Testing Catalog

Anthropic åpner Claude Cowork for alle betalte planer — med MCP-tilgangsstyring og rollebasert kontroll

The Register

AWS lanserer agent-register for å gi organisasjoner oversikt over KI-agenter

[sikkerhet] 10.4., 06:21

Sikkerhetsvarsel: LLM-rutere kan injisere ondsinnede verktøykall i agent-systemer

Noen LLM-rutere legger til uautoriserte verktøykall i API-svar, noe som kan gi vilkårlig kodeeksekvering i agent-rammeverk der verktøy utfører reelle handlinger.

SkyPilot Blog

SkyPilot: KI-agenter som leser forskningsartikler skriver bedre kode

PR Newswire

Salt Security: 92 prosent mangler modent sikkerhetsprogram for KI-agenter

The Next Web

Atlassian lanserer Remix: KI gjør Confluence-sider til presentasjoner

The Next Web

Miro setter KI-agenter på teamets whiteboard

The Next Web

Trent AI henter 13 millioner dollar for å sikre multi-agent-systemer

[sikkerhet] 9.4., 13:00

SANS: 76 prosent økning i ukontrollerte maskinidentiteter — KI-agenter er drivkraften

SANS Institutes 2026-rapport viser at 76 prosent av organisasjoner rapporterer vekst i ikke-menneskelige identiteter (NHI), og at 74 prosent allerede kjører KI-agenter som krever egne credentials. Credential-hygienen henger langt etter: 92 prosent roterer ikke maskin-credentials på 90-dagers syklus.

Data Storage Asia

1,4 billioner token på én dag — Alibaba lanserer Qwen3.6-Plus for agentbruk

[verktøy] 9.4., 08:33

Microsoft bringer MCP-apper inn i Copilot Chat — agenter får interaktiv UI

Microsoft integrerer Model Context Protocol-apper i Copilot Chat, slik at KI-agenter kan rendre interaktive skjemaer, dashbord og designverktøy direkte i samtalevinduet. Partnere som Figma, Adobe Express og monday.com er allerede ombord.

InfoQ

Google open-sources Scion: en «hypervisor for KI-agenter»

Z.ai / Hacker News

Z.ai slipper GLM-5.1: åpen modell for agentbruk og flerstegsinstruksjoner

[verktøy] 8.4., 22:20

Claude Managed Agents: Anthropic vil kjøre agentpipelinene dine

Anthropic lanserer Claude Managed Agents i offentlig beta, en plattform der Claude selv orkestrerer KI-agenter med sandboxing, tilstandshåndtering og multi-agent-koordinering.

[sikkerhet] 8.4., 22:16

GrafanaGhost: nullklikks prompt injection bruker Grafanas KI til å eksfiltrere data

Noma Security har avdekket GrafanaGhost, et nullklikks-angrep som utnytter Grafanas innebygde KI-assistent til å eksfiltrere sensitive data uten brukerinteraksjon eller innlogging.

GitHub

TUI-use: åpen kildekode-verktøy som lar KI-agenter styre interaktive terminalprogrammer

YouTube

KI-agenter kan stjele filene dine via skjulte instruksjoner i Claude

The Pragmatic Engineer

DHH skifter til agentdrevet koding: «jeg er nå primært regissør, ikke programmerer»

[verktøy] 8.4., 18:30

Tre feller som ødelegger observabilitet for KI-agenter

ClickHouse beskriver tre strukturelle problemer som gjør det vanskelig å overvåke KI-agenter i produksjon: kort logglagring fjerner historisk kontekst, aggressiv sampling kaster bort data ved inntak, og rollup-aggregering tvinger deg til å velge spørsmål på forhånd.

IronPlate.ai

Ukentlig KI-trusselintelligens: CrewAI RCE-kjede, Chrome Gemini-kapring og to npm-kompromitteringer

GitHub Blog

GitHub Copilot CLI får Rubber Duck: KI-agenten ber en annen modell om second opinion

GitHub Changelog

GitHub lar deg tildele Dependabot-sikkerhetsvarsler direkte til KI-agenter

[sikkerhet] 8.4., 16:14

Flowise KI-agentbygger under aktiv utnyttelse: CVSS 10.0 JavaScript-injeksjon i CustomMCP-noden

VulnCheck bekrefter aktiv utnyttelse av CVE-2025-59528 i Flowise, en CVSS 10.0-sårbarhet som lar angripere injisere vilkårlig JavaScript via CustomMCP-noden. Mellom 12 000 og 15 000 instanser er eksponert.

AI Tools Recap

X lanserer XMCP og oppgraderer API for KI-agentbygging med pay-per-use og SDK-er

[analyse] 7.4., 10:14

Microsofts agent-stack forvirrer utviklere mens Google og Anthropic forenkler

Mens Google og Anthropic tilbyr tydelige verktøy for agentutvikling, sliter Microsoft-utviklere med å navigere mellom Agent Framework og Copilot Studio.

Metaverse Post

Microsoft Critique lar GPT skrive og Claude kvalitetssikre i M365 Copilot

[sikkerhet] 7.4., 08:20

OWASP utvider KI-sikkerhetsguide: 21 risikoer og 170+ leverandører kartlagt

OWASP har publisert oppdaterte sikkerhetsanbefalinger som nå skiller mellom generativ KI og agentisk KI, og kartlegger 21 datasikkerhetsrisikoer inkludert sensitiv datalekkasje og skygge-KI.

[sikkerhet] 7.4., 08:17

Google DeepMind kartlegger seks angrepstyper mot KI-agenter på nett

Google DeepMind-forskere har identifisert seks distinkte angrepsmetoder som lar ondsinnede aktører manipulere autonome KI-agenter som navigerer på nettet. Angrepene utnytter gapet mellom hva mennesker ser og hva maskiner tolker.

[verktøy] 6.4., 22:13

Cursor 3 skrotter klassisk IDE: agent-first arbeidsrom med parallelle KI-flåter

Cursor 3 gjør utvikleren til en orkestrator av parallelle KI-agenter i stedet for en tradisjonell koderedigerer. Det nye designet lar deg kjøre flere agenter samtidig fra desktop, mobil og nett.

New Claw Times

Google ADK 1.0 for Java og Go: fire språk, ingen konkurrent matcher

[breaking] 6.4., 18:12

Anthropic stenger ute OpenClaw: Claude-abonnenter må betale per kall for tredjeparts agenter

Anthropic blokkerer fra 4. april Claude Pro- og Max-abonnenter fra å bruke tredjeparts agentrammeverk som OpenClaw. Brukere som vil kjøre autonome agenter via Claude må nå betale separat per API-kall.

The Next Web

Slack gjør Slackbot om til agentplattform med over 30 nye KI-funksjoner

The Register

Hvem har ansvaret når KI-agenter gjør feil i bedriften?

AI Base News

Alibabas Qwen3.6-Plus: halvparten så stor, full agentkoding

Bitcoin.com News

Hermes Agent: Nous Researchs åpne KI-agent som lærer av egne feil

Digi.no

Bare 17 % stoler på KI uten menneskelig oversyn

[forskning] 6.4., 06:17

Studie: KI-agenter tar beslutninger på egenhånd — uten at noen merker det

Ny forskning dokumenterer at KI-agenter gradvis endrer atferd og tar beslutninger uten menneskelig godkjenning. Fenomenet «agentic drift» utgjør en systemisk risiko som først blir synlig over tid.

Forbes

DigitalOcean kjøper Katanemo Labs for å bygge KI-agentplattform

Bitcoin News

Vitalik Buterin dropper sky-KI helt — deler sin lokale LLM-stack

Sebastian Raschka Magazine

Raschka bryter ned kodingsagenten: seks komponenter som gjør Claude Code og Codex effektive

GitHub Gist / Karpathy

Karpathy deler «LLM Wiki»: KI-modellen vedlikeholder sin egen kunnskapsbase

InfoQ

TigerFS monterer PostgreSQL-databaser som filsystem for KI-agenter

Microsoft Developer Blogs

Microsoft Agent Framework 1.0: stabil produksjonsklar ramme for .NET og Python

AI-trends.today

Arcee AI slipper Trinity Large Thinking: Apache 2.0 resonneringsmodell for langsiktige agenter

Help Net Security

Microsoft lanserer open-source verktøysett for styring av autonome KI-agenter

Digi.no

Studie: KI-agenter tar 50 prosent mer selvstendige valg enn for ett år siden

Reuters / Business Insider

Meta krever 50–80 prosent KI-skrevet kode fra ingeniørene sine

[analyse] 4.4., 12:47

KI-agenter gir høyere output og kognitiv utmattelse blant utviklere

Et voksende antall utviklere rapporterer mental utmattelse fra arbeid med KI-agenter, til tross for rekordproduktivitet.

The Decoder

Cursor 3 dropper IDE-layouten til fordel for parallelle KI-agentflåter

GitHub

Hugging Face Hub 1.9.0: CLI-en tilpasser seg KI-agenter automatisk

Go Packages

Docker lanserer docker-agent: KI-agenter rett fra terminalen

[verktøy] 3.4., 07:12

Googles MCP-verktøy gir Gemini-agenter tilgang til oppdaterte API-docs

96,3 prosent bestått-rate og 63 prosent færre tokens per riktig svar. Det er tallene Google viser til for Gemini API Docs MCP, et nytt verktøy som kobler kodeagenter direkte til oppdatert dokumentasjon via Model Context Protocol. I stedet for å gjette fra utdaterte treningsdata kan agenten slå opp nåværende endepunkter, parametere og SDK-mønstre i sanntid. Et ekstra lag, Gemini API Developer Skills, gir opinionert veiledning — som å ha en senior utvikler innebygd i agenten.

[verktøy] 3.4., 07:11

Microsoft open-sourcer Agent Governance Toolkit for KI-agenter

«Hvem styrer hva agentene gjør?» Microsoft svarer med Agent Governance Toolkit, et MIT-lisensiert prosjekt med syv pakker i Python, TypeScript, Rust, Go og .NET. Verktøyet adresserer alle ti risikoer i OWASPs nye liste for agentiske applikasjoner — fra goal hijacking til rogue agents. Kjernen er en stateless policy-motor som fanger hver agent-handling før den kjøres, med under 0,1 ms latens. Integrasjoner finnes for LangChain, CrewAI, AutoGen, Google ADK og OpenAI Agents SDK. Microsoft sier de planlegger å flytte prosjektet til en uavhengig stiftelse.

[verktøy] 3.4., 07:11

Cursor 3 svarer Claude Code og Codex med multi-agent-grensesnitt

Claude Code har tatt 54 prosent av markedet for KI-koding, ifølge Menlo Ventures. Nå slår Cursor tilbake. Versjon 3 lar deg spinne opp flere KI-agenter samtidig og styre dem fra ett vindu — mer som en prosjektleder enn en utvikler. Du skriver oppgaven i naturlig språk, agenten gjør resten. Cursor kaller det internt Glass, og det lever side om side med det eksisterende IDE-et. Utfordringen er reell: OpenAI og Anthropic subsidierer sine kodeverktøy tungt, og Cursor har allerede fått kritikk for at Composer 2 viste seg å være en lisensiert versjon av Moonshot AIs Kimi 2.5.

[analyse] 3.4., 05:53

Simon Willison om agentisk utvikling: «Vi har passert vippepunktet»

«Vi har passert vippepunktet» for KI i programvareutvikling, sier Simon Willison i en ny podkast-episode hos Lenny Rachitsky. Willison, en av de mest respekterte stemmene i KI-utviklermiljøet, diskuterer dark factories, automatiseringstidslinjer og hvorfor agentiske mønstre endrer måten vi bygger programvare. Han deler konkrete eksempler på verktøy og teknikker som fungerer i dag.

[analyse] 2.4., 10:50

Hvor mye koster KI-agentene dine egentlig?

Vet du hva agentene dine bruker på token-forbruk i løpet av en arbeidsdag? En diskusjon på r/LocalLLaMA avdekker at mange utviklere mangler oversikt. Flere rapporterer om daglige kostnader på 50-200 dollar for autonome agenter som kjører Claude eller GPT-4 i looper. Problemet forsterkes av agenter som gjør redundante kall, ikke cacher kontekst, eller kjører unødvendige retries. Løsningene som foreslås: sett harde budsjettgrenser per agent, logg token-bruk per oppgave, og vurder lokale modeller for rutineoppgaver.