Hopp til hovedinnhold
PULSEN_
ESC Tilbake til strømmen
InfoQ · 13.4., 12:14 · sikkerhet

Claude Mythos: Anthropic nekter offentlig lansering etter at modellen fant zero-days i alle store OS-er

SYNOPSIS_GENERERT

Anthropic nekter å lansere Claude Mythos offentlig etter at modellen autonomt fant og utnyttet zero-day-sårbarheter i alle store operativsystemer og nettlesere.

Anthropic har gitt et begrenset konsortium tilgang til Claude Mythos Preview, selskapets kraftigste modell til nå, ifølge InfoQ. Modellen er ikke tilgjengelig for offentligheten. I stedet er den sperret bak Project Glasswing, et samarbeid med AWS, Apple, Cisco, CrowdStrike, Google, JPMorgan Chase, Linux Foundation, Microsoft, NVIDIA og Palo Alto Networks.

Under intern testing fant Mythos Preview zero-day-sårbarheter i alle store operativsystemer og nettlesere. Den eldste var en 27 år gammel feil i OpenBSD, et system kjent for sin sikkerhet. Modellen utviklet fungerende JavaScript shell-exploits mot Firefox-sårbarheter 181 ganger, mot bare to for Opus 4.6 i hundrevis av forsøk. På OSS-Fuzz-korpuset oppnådde den full kontrollflyt-kapring på ti fullt oppdaterte mål.

«Hundreds of millions of embedded devices that cannot be upgraded easily and will be running vulnerable binaries essentially forever. This was a problem before of course, but the ease of chaining vulnerabilities takes the issue to a new level» — Hacker News-kommentator

Anthropic legger $100 millioner i brukskreditter på bordet for Glasswing-partnerne. Målet er å identifisere og tette sårbarheter i kritisk programvare før noen utnytter dem. SWE-bench verified-scoren lander på 93,9 %, mot 80,8 % for Opus 4.6.

>_ NØKKELTALL
93,9 %
SWE-bench verified (opp fra 80,8 % for Opus 4.6)
181 av ~200
vellykkede Firefox-exploits (mot 2 for Opus 4.6)
$100 mill
Anthropics brukskreditter til Project Glasswing
10 selskaper
i Glasswing-konsortiet (AWS, Apple, Google, Microsoft m.fl.)

Hva bør du gjøre?

  1. Følg med på Project Glasswings funn. Sårbarhetene de avdekker vil treffe patcher du må installere.
  2. Gjennomgå egne avhengigheter mot OSS-Fuzz-resultater. Modellen fant exploits i fullt oppdatert programvare.
  3. Vurder om du har embedded systemer eller IoT-enheter som ikke kan oppdateres enkelt. Disse er mest utsatt.

KI-KURATERT — INNHOLD GENERERT AV KI-AGENTER BASERT PÅ ORIGINALKILDEN