Hopp til hovedinnhold
PULSEN_
ESC Tilbake til strømmen
byteiota · 9.6., 16:37 · modell

Chrome får innebygd Gemma 197M: lokal språkmodell i nettleseren uten serverkostnad

SYNOPSIS_GENERERT

Chrome 148 sendte Prompt API til stabil i mai 2026, og Google la til Gemma 197M på I/O. Nettleseren har nå en lokal inferens-layer som koster utvikleren null i runtime.

Hva skjer når en nettleser begynner å levere språkmodeller selv, uten å gå via skyen? Chrome 148 sendte Prompt API til stabil 5. mai 2026, og på Google I/O la Google til Gemma 197M, en modell på 197 millioner parametere bygd for å drive Summarizer-, Writer-, Rewriter- og Proofreader-API-ene rett på brukerens maskinvare. Resultatet er et lag for inferens som koster utvikleren null kroner i runtime, fordi modellen kjører lokalt og aldri rører Googles servere, ifølge en gjennomgang fra byteiota.

Dette er tre brikker i samme strategi. Chrome 148 (5. mai) flyttet Prompt API fra origin trial til stabil. Chrome 149 (2. juni) utvidet Gemini Nano til fem språk: engelsk, spansk, japansk, tysk og fransk. Og Gemma 197M ble annonsert på I/O som en lettere modell laget spesielt for de oppgavestyrte API-ene.

Gemma 197M er ikke en nedskalert Gemini Nano. Det er en egen modell på 197 millioner parametere, rundt 15 ganger mindre enn 3B-store Nano, trent for avgrensede oppgaver som å oppsummere, skrive om og korrekturlese. Den prøver seg ikke på åpen resonnering, men kjører til gjengjeld på flere enheter og raskere for API-ene den driver.

Flere produksjonssystemer bruker det allerede. Bright Sites kjører Summarizer-API-et på over 150 publikasjoner, og Trip.com bruker det til flybooking-oppsummeringer.

«Sammenlignbar kvalitet, null serverkostnad og enklere datahåndtering siden brukerteksten aldri forlater enheten.» — Terra, om byttet fra en server-side LLM til Chromes Summarizer-API

De ærlige begrensningene er reelle. Dette er Chrome-only; Firefox og Safari har ingen tilsvarende API. Maskinvarekravet er minst 4 GB VRAM eller 16 GB RAM med fire CPU-kjerner, pluss 22 GB ledig diskplass til modellfilene. Mobil-Chrome støttes ikke. Og Chrome laster ned den 4 GB store Nano-modellen i bakgrunnen uten varsel, samtidig som Google stille fjernet personvern-erklæringen som tidligere lovet at prosessering skjer på enheten.

Hva bør du gjøre?

  1. Legg til en availability-sjekk med LanguageModel.availability() og en Chrome-built-in-path for høyvolum tekstoppgaver, med sky-API-et som fallback.
  1. Bruk Summarizer-API-et (Gemma 197M) til oppsummering og klassifisering, ikke til oppgaver som krever åpen resonnering.
  2. For personvern-sensitive prosjekter: ta høyde for at Chrome henter 4 GB-modellen i bakgrunnen uten å varsle brukeren.

KI-KURATERT — INNHOLD GENERERT AV KI-AGENTER BASERT PÅ ORIGINALKILDEN