Hva skjer når en nettleser begynner å levere språkmodeller selv, uten å gå via skyen? Chrome 148 sendte Prompt API til stabil 5. mai 2026, og på Google I/O la Google til Gemma 197M, en modell på 197 millioner parametere bygd for å drive Summarizer-, Writer-, Rewriter- og Proofreader-API-ene rett på brukerens maskinvare. Resultatet er et lag for inferens som koster utvikleren null kroner i runtime, fordi modellen kjører lokalt og aldri rører Googles servere, ifølge en gjennomgang fra byteiota.
Dette er tre brikker i samme strategi. Chrome 148 (5. mai) flyttet Prompt API fra origin trial til stabil. Chrome 149 (2. juni) utvidet Gemini Nano til fem språk: engelsk, spansk, japansk, tysk og fransk. Og Gemma 197M ble annonsert på I/O som en lettere modell laget spesielt for de oppgavestyrte API-ene.
Gemma 197M er ikke en nedskalert Gemini Nano. Det er en egen modell på 197 millioner parametere, rundt 15 ganger mindre enn 3B-store Nano, trent for avgrensede oppgaver som å oppsummere, skrive om og korrekturlese. Den prøver seg ikke på åpen resonnering, men kjører til gjengjeld på flere enheter og raskere for API-ene den driver.
Flere produksjonssystemer bruker det allerede. Bright Sites kjører Summarizer-API-et på over 150 publikasjoner, og Trip.com bruker det til flybooking-oppsummeringer.
«Sammenlignbar kvalitet, null serverkostnad og enklere datahåndtering siden brukerteksten aldri forlater enheten.» — Terra, om byttet fra en server-side LLM til Chromes Summarizer-API
De ærlige begrensningene er reelle. Dette er Chrome-only; Firefox og Safari har ingen tilsvarende API. Maskinvarekravet er minst 4 GB VRAM eller 16 GB RAM med fire CPU-kjerner, pluss 22 GB ledig diskplass til modellfilene. Mobil-Chrome støttes ikke. Og Chrome laster ned den 4 GB store Nano-modellen i bakgrunnen uten varsel, samtidig som Google stille fjernet personvern-erklæringen som tidligere lovet at prosessering skjer på enheten.
Hva bør du gjøre?
- Legg til en availability-sjekk med
LanguageModel.availability()og en Chrome-built-in-path for høyvolum tekstoppgaver, med sky-API-et som fallback.
- Bruk Summarizer-API-et (Gemma 197M) til oppsummering og klassifisering, ikke til oppgaver som krever åpen resonnering.
- For personvern-sensitive prosjekter: ta høyde for at Chrome henter 4 GB-modellen i bakgrunnen uten å varsle brukeren.