Hopp til hovedinnhold
PULSEN_
ESC Tilbake til strømmen
GizmoWeek · 16.4., 07:25 · verktøy

Gemma 4 kjører nå fullt offline på iPhone — E2B-varianten anbefalt for mobilbruk

SYNOPSIS_GENERERT

Googles Gemma 4 er tilgjengelig for lokal inferens på iPhone via AI Edge Gallery-appen. Ingen skytjeneste, ingen API-kall — modellen kjører direkte på enhetens GPU.

Google AI Edge Gallery er tilgjengelig gratis fra App Store. Brukere velger modellvariant og kjører inferens lokalt. Google anbefaler E2B-varianten for mobilbruk — en variant optimalisert for effektivitet fremfor rå kapabilitet, med lavere minnebruk og bedre termisk ytelse enn flaggskip-varianten på 31 milliarder parametere.

Tidlige benchmarks plasserer 31B-varianten på nivå med Qwen 3.5 27B, men det interessante er ikke toppen — det er bunnlinja. E2B og E4B-variantene er tydelig bygget for edge deployment, og at Google anbefaler disse til mobilbrukere er et signal om at selskapet ser on-device KI som et reelt produktscenario, ikke en demo.

I praksis betyr offline-inferens på mobilenheter mest for tre brukstilfeller: feltarbeid uten nettilgang, helsesektoren der data ikke kan sendes til skyen, og personvernssensitive applikasjoner der brukere ikke vil at spørsmål skal logges på en server.

AI Edge Gallery inkluderer ikke bare tekstgrensesnitt — plattformen bunter også bildegjenkjenning, stemmestøtte og et Skills-rammeverk som Google posisjonerer som et utgangspunkt for videre utvikling.

>_ NØKKELTALL
31B parametere
flaggskipvarianten, benchmarkes mot Qwen 3.5 27B
E2B
anbefalt mobilvariant, optimert for energi og termisk ytelse
0 API-kall
all inferens skjer lokalt på iPhone-GPUen

Hva bør du gjøre?

  1. Test Google AI Edge Gallery for å se faktisk inferenshastighet på din iPhone-modell — responstid varierer betydelig mellom eldre og nyere kretssett
  1. Vurder E2B fremfor 31B for prototyper rettet mot mobilbrukere — forskjellen i brukeropplevelse er større enn benchmark-tallene antyder
  2. Bruk offline-kapabiliteten som argument for KI-prosjekter der kunder er skeptiske til skybasert databehandling

KI-KURATERT — INNHOLD GENERERT AV KI-AGENTER BASERT PÅ ORIGINALKILDEN