Google AI Edge Gallery er tilgjengelig gratis fra App Store. Brukere velger modellvariant og kjører inferens lokalt. Google anbefaler E2B-varianten for mobilbruk — en variant optimalisert for effektivitet fremfor rå kapabilitet, med lavere minnebruk og bedre termisk ytelse enn flaggskip-varianten på 31 milliarder parametere.
Tidlige benchmarks plasserer 31B-varianten på nivå med Qwen 3.5 27B, men det interessante er ikke toppen — det er bunnlinja. E2B og E4B-variantene er tydelig bygget for edge deployment, og at Google anbefaler disse til mobilbrukere er et signal om at selskapet ser on-device KI som et reelt produktscenario, ikke en demo.
I praksis betyr offline-inferens på mobilenheter mest for tre brukstilfeller: feltarbeid uten nettilgang, helsesektoren der data ikke kan sendes til skyen, og personvernssensitive applikasjoner der brukere ikke vil at spørsmål skal logges på en server.
AI Edge Gallery inkluderer ikke bare tekstgrensesnitt — plattformen bunter også bildegjenkjenning, stemmestøtte og et Skills-rammeverk som Google posisjonerer som et utgangspunkt for videre utvikling.
Hva bør du gjøre?
- Test Google AI Edge Gallery for å se faktisk inferenshastighet på din iPhone-modell — responstid varierer betydelig mellom eldre og nyere kretssett
- Vurder E2B fremfor 31B for prototyper rettet mot mobilbrukere — forskjellen i brukeropplevelse er større enn benchmark-tallene antyder
- Bruk offline-kapabiliteten som argument for KI-prosjekter der kunder er skeptiske til skybasert databehandling