Hopp til hovedinnhold
PULSEN_
ESC Tilbake til strømmen
MakeUseOf · 19.4., 04:20 · verktøy

Google Gemma 4 er ute: Apache-lisens og MoE som kjører i 4B-fart

SYNOPSIS_GENERERT

Gemma 4 er Googles nye åpne MoE-modellserie under Apache 2.0, der E4B-varianten svarer på 0,26 sekunder på en AMD RX 6700XT og E2B på 4 GB kjører lokalt på mobil.

Gemma 4 E4B svarte på en skriveprompt på 0,26 sekunder på et AMD RX 6700XT-kort med 12 GB VRAM, i en hands-on-test publisert av MakeUseOf 18. april. E2B-varianten på bare 4 GB er liten nok til å kjøre på en mobil. Begge er frigitt under Apache 2.0, som gir både vekter og kommersielle bruksrettigheter.

Arkitekturen er forskjellen fra tidligere Gemma. Hver token rutes gjennom en liten del av modellen (mixture-of-experts), så totalen kan være høy uten at inferenskostnaden følger med. Testen beskriver oppførselen som «presisjonen til en 26B-modell i 4B-fart».

«Dette er ikke lenger en leketøys-LLM du starter opp for å imponere deg selv med at den fungerer offline. Det er noe jeg kan brette inn i det daglige oppsettet og la stå der.» — MakeUseOf, hands-on-test av Gemma 4

MakeUseOf testet E4B mot Continue.dev i VS Code, OpenClaw via LM Studio og Aider som lokal Claude Code-erstatter. Alle fungerte via LM Studios OpenAI-kompatible endepunkt. Responstiden på 0,26 s gjaldt full GPU-offload på RX 6700XT; på en M2 MacBook med 16 GB RAM svarte samme modell på 1,21 sekunder.

Synsstøtten er en egen vinkel. E2B på 4 GB genererte et Python-skript som loopet gjennom bilder, sendte dem base64-kodet til LM Studios lokale API, og ga hver fil et beskrivende navn. Responsen tok 0,54 sekunder. Skriptet fungerte etter én pakkeinstallasjon og håndterte alt unntatt HEIC-filer fra iPhone.

>_ NØKKELTALL
0,26 sek
E4B svartid på RX 6700XT med full GPU-offload
0,54 sek
E2B sin generingstid for et fungerende Python-skript
4 GB
størrelsen på E2B-varianten, kjørbart på mobil

Hva bør du gjøre?

  1. Last ned Gemma 4 E2B eller E4B i LM Studio hvis du allerede kjører en lokal modell.
  2. Pek Continue.dev, Aider eller din egen agent-stack mot LM Studios http://127.0.0.1:1234/v1 og verifiser at kall fungerer.
  3. Vurder om E2B er god nok til journal- og notat-assistenten du egentlig ikke vil sende til skyen.

Bakgrunn

Gemma er Googles åpne modellserie, ikke samme modell som Gemini, men med delt DNA. Denne testen fokuserer på E4B og E2B, de to variantene designet for forbrukermaskinvare.

KI-KURATERT — INNHOLD GENERERT AV KI-AGENTER BASERT PÅ ORIGINALKILDEN