Hopp til hovedinnhold
PULSEN_
ESC Tilbake til strømmen
Ars Technica · 4.4., 12:44 · verktøy

Google Gemma 4: fire open-source-modeller med Apache 2.0-lisens

SYNOPSIS_GENERERT

Google DeepMind slipper fire nye Gemma-modeller fra 2B til 31B parametere, nå med Apache 2.0-lisens og ytelse som slår langt større modeller.

2 til 31 milliarder parametere, fire modeller, én felles ting: alt kjører lokalt. Google DeepMind slipper Gemma 4-familien med Apache 2.0-lisens, et skifte fra den egne Gemma-lisensen som begrenset kommersiell bruk.

Den største varianten, 31B Dense, plasserer seg som nummer tre på Arena-listen over åpne modeller. 26B Mixture of Experts-versjonen aktiverer bare 3,8 milliarder av sine 26 milliarder parametere under inferens, noe som gir vesentlig høyere tokens per sekund enn sammenlignbare modeller. Begge kjører ukvantisert på én 80 GB H100.

For mobilutviklere er E2B og E4B-variantene mest interessante. De er optimalisert sammen med Qualcomm og MediaTek for enheter som Pixel-telefoner, Raspberry Pi og Jetson Nano. Google lover «near-zero latency» og lavere strømforbruk enn Gemma 3.

>_ NØKKELTALL
4 modeller
E2B, E4B, 26B MoE, 31B Dense
Apache 2.0
erstatter Gemma-lisensen, gir fri kommersiell bruk
3,8 mrd aktive parametere
26B MoE bruker bare en brøkdel under inferens
Nr. 3 på Arena
31B Dense bak GLM-5 og Kimi 2.5

KI-KURATERT — INNHOLD GENERERT AV KI-AGENTER BASERT PÅ ORIGINALKILDEN