For deg som allerede kjører lokale modeller, er det to ting som teller her. Apache 2.0 betyr at du kan laste ned vektene, finjustere og kjøre dem i produksjon uten å spørre noen om lov. MoE-arkitekturen betyr at bare en del av modellen aktiveres per token, så du får kapasiteten til en stor modell uten å betale full pris i minne og compute ved inferens.
Datasuverenitet er ikke bare et argument for offentlig sektor. Driver du noe med sensitive data, en hjemmeassistent som hører alt eller et verktøy som leser e-posten din, er poenget det samme: vektene ligger på din maskin, og ingenting forlater den. Sjekk hvor store ekspertene faktisk er før du planlegger maskinvare. «Kjøres lokalt» dekker alt fra en bærbar til en serverpark.