XDA Developers-skribenten kjørte et personlig eksperiment: en hel uke uten Claude Pro, med Qwen 3.5 9B som erstatning. Maskinvaren var en RTX 3070 med 8 GB VRAM, og modellen kjørte gjennom LM Studio med 60 000-token kontekstvindu. Det er mulig på beskjeden hardware fordi Qwen 3.5 bruker en GDN-arkitektur som holder minnebruken nesten flat når konteksten vokser, ikke linjær som en standard transformer.
Det overraskende var hvor mye som faktisk holdt mål. Bilde-analyse fra skjermbilder fungerte «like godt» som hos Claude. Qwen leste grensesnitt, beskrev scener og flagget designinkonsistens. Lengre research-økter, dokumenthåndtering og «tenkepartner»-bruk var også OK, men krever skarpere prompting fordi lokale modeller tolker mer bokstavelig.
«Det jeg faktisk betaler for, har en mer spesifikk form enn bare 'en Claude-funksjon'» — XDA-skribenten
Veggen var render-panelet. Qwen kan generere HTML, men å få interaktiv preview lokalt krever enten å kjempe med Open WebUI mot LM Studio, eller å bygge om stacken rundt Ollama. Og selv da må modellen svare i akkurat riktig format for at artifact-panelet skal trigge, noe en general-purpose 9B ikke er tunet for. Claude gjør det hver gang uten oppsett.
Konklusjonen er nyansert: lokale modeller har lukket gapet på de fleste tekstoppgaver, og personvernet er en reell bonus. Men spesifikke produkt-features som artifact-rendering er fortsatt det skyabonnementet leverer pålitelig. Det regnestykket er verdt å gjøre før du sier opp $17 i måneden.
Hva bør du gjøre?
- Test din egen workflow én uke før du fornyer Claude Pro eller ChatGPT Plus. Du oppdager først hva du faktisk bruker når du må jobbe rundt at det mangler.
- Prøv GDN-arkitektur lokalt hvis du har 8 GB VRAM eller mer. Qwen 3.5 9B kjører 60K kontekst på en RTX 3070, noe en standard transformer ikke ville klart.
- Behold abonnementet for spesifikke features, ikke for generell tekst. Render-panel, lange dokumentkjeder over 60K tokens, eller stemme. Der har skyen fortsatt forsprang.