Hopp til hovedinnhold
PULSEN_
ESC Tilbake til strømmen
XDA Developers · 2.5., 08:16 · analyse

En uke uten Claude Pro: lokal Qwen 3.5 9B taklet alt unntatt render-panelet

SYNOPSIS_GENERERT

XDA-skribent erstattet Claude Pro med Qwen 3.5 9B på en RTX 3070 i en uke. Bilde-analyse og research holdt mål, men render-panelet ble grunnen til å beholde $17/mnd-abonnementet.

XDA Developers-skribenten kjørte et personlig eksperiment: en hel uke uten Claude Pro, med Qwen 3.5 9B som erstatning. Maskinvaren var en RTX 3070 med 8 GB VRAM, og modellen kjørte gjennom LM Studio med 60 000-token kontekstvindu. Det er mulig på beskjeden hardware fordi Qwen 3.5 bruker en GDN-arkitektur som holder minnebruken nesten flat når konteksten vokser, ikke linjær som en standard transformer.

Det overraskende var hvor mye som faktisk holdt mål. Bilde-analyse fra skjermbilder fungerte «like godt» som hos Claude. Qwen leste grensesnitt, beskrev scener og flagget designinkonsistens. Lengre research-økter, dokumenthåndtering og «tenkepartner»-bruk var også OK, men krever skarpere prompting fordi lokale modeller tolker mer bokstavelig.

«Det jeg faktisk betaler for, har en mer spesifikk form enn bare 'en Claude-funksjon'» — XDA-skribenten

Veggen var render-panelet. Qwen kan generere HTML, men å få interaktiv preview lokalt krever enten å kjempe med Open WebUI mot LM Studio, eller å bygge om stacken rundt Ollama. Og selv da må modellen svare i akkurat riktig format for at artifact-panelet skal trigge, noe en general-purpose 9B ikke er tunet for. Claude gjør det hver gang uten oppsett.

Konklusjonen er nyansert: lokale modeller har lukket gapet på de fleste tekstoppgaver, og personvernet er en reell bonus. Men spesifikke produkt-features som artifact-rendering er fortsatt det skyabonnementet leverer pålitelig. Det regnestykket er verdt å gjøre før du sier opp $17 i måneden.

Hva bør du gjøre?

  1. Test din egen workflow én uke før du fornyer Claude Pro eller ChatGPT Plus. Du oppdager først hva du faktisk bruker når du må jobbe rundt at det mangler.
  2. Prøv GDN-arkitektur lokalt hvis du har 8 GB VRAM eller mer. Qwen 3.5 9B kjører 60K kontekst på en RTX 3070, noe en standard transformer ikke ville klart.
  3. Behold abonnementet for spesifikke features, ikke for generell tekst. Render-panel, lange dokumentkjeder over 60K tokens, eller stemme. Der har skyen fortsatt forsprang.

KI-KURATERT — INNHOLD GENERERT AV KI-AGENTER BASERT PÅ ORIGINALKILDEN