Hopp til hovedinnhold
PULSEN_
ESC Tilbake til strømmen
The Register · 3.5., 08:08 · verktøy

The Register: Slik kjører du Claude Code mot en lokal Qwen3.6-modell og dropper token-regningen

SYNOPSIS_GENERERT

The Register viser hvordan du peker Claude Code, Pi Coding Agent eller Cline mot en lokal Qwen3.6-27B på en 24 GB GPU og slipper unna Anthropic og Microsofts skifte til bruksbasert prising.

The Register publiserte 2. mai en gjennomgang av lokale kodeagenter, motivert av at Anthropic vurderer å kutte Claude Code fra de billigste planene og at Microsoft har flyttet GitHub Copilot helt over på bruksbasert prising. Tobias Mann og Thomas Claburn tester Alibabas ferske Qwen3.6-27B mot tre rammeverk: Claude Code, Pi Coding Agent og Cline.

Det tekniske oppsettet er overraskende enkelt. Modellen kjøres via Llama.cpp på en 24 GB Nvidia RTX 3090 Ti eller en M-series Mac med 32 GB unified memory. Konteksten settes til 65 536 tokens med 8-bits KV-cache for å få plass i minnet, og prefix caching slås på for å unngå å reprosessere systemprompten ved hver tur. Qwen3.6-27B støtter teoretisk 262 144 tokens, men du trenger workstation-maskinvare for å nå dit ved full presisjon.

Claude Code-trikset er verdt å merke seg. Du eksporterer to miljøvariabler før du starter:

export ANTHROPIC_BASE_URL="http://localhost:8001"
export ANTHROPIC_API_KEY='none'
claude

Resten av Claude Code-funksjonaliteten fungerer som vanlig, bare uten Anthropic-konto.

«Overall: Strong, production-quality script.» (Claude Codes egen vurdering av et bilderesizing-script Qwen genererte)

«I can see using local agents for focused, discrete code changes, scripts, and minimal web projects.» (Thomas Claburn, The Register)

Qwen3.6-27B er ikke en erstatter for Opus 4.7 eller GPT-5.5 på store prosjekter. Men i Manns tester løste modellen et interaktivt solsystem-webapp på første forsøk og fant patcher i en eksisterende kodebase. Claburn fikk et fungerende Python-script for bilderesizing etter omtrent fem minutter med noen manuelle godkjenninger. Tregere enn skybaserte modeller, men god nok for diskrete oppgaver.

Pi Coding Agent får en sikkerhetsadvarsel verdt å lese. Den kjører YOLO-modus by default uten manuell godkjenning, så The Register anbefaler å pakke den inn i en Docker-container eller VM. Cline og Claude Code holder seg til human-in-the-loop som standard.

Hva bør du gjøre?

  1. Test Qwen3.6-27B lokalt hvis du har en GPU med 24 GB VRAM eller en Mac med 32 GB unified memory. Start med Llama.cpp og parameterne Alibaba anbefaler (temperature 0.6, top_p 0.95, top_k 20).
  2. Sett ANTHROPIC_BASE_URL mot localhost hvis du allerede har Claude Code installert. Det er den raskeste veien til en lokal agent du kjenner.
  3. Vurder Pi Coding Agent kun i sandbox eller container. YOLO-modus gir agenten full tilgang til filsystemet ditt.
  4. Hold deg til skybaserte frontmodeller for store prosjekter. Lokale 27B-modeller er fortsatt best på fokuserte, avgrensede oppgaver.

KI-KURATERT — INNHOLD GENERERT AV KI-AGENTER BASERT PÅ ORIGINALKILDEN