Qwen3.6-27B slår Claude Opus på flere kode-benchmarks — åpen og lokal

Tallene fra Qwen-teamets egen benchmark-tabell er slående: 77,2 på SWE-bench Verified (Opus: 80,9), 59,3 på Terminal-Bench 2.0 (uavgjort med Opus), og 48,2 på SkillsBench Avg5 der Qwen3.6-27B faktisk passerer Opus sine 45,3. Modellen ble publisert på Hugging Face 21. april og er allerede blant de mest nedlastede nye kode-modellene.

Arkitekturen er uvanlig. Qwen3.6-27B er en hybrid «Gated DeltaNet + Gated Attention»-modell med 64 lag og 5120 hidden dimensions, ikke en ren transformer. Den er også multimodal: en vision encoder er innebygd, så modellen håndterer både kode og bilder i samme pass. Native kontekst er 262 144 tokens, utvidbar til 1 010 000.

«Built on direct feedback from the community, Qwen3.6 prioritizes stability and real-world utility, offering developers a more intuitive, responsive, and genuinely productive coding experience.» (Qwen-teamet, README på Hugging Face)

For deg som kjører lokalt er 27B håndterbart: i BF16 veier modellen 55,6 GB, distribuert over 15 safetensors-shards. Med 4-bit kvantisering kommer du under 16 GB og kan kjøre den på et RTX 4090. vLLM, SGLang og KTransformers er støttet ut av boksen.

>_ NØKKELTALL

27,78 mrd: Parametere, dense (ikke MoE som Qwen3.6-35B-A3B)

262 144: Native kontekstlengde, utvidbar til 1,01 M

83,9: LiveCodeBench v6-score, 0,9 poeng bak Claude 4.5 Opus

Hva bør du gjøre?

Last ned fra Hugging Face: huggingface-cli download Qwen/Qwen3.6-27B med Apache 2.0-lisens og ingen gated-access.
Test den mot ditt kode-use-case: benchmark-tall og virkelighet er to ting. Kjør den på et reelt repo du kjenner og sammenlign med Sonnet eller GPT-4o.
Velg riktig variant: 27B-varianten er dense og enkel å kjøre lokalt. Qwen3.6-35B-A3B er en MoE-variant med større totalstørrelse men lavere aktive parametere, og fungerer bedre hvis du har nok VRAM men vil ha raskere inferens.

Bakgrunn

Qwen-serien fra Alibaba Cloud har siden 3.5-serien i februar vært et seriøst alternativ til Claude og GPT for utviklere som ønsker åpne vekter. 3.6-oppgraderingen fokuserer på «agentic coding» og «thinking preservation». Sistnevnte er en ny mulighet til å beholde resonneringskontekst fra tidligere meldinger, som ifølge Qwen-teamet reduserer overhead i iterative utviklingsflyter.