Microsoft Research lanserte 23. mai Fara1.5, en familie nettleser-agenter i tre størrelser (4B, 9B og 27B) der den minste modellen løser 57 % av oppgavene i Online-Mind2Web-testen. Mellomstørrelsen på 9B når 63 %, nesten en dobling fra forgjengeren Fara-7B, og 27B-varianten lander på 72 %. Til sammenligning scoret den forrige beste modellen i samme størrelsesklasse, Alibabas GUI-Owl-1.5-8B, 49 %.
Online-Mind2Web består av 300 oppgaver fordelt på 136 populære nettsteder, der agenten må navigere, fylle ut skjemaer og sammenligne produkter på ekte nettsider. Modellene følger en observe-think-act-løkke: ved hvert steg får de samtalehistorikken og de tre siste skjermbildene, og predikerer så neste enkelthandling. Fara1.5 bygger på Qwen3.5 som basismodell og er trent på syntetiske trajektorier fra Microsofts FaraGen1.5-pipeline, der OpenAIs GPT-5.4 fungerer som «lærer» modellene lærer å etterligne.
For deg som bygger lokalt er poenget størrelsen. En 4B-modell kjører på beskjeden maskinvare, og 9B-modellen henter to tredjedeler av gevinsten du ellers får ved å gå helt til 27B. Modellene er trent til å stoppe og spørre om bekreftelse før irreversible handlinger som å sende e-post eller sende inn skjemaer, og når de brukes via MagenticLite-grensesnittet kjører nettleseren i sandbox med full logging av hver handling. Fara1.5-9B er tilgjengelig på Microsoft Foundry nå, mens 4B og 27B kommer snart, og koden for å kjøre modellene selv ligger åpent på GitHub.
Hva bør du gjøre?
- Test Fara1.5-9B via Microsoft Foundry hvis du vil ha best balanse mellom treffsikkerhet og maskinvarekrav.
- Vurder 4B-varianten for on-device-agenter der inferenskostnad veier tyngre enn de siste prosentpoengene.
- Behold bekreftelsessteget for irreversible handlinger og kjør i sandbox, siden Fara1.5 fortsatt er en research preview.