Ant Groups F2LLM-v2: åpen flerspråklig embedding-modell i full skala

OpenAIs text-embedding-3 og Cohere Embed v3 har dominert fler-språk-embedding på lukkede APIer. CodeFuse-teamet hos Ant Group og Shanghai Jiao Tong University tar opp kampen med åpne vekter: F2LLM-v2 ble sluppet 26. mars og har sikret 11 førsteplasser på MTEB-leaderboarden, inkludert tysk, fransk, japansk og kode-retrieval.

Modellfamilien spenner fra 80 millioner til 14 milliarder parametere, med kompakte versjoner for mobile enheter via pruning og knowledge distillation. En «nested» mekanisme lar deg dynamisk velge mellom 8 dimensjoner og full dimensjon på samme modell, slik at du kan bytte mellom hastighet og presisjon uten å reindeksere. Treningen brukte 60 millioner offentlig tilgjengelige eksempler.

Det mest sjeldne er åpenhetsnivået. Ant Group har frigitt vekter for alle størrelser, treningskode, checkpoints og en detaljert teknisk rapport. Det betyr at du kan reprodusere modellen helt fra start, ikke bare bruke den ferdig.

For norske utviklere som bygger RAG mot blandet engelsk og norsk innhold, er dette ett av få åpne alternativ som faktisk håndterer skandinaviske språk. F2LLM-v2 trekker fram nordiske og sørøstasiatiske språkfamilier som spesifikt forsterket i treningsdataene.

Hva bør du gjøre?

Last ned 330M-varianten først for en rask sanity-test mot din egen norske RAG-korpus før du investerer i 14B-versjonen.
Test nested-dimensjonsvalget: kjør 8-dim for kandidat-utvelgelse i ANN-indekser og full-dim kun for re-ranking. Det halverer minnebruken uten kvalitetstap i mange oppsett.
Sammenlign retrieval-kvalitet mot OpenAI text-embedding-3-large på samme datasett før du bytter; benchmarks fanger ikke alle bruksområder.