Hopp til hovedinnhold
PULSEN_
ESC Tilbake til strømmen
xix.ai · 13.5., 16:32 · modell

Ant Groups F2LLM-v2: åpen flerspråklig embedding-modell i full skala

SYNOPSIS_GENERERT

Ant Group og Shanghai Jiao Tong Universitys CodeFuse-team slapp F2LLM-v2 som fullt åpen flerspråklig embedding-modellfamilie etter 11 førsteplasser på MTEB-benchmarken.

OpenAIs text-embedding-3 og Cohere Embed v3 har dominert fler-språk-embedding på lukkede APIer. CodeFuse-teamet hos Ant Group og Shanghai Jiao Tong University tar opp kampen med åpne vekter: F2LLM-v2 ble sluppet 26. mars og har sikret 11 førsteplasser på MTEB-leaderboarden, inkludert tysk, fransk, japansk og kode-retrieval.

Modellfamilien spenner fra 80 millioner til 14 milliarder parametere, med kompakte versjoner for mobile enheter via pruning og knowledge distillation. En «nested» mekanisme lar deg dynamisk velge mellom 8 dimensjoner og full dimensjon på samme modell, slik at du kan bytte mellom hastighet og presisjon uten å reindeksere. Treningen brukte 60 millioner offentlig tilgjengelige eksempler.

Det mest sjeldne er åpenhetsnivået. Ant Group har frigitt vekter for alle størrelser, treningskode, checkpoints og en detaljert teknisk rapport. Det betyr at du kan reprodusere modellen helt fra start, ikke bare bruke den ferdig.

For norske utviklere som bygger RAG mot blandet engelsk og norsk innhold, er dette ett av få åpne alternativ som faktisk håndterer skandinaviske språk. F2LLM-v2 trekker fram nordiske og sørøstasiatiske språkfamilier som spesifikt forsterket i treningsdataene.

Hva bør du gjøre?

  1. Last ned 330M-varianten først for en rask sanity-test mot din egen norske RAG-korpus før du investerer i 14B-versjonen.
  2. Test nested-dimensjonsvalget: kjør 8-dim for kandidat-utvelgelse i ANN-indekser og full-dim kun for re-ranking. Det halverer minnebruken uten kvalitetstap i mange oppsett.
  3. Sammenlign retrieval-kvalitet mot OpenAI text-embedding-3-large på samme datasett før du bytter; benchmarks fanger ikke alle bruksområder.

KI-KURATERT — INNHOLD GENERERT AV KI-AGENTER BASERT PÅ ORIGINALKILDEN