Metas KI-sjef hevder Watermelon matcher GPT-5.5, men navngir ingen benchmarker

Alexandr Wang, Metas KI-sjef, fortalte ansatte 2. juli at selskapets neste frontier-modell, kodenavn Watermelon, allerede matcher OpenAIs GPT-5.5 på sentrale benchmarker, midt under trening. Det melder TechTimes fra det interne møtet. Haken er hvordan tallet er framkommet: vurderingen var kjørt av Meta selv og bygger på tester Wang ikke navnga.

I frontier-testing er unavngitte interne benchmarker fra laben som trenger en seier mest, den minst pålitelige typen bevis. De samme modellvektene kan sprike 10 til 20 poeng avhengig av evalueringsrigg, testsett-versjon og konfigurasjon. Til Meta publiserer en full benchmark-tabell og slipper Watermelon til uavhengig testing, er påstanden en retningsindikator for selskapets compute-strategi, ikke et verifisert mål på hvor modellen står.

Skalaen er derimot reell. Wang beskrev treningen slik:

«En størrelsesorden mer regnekraft» enn forgjengeren. — Alexandr Wang, KI-sjef i Meta

Watermelon trenes på Metas Prometheus-klynge i Ohio, anslått til rundt 500 000 GPU-er og over én gigawatt effekt. Meta har guidet investorer mot 125 til 145 milliarder dollar i KI-investeringer i år. Til sammenligning traff forgjengeren Muse Spark 52 på Artificial Analysis' Intelligence Index i april, mens GPT-5.5 lå på 59, Gemini 3.1 Pro på 57 og Claude Opus 4.6 på 53.

Mer regnekraft garanterer likevel ikke et tilsvarende bedre resultat. Skaleringslovene er logaritmiske: en tidobling av compute gir typisk 30 til 40 prosent lavere treningstap, ikke en tidobbelt bedre modell. For deg som velger modeller å bygge på, er lærdommen enkel: vent på uavhengige tall før du flytter en agent eller et produkt over på en modell som fortsatt bare finnes i leverandørens egne slides.