Mens Ernie 5.0 fra november 2025 var bygget fra bunnen, er Ernie 5.1 ekstrahert ut av forrige generasjon via det Baidu kaller flerdimensjonal elastisk pretrening. Teknikken trener flere undermodeller parallelt i samme økt og plukker den optimale strukturen. Totalparametrene er komprimert til en tredjedel av originalen, og aktiveringsparametrene er kuttet til omtrent halvparten. Det gir lavere inferenskostnad uten at Baidu rapporterer fall i nøkkelbenchmarker.
På LMArenas søke-leaderboard rangerer Ernie 5.1 som nummer fire globalt med 1223 poeng, og er den eneste kinesiske modellen i toppsjiktet. Baidu sier også at agent-ytelsen overgår DeepSeek-V4-Pro, mens kreativ skriving og resonnering nærmer seg Gemini 3.1 Pro. For utviklere som velger mellom kinesiske KI-modeller er disse tallene direkte relevante, særlig fordi Ernie 5.1 ligger åpent på Baidus Qianfan-plattform for både bedrifter og enkeltutviklere.
Asynkron forsterkningslæring er det andre hovedgrepet. Baidu beskriver en frakoblet, fullt asynkron RL-pipeline som skal løse globale optimeringsproblemer fra lav ressursutnyttelse og long-tail-effekter. Resultatet er ifølge selskapet stabilitet under komplekse oppgaver — den typen jobber agenter må håndtere når de jobber over flere steg.
Hva som faktisk ligger under panseret får vi vite mer om 13. mai på Baidu AI Developer Conference, der Robin Li skal presentere flere tekniske detaljer og kommersialiseringsplaner. Til da er ytelsestallene Baidus egne, og benchmarkene mangler uavhengig verifisering.
Hva bør du gjøre?
- Logg inn på Baidus Qianfan-plattform hvis du vil teste Ernie 5.1 mot din egen workload. Det er enkleste vei til en direkte sammenligning med Gemini- eller DeepSeek-modeller du allerede bruker.
- Vent med produksjonsavhengighet til 13. mai-konferansen avklarer pris, kontekstvindu og lisensvilkår, og til uavhengige benchmark-resultater er publisert.
- Hvis agent-ytelsen er kritisk i ditt prosjekt, kjør egne målinger på «hardere» oppgaver som verktøybruk og flerstegs-resonnering før du stoler på Baidus DeepSeek-V4-Pro-sammenligning.