Meituan er et uventet sted for en frontier-modell. Selskapet, ofte omtalt som Kinas svar på DoorDash, startet som landets dominerende matleveringsplattform og vokste til en miks av tjenester som reisebooking, lokalsøk og drosjebestilling. Det hoppet inn i modellutvikling så tidlig som i 2023 med oppkjøpet av oppstarten Light Year Beyond for 281 millioner dollar, men annonserte ikke egne modellplaner før i 2025. Nyheten er dekket av SiliconAngle.
Arkitektonisk følger LongCat-2.0 samme sparse mixture-of-experts-oppsett som Mistrals Mixtral og DeepSeek, der en intern ruter velger et kuratert sett «ekspert-modeller» per token i stedet for å aktivere hele modellen samtidig. Det gjør inferens billigere å skalere. Der åpne MoE-modeller som DeepSeek-R1 og OpenAIs GPT-OSS holder seg til 128 000 tokens kontekst, satser LongCat-2.0 tungt: 1 million tokens kontekstvindu og 1,6 billioner parametere. Meituan sier modellen er designet som en «hjerne» for agent-rammeverk og kodeharnesk som Claude Code, OpenClaw og Hermes.
Det virkelige poenget er maskinvaren. Modellen er ifølge selskapet både trent og optimalisert for innenlandske ASIC-«superpods», en posisjon Kina er presset mot fordi landet med jevne mellomrom er kuttet av fra Nvidias kraftigste CUDA-GPU-er. Analysehuset Bernstein anslo at Nvidia hadde rundt 40 prosent av det kinesiske KI-brikkemarkedet i 2025, omtrent likt med Huawei, og spådde at andelen faller 8 prosentpoeng i år.
For deg som bygger betyr ikke dette en modell du selv kjører. På 1,6 billioner parametere lever LongCat-2.0 i et datasenter, ikke på egen maskin eller de fleste on-prem-oppsett. Kjerneresonnementet skal være portabelt til annen maskinvare, men ytelsesoptimaliseringene blir liggende på de kinesiske brikkene. Det som betyr noe her, er signalet: Kina bygger nå frontier-modeller som er avkoblet fra Nvidia-stacken fra ende til ende.