Mens Claude Opus 4.6 koster 25 dollar per million tokens, tilbyr Arcee AI sin Trinity-Large-Thinking til 0,90 dollar. Det er en prisforskjell på 96 prosent. Modellen scorer 91,9 på PinchBench mot Claudes 93,3, en marginal forskjell som gjør den interessant for utviklere med stramme budsjetter.
Arcee, et team på 30 personer i San Francisco, brukte 20 millioner dollar og et 33-dagers treningsløp på 2 048 NVIDIA B300 Blackwell-GPUer. Arkitekturen er Mixture-of-Experts: av 399 milliarder parametere er bare 1,56 prosent (13 milliarder) aktive per token. Det gir høy ytelse uten tilsvarende regnekraft.
Treningsdataene omfattet 20 billioner tokens, halvparten syntetiske. En nøkkelinnovasjon er en «tenke-fase» før generering som forbedrer evnen til komplekse flerstegsoppgaver. Modellen ble den mest populære på OpenRouter i USA, med over 80 milliarder tokens prosessert på én dag.