«Benchmarkene kommer med den vanlige mangelen på transparens» — The Decoder
Ifølge The Decoder rulles de to agentene ut samtidig. Deep Research er standardversjonen, Deep Research Max er den kraftigere varianten som kjører autonomt på tvers av både offentlige nettkilder og proprietære datafeeds. Google oppgir at agentene topper benchmarks som HLE, BrowseComp og DeepSearchQA, uten å publisere metodologien for sammenligningene.
Det praktiske gjennombruddet for utviklere ligger ikke i benchmark-tallene, men i MCP-integrasjonen. For første gang kan du koble Deep Research mot egne datakilder gjennom den åpne protokollen Anthropic publiserte i fjor høst. Google nevner spesifikt finansielle datafeeds som eksempel, men protokollen er generell nok til å dekke interne wiki-er, kodebaser eller sektorspesifikke databaser.
Det plasserer Google direkte i konkurranse med OpenAIs Deep Research og Perplexitys research-modus. Forskjellen er koblingen mot proprietære kilder: OpenAI støtter ennå ikke MCP i sin research-agent, og Perplexity fokuserer på offentlig nett.
Hva bør du gjøre?
- Test Deep Research Max på et reelt research-problem du allerede har. Hvis du har en MCP-server du bruker i Claude Code eller Cursor, prøv samme server mot Googles agent og sammenlign resultatene.
- Ikke stol blindt på benchmark-tallene. Google publiserte ikke testmetodikken. Kjør dine egne sammenligninger mot OpenAI Deep Research og Perplexity Pro Search på oppgaver du kjenner fasiten på.
- Vurder MCP-eksponering nøye. Å koble en ekstern agent mot interne datakilder betyr at tokenet agenten bruker kan lese alt serveren eksponerer. Sett opp egne MCP-servere med lesetilgang kun der det trengs.