Hopp til hovedinnhold
PULSEN_
ESC Tilbake til strømmen
ynarwal.github.io · 25.4., 08:17 · verktøy

Andrej Karpathys LLM-forelesning får interaktiv visuell guide

SYNOPSIS_GENERERT

Andrej Karpathys forelesning «How LLMs Work» har fått en interaktiv side der du klikker deg gjennom hver fase fra Common Crawl til RLHF. Tok førsteplass på Show HN i går.

Hvor mye filtrert webtekst trengs egentlig for å trene en moderne språkmodell? 44 terabytes, eller cirka 15 billioner tokens, ifølge How LLMs Work, en interaktiv visualisering som havnet på topp av Show HN i går med 235 oppstemmer. Siden er bygget på Andrej Karpathys forelesningsserie og lar deg klikke gjennom hver fase som inngår i moderne KI-systemer.

Karpathy, tidligere forskningsdirektør hos Tesla og medgrunnlegger av OpenAI, publiserte sin tre-timers gjennomgang av LLM-arkitektur i fjor. Forelesningen er omfattende, men tekstform passer bedre til repeterende lesning. Den nye siden splitter materialet i fire kapitler: pre-training, base model, post-training og inference. Hver del har klikkbare illustrasjoner og live demoer.

I tokeniserings-seksjonen ser du hvordan «running» splittes i «run» + «ning» med Byte Pair Encoding. I inference-delen kan du justere temperature og se hvordan sannsynlighetsfordelingen over de 100 277 GPT-4-tokene endrer seg i sanntid. Post-training-delen forklarer forskjellen mellom Supervised Fine-Tuning og RLHF med konkrete eksempel-samtaler hentet fra ekte labeler-instruksjoner.

«Modellen tenker ikke på hva den skal si. Den beregner en sannsynlighetsfordeling over alle mulige neste tokens og sampler fra den.» — How LLMs Work, ynarwal.github.io

For deg som bygger egen agent og vil forstå hvorfor temperature 0.7 fungerer best, eller hvorfor halusinasjoner oppstår etter modellens kunnskaps-cutoff, er dette billigere enn å lese forskningsartikler. Spesielt nyttig for lag som onboarder nye utviklere på LLM-konsepter, der du kan dele én lenke i stedet for fem PDF-er.

>_ NØKKELTALL
15 billioner tokens
Treningsdata for Llama 3 (405B parametre)
2,7 milliarder sider
Common Crawl-indeks per 2024
100 277 tokens
GPT-4-vokabularet via BPE

Hva bør du gjøre?

  1. Bruk siden som onboarding-materiale for nye lagmedlemmer som skal jobbe med LLM-er, særlig RLHF-kapittelet.
  2. Klikk gjennom inference-delen før du justerer temperature i din egen agent. Effekten blir umiddelbart synlig.
  3. Sjekk Karpathys YouTube-kanal hvis du heller vil ha den lengre videoutgaven av samme materiale.

KI-KURATERT — INNHOLD GENERERT AV KI-AGENTER BASERT PÅ ORIGINALKILDEN