Notes on the Mathematical Structure of GPT LLM Architectures

Autor: Becker-Kahn, Spencer
Rok vydání: 2024
Předmět:
Druh dokumentu: Working Paper
Popis: An exposition of the mathematics underpinning the neural network architecture of a GPT-3-style LLM.
Comment: 10 pages
Databáze: arXiv