Notes on the Mathematical Structure of GPT LLM Architectures
Autor: | Becker-Kahn, Spencer |
---|---|
Rok vydání: | 2024 |
Předmět: | |
Druh dokumentu: | Working Paper |
Popis: | An exposition of the mathematics underpinning the neural network architecture of a GPT-3-style LLM. Comment: 10 pages |
Databáze: | arXiv |
Externí odkaz: |