On the number of k-skip-n-grams

Autor: Krasnoshtan, Dmytro
Rok vydání: 2019
Předmět:
Druh dokumentu: Working Paper
Popis: The paper proves that the number of k-skip-n-grams for a corpus of size $L$ is $$\frac{Ln + n + k' - n^2 - nk'}{n} \cdot \binom{n-1+k'}{n-1}$$ where $k' = \min(L - n + 1, k)$.
Comment: 2 pages
Databáze: arXiv