Dimensionality Reduction of Massive Datasets Using Eigenvectors

Autor: Šimić, Lucija Josipa
Přispěvatelé: Vladimir, Klemo
Jazyk: chorvatština
Rok vydání: 2020
Předmět:
Popis: U ovom radu opisuju se glavne značajke redukcije dimenzionalnosti. Objašnjeni su svojstveni vektori i svojstvene vrijednosti i dva načina njihovog računanja. Razmatra se analiza glavnih komponenti, metoda redukcije dimenzionalnosti koja koristi svojstvene vektore za pronalaženje glavnih komponenti. Metoda je implementirana u programskom jeziku Python, prvo na jednostavnom skupu podataka, a zatim pomoću biblioteke Scikit-Learn na skupu podataka Iris. Na kraju su opisane neke moguće primjene analize glavnih podataka. In this paper we describe the main features of dimensionality reduction. We go trough an explanation of eigenvectors and eigenvalues and two methods of their calculation. We consider principal component analysis, a method of dimensionality reduction that uses eigenvectors to find principal components. The method is implemented in the Python programming language, first on a simple dataset, and then using the Scikit-Learn library on the Iris dataset. Finally, some possible applications of principal component analysis are described.
Databáze: OpenAIRE