Implementación de una red neuronal multicapa
Autor: | Sánchez Espunyes, Anna |
---|---|
Přispěvatelé: | Prat Gomà, Josep Joan, Zibar, Darko, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Danmarks tekniske universitet |
Jazyk: | angličtina |
Rok vydání: | 2020 |
Předmět: |
Neural networks (Computer science)
Artificial intelligence machine learning inteligencia artificial neural network Intel·ligència artificial deep learnign aprendizaje automático Aprenentatge automàtic Xarxes neuronals (Informàtica) red neuronal Enginyeria de la telecomunicació [Àrees temàtiques de la UPC] |
Zdroj: | UPCommons. Portal del coneixement obert de la UPC Universitat Politècnica de Catalunya (UPC) |
Popis: | In a world where the amount of data is increasing exponentially, machine learning is viewed as a disruptive technology with the potential to transform areas such as medical diagnosis, musicology, business, and financial sciences. This massive growth and the high investments have led to the creation of libraries that help building models easily, without getting into the details of the underlying algorithms. The goal of this thesis is to develop a multi-layer neural network from scratch without using libraries in order to understand the principles of the underlying algorithms. This thesis covers all the steps in this process, from an overview of the fundamentals to a deep explanation of the algorithms used. After going over the motivation of the project, the document tackles the regression problem, introducing relevant concepts. After this, the thesis explores different sequential learning techniques and goes in depth into the extreme learning machine and the back-propagation algorithm. The central part of the project is focused on the results obtained from coding the different algorithms presented from scratch. The results do not only compare the algorithms but also give meaningful insights on how to choose parameters in the models. En un mundo donde la cantidad de datos disponibles aumenta exponencialmente, el aprendizaje automático o Machine learning es visto como una tecnología disruptiva que tiene la capacidad de transformar sectores tan diferentes como las finanzas, la medicina o la musicología. Este crecimiento y la gran cantidad de inversiones han llevado a la creación de programotecas que ayudan a crear modelos fácilmente sin la necesidad de entender los algoritmos subyacentes. El objetivo de este trabajo es desarrollar una red neuronal multicapa sin usar librerías informáticas, entendiendo los fundamentos de los algoritmos que componen el conjunto. Este proyecto abarca todos los pasos del proceso, desde una visión general del problema hasta una explicación detallada de los algoritmos. Después de describir la motivación de la tesis, el documento explora el problema de regresión, profundizando en los conceptos más relevantes del aprendizaje automático. A continuación, se introducen técnicas de aprendizaje secuencial, así como las máquinas de aprendizaje extremo y el algoritmo de retropropagación. La parte central del proyecto se focaliza en los resultados obtenidos en el desarrollo de los diferentes algoritmos presentados. Aparte de compararlos, el trabajo también analiza cómo seleccionar los parámetros que componen cada modelo. En un món on la quantitat de dades disponibles augmenta exponencialment, l'aprenentatge automàtic o Machine learning és vist com una tecnologia disruptiva que té la capacitat de transformar sectors tan diversos com les finances, la medicina o la musicologia. Aquest creixement i la gran quantitat d'inversions han portat a la creació de programoteques que ajuden a crear models fàcilment sense la necessitat d'entendre els algoritmes subjacents. L'objectiu d'aquest treball és desenvolupar una xarxa neuronal multicapa sense utilitzar biblioteques informàtiques, entenent els fonaments dels algoritmes que componen el conjunt. Aquest projecte engloba tots els passos del procés, des d'una visió general del problema fins a una explicació detallada dels algoritmes utilitzats. Després de descriure la motivació de la tesi, el document explora el problema de regressió, aprofundint en els conceptes més rellevants de l'aprenentatge automàtic. A continuació, s'introdueixen tècniques d'aprenentatge seqüencial, així com les màquines d'aprenentatge extrem i l'algoritme de retropropagació. La part central del projecte es focalitza en els resultats obtinguts desenvolupant els diferents algoritmes presentats. A part de comparar-los, el treball també analitza la tria dels paràmetres que componen cada model. |
Databáze: | OpenAIRE |
Externí odkaz: |