Website Categorization System using Deep Learning techniques
Autor: | Foix Esteve, Jordi |
---|---|
Přispěvatelé: | Myreach, Rubio Pacho, Enric, Padró, Lluís |
Jazyk: | angličtina |
Rok vydání: | 2023 |
Předmět: |
xarxes neuronals
Deep learning (Machine learning) Deep learning multiclass classification neural networks classificació multiclasse intel·ligència artificial Neural networks (Computer science) Web sites--Classification categorització de pàgines web artifical intelligence Pàgines web--Classificació classificació de pàgines web myReach Xarxes neuronals (Informàtica) Informàtica::Intel·ligència artificial [Àrees temàtiques de la UPC] website classification website categorization Aprenentatge profund |
Popis: | myReach és una startup nascuda el 2018, dedicada a oferir un sistema d'emmagatzematge centralitzat i intel·ligent de dades basat en bases de dades de grafs. La seva aplicació mòbil necessita un recomenador intel·ligent d'etiquetes pels nodes que representen pàgines web. Actualment, no existeix cap eina públicament disponible per a aquesta tasca concreta. Per tant, l'objectiu d'aquesta tesi és implementar un categoritzador multiclasse que pugui donar recomenacions precises a l'usuari sobre el tipus de pàgina web corresponent a una url donada. Tot i que els resultats finals estan lluny de ser ideals, la majoria de la feina realitzada pot ser recuperada i millorada ja sigui mitjançant millors conjunts de dades o tècniques que no han pogut ser aplicades en el context d'aquesta tesi. myReach is a startup born in 2018 dedicated to offering a centralized and smart data storage and management system to the public, based on graph data storage. Its public mobile application needs a smart recommender of tags for the nodes that represent webpages. Currently, no publicly available tool designed for this specific task exists. Thus, the goal of this thesis is to implement an url tag categorizer that can give accurate recommendations to the user on the type of webpage of any saved url. Even though the end results are far from ideal, most of the work done can be reused with better datasets or techniques which could not be applied in this thesis. |
Databáze: | OpenAIRE |
Externí odkaz: |