Website Categorization System using Deep Learning techniques

Autor: Foix Esteve, Jordi
Přispěvatelé: Myreach, Rubio Pacho, Enric, Padró, Lluís
Jazyk: angličtina
Rok vydání: 2023
Předmět:
Popis: myReach és una startup nascuda el 2018, dedicada a oferir un sistema d'emmagatzematge centralitzat i intel·ligent de dades basat en bases de dades de grafs. La seva aplicació mòbil necessita un recomenador intel·ligent d'etiquetes pels nodes que representen pàgines web. Actualment, no existeix cap eina públicament disponible per a aquesta tasca concreta. Per tant, l'objectiu d'aquesta tesi és implementar un categoritzador multiclasse que pugui donar recomenacions precises a l'usuari sobre el tipus de pàgina web corresponent a una url donada. Tot i que els resultats finals estan lluny de ser ideals, la majoria de la feina realitzada pot ser recuperada i millorada ja sigui mitjançant millors conjunts de dades o tècniques que no han pogut ser aplicades en el context d'aquesta tesi. myReach is a startup born in 2018 dedicated to offering a centralized and smart data storage and management system to the public, based on graph data storage. Its public mobile application needs a smart recommender of tags for the nodes that represent webpages. Currently, no publicly available tool designed for this specific task exists. Thus, the goal of this thesis is to implement an url tag categorizer that can give accurate recommendations to the user on the type of webpage of any saved url. Even though the end results are far from ideal, most of the work done can be reused with better datasets or techniques which could not be applied in this thesis.
Databáze: OpenAIRE