Automatització d'un procés de tractament documental
Autor: | Carrera Rial, Laura |
---|---|
Přispěvatelé: | Universitat Politècnica de Catalunya. Departament de Ciències de la Computació, Sànchez-Marrè, Miquel, Garrido Miñambres, Daniel |
Jazyk: | Catalan; Valencian |
Rok vydání: | 2023 |
Předmět: |
Aprenentatge Automàtic
Externalització de Processos de Negoci Xarxes Neuronals Convolucionals Informàtica::Intel·ligència artificial::Aprenentatge automàtic [Àrees temàtiques de la UPC] Regular Expressions Visió per Computador Expressions Regulars Computer Vision Convolutional Neural Networks Visió per ordinador Automatic Document Processing Buisness Process Outsourcing Extracció de dades Machine Learning Data Extraction Natural language processing (Computer science) Tractament Automàtic Documental Processament de Llenguatge Natural Classificació documental Document Classification Tractament del llenguatge natural (Informàtica) Natural Language Processing |
Popis: | Les empreses d'avui en dia necessiten una gran quantitat d'informació per portar a terme qualsevol dels seus processos interns. El creixent volum de la documentació i el temps dedicat a la cerca d'informació en documents per part dels treballadors fa imprescindible la implementació de sistemes de gestió documental, per tal d'optimitzar totes aquestes tasques intermèdies. Un gran nombre d'entitats financeres es veuen amb la necessitat d'automatitzar tots aquells tràmits documentals essencials per conèixer certa informació dels seus clients. A l'hora de concedir o denegar qualsevol préstec és primordial disposar de tota la informació personal i econòmica respectiva a aquell client en particular. Aquestes dades es troben encapsulades en documents com per exemple: nòmines, declaracions de la renda, factures, etcètera. Tot el procés respectiu a l'extracció manual de dades comporta un cost temporal alt, i en conseqüència, una major espera en la concessió o denegació del préstec. Per aquest motiu, moltes d'aquestes empreses busquen solucions enfocades en l'automatització d'aquests processos documentals. Aquest projecte té com a objectiu suplir aquestes necessitats, construint un sistema automàtic capaç de portar a terme la classificació de certes tipologies documentals i l'extracció de camps específics. Aquest mòdul ha de ser capaç de retornar totes aquelles dades que necessitin els equips de gestió de riscos i scoring de l'entitat financera per concedir o denegar els préstecs sol·licitats. Estudiant les diferents tècniques i mètodes existents, i tenint en compte totes les opcions possibles, s'opta per la implementació d'un sistema de processament intel·ligent particular adaptat al problema a resoldre. S'apliquen tècniques d'Aprenentatge Automàtic (CNN) per classificar els diferents tipus documentals considerats. A més a més, s'empren mètodes d'extracció textual seguint estratègies específiques, amb la finalitat de maximitzar l'extracció de dades a partir del procés automàtic. Today's companies need a lot of information to carry out any of their internal processes. The increasing volume of documentation and the time spent searching for information in documents by workers makes it essential to implement document management systems, in order to optimize all these intermediate tasks. Numerous financial institutions are faced with the need to automate all those essential documentary processes in order to know certain information of their customers. When granting or denying any loan, it is essential to have all the personal and economic information regarding that particular client. These data are encapsulated in documents such as: payrolls, income statements, invoices, etc. The whole process of extracting data manually involves a high time cost, and consequently, a longer wait in the granting or refusal of the loan. For this reason, many companies are looking for solutions focused on the automation of these documentary processes. This project aims to meet these needs, building an automatic system capable of performing the classification of certain documentary typologies and the extraction of specific fields. This module must be able to return all the data needed by the financial institution's risk management and scoring teams to grant or deny the requested loans. By studying the different techniques and methods available, and taking into account all possible options, we opt for the implementation of a particular intelligent processing system adapted to the problem to be solved. Machine Learning (CNN) techniques are applied to classify the different documentary types considered. In addition, textual extraction methods are used following specific strategies, with the aim of maximizing the extraction of data from the automatic process. |
Databáze: | OpenAIRE |
Externí odkaz: |