Generador de datos sintéticos para el monitoreo de transacciones con factores de riesgo de lavado de activos

Autor: González Martínez, Edwin Fernando
Přispěvatelé: García Bedoya, Olmer, Granados Erazo, Oscar Mauricio
Jazyk: Spanish; Castilian
Rok vydání: 2021
Předmět:
Zdroj: Expeditio: repositorio UTadeo
Universidad de Bogotá Jorge Tadeo Lozano
instacron:Universidad de Bogotá Jorge Tadeo Lozano
Popis: Las redes neuronales adversarias generativas adversarias (GANs), es un algoritmo de arquitectura de alto nivel que son parte del conjunto de la inteligencia artificial y del aprendizaje automático. Las GANs son dos redes neuronales llamadas generador y discriminador, y estas dos redes neuronales compitan entre si creando así una optimización de los resultados de alta calidad. Las GANs fueron propuestas por Goodfellow en el año 2014 que buscaba otro tipo de enfoque de modelado generativo basado en redes generadoras diferenciables, su amplia aplicación en la tecnología no tiene límites. Su objetivo de aplicación aborda desde imágenes, textos, vídeos, sonidos entre otros. Además, existen una gran variedad de arquitecturas GANs donde busca la optimización dado a su tarea de aprendizaje y desarrollo de aplicación. El objetivo de trabajo de grado constituye en crear una red neuronal de alto nivel como las GANs para la creación de información sintética por medio de ayuda del aprendizaje supervisado. Además, se evalúa con métodos estadísticos multivariantes contrastar hipotéticamente por igualdad de promedios y homogeneidad de varianzas entre la información real y la sintética. Estos métodos científicos estadísticos multivariados permiten que la información sintética generada por las GANs sea de alta calidad y permitan recrear cierta cantidad de información para realizar análisis a gran escala. Además, la información real corresponde a un corresponsal no bancario de una ciudad en Colombia, por cuestiones de confidencialidad no se puede divulgar el nombre de la entidad bancaria y sus clientes. Se cuenta con información transaccional con 67244 registros y 7 variables. Con base a la información real del corresponsal no bancario se genera nueva información sintética por medio de las GANs, y contrastadas estadísticamente sus igualdades en promedios y varianzas. Dado a la información sintética para la identificar posibles casos de lavado de activos donde se quiere identificar patrones y características inusuales para mitigar el lavado de activos. Sin embargo, esto constituye que la información que se genere no puede ser publicada dado a que la información que se está analizando es sintética, por lo tanto, no se puede realizar análisis descriptivos o inferenciales estadísticos de la población. #GeneradorDeDatosSintéticosMonitoreoTransaccionesFactoresRiesgoLavadoDeActivos #GeneradorDeDatosSintéticosFactoresRiesgoLavadoDeActivos #GeneradorDeDatosSintéticosMonitoreoTransaccionesLavadoDeActivos Adversary generative adversary neural networks (GANs), is a high-level architectural algorithm that is part of the set of artificial intelligence and machine learning. The GANs are two neural networks called generator and discriminator, and these two neural networks compete with each other, thus creating a high-quality optimization of the results. GANs were proposed by Goodfellow in 2014, which was looking for another type of generative modeling approach based on differentiable generator networks, its wide application in technology has no limits. Its application objective deals with images, texts, videos, sounds, among others. In addition, there are a wide variety of GANs architectures where you seek optimization given your learning and application development task. The objective of the degree work is to create a high-level neural network such as GANs for the creation of synthetic information through the help of supervised learning. In addition, it is evaluated with multivariate statistical methods to contrast hypothetically for equality of averages and homogeneity of variances between real and synthetic information. These multivariate statistical scientific methods allow the synthetic information generated by the GANs to be of high quality and allow to recreate a certain amount of information for large-scale analysis. In addition, the real information corresponds to a non-bank correspondent from a city in Colombia, for confidentiality reasons the name of the bank and its clients cannot be disclosed. There is transactional information with 67244 records and 7 variables. Based on the real information of the non-bank correspondent, new synthetic information is generated through the GANs, and their equalities in averages and variances are statistically contrasted. Given the synthetic information to identify possible cases of money laundering where you want to identify unusual patterns and characteristics to mitigate money laundering. However, this constitutes that the information generated cannot be published since the information being analyzed is synthetic, therefore, descriptive or inferential statistical analyzes of the population cannot be carried out.
Databáze: OpenAIRE