Mètodes de deep learning per l'anotació multimodal de persones en seqüències de vídeo
Autor: | Folch, Arnau|||0000-0002-0677-6366 |
---|---|
Přispěvatelé: | Morros Rubió, Josep Ramon |
Jazyk: | Catalan; Valencian |
Rok vydání: | 2018 |
Předmět: | |
Zdroj: | UPCommons. Portal del coneixement obert de la UPC Universitat Politècnica de Catalunya (UPC) |
Popis: | The purpose of this project is to focus in exploring deep learning methods for multimodal person recognition in video sequences. The project will be carried out in the context of unsupervised person annotation systems for broadcast TV programs. Person annotation aims to determining who and where appears in a video sequence. We decide to improve the detection, recognition and track of the text in that systems. We examine different techniques and implementations obtaining a great results for each block of the project and this evaluations gives us some future developments to improve more the system. El propósito de este proyecto es centrarse en la exploración de métodos de aprendizaje profundo para el reconocimiento de personas multimodales en secuencias de video. El proyecto se llevará a cabo en el contexto de sistemas de anotación de personas no supervisadas para programas de televisión abierta. La anotación de personas pretende determinar quién y dónde aparece en una secuencia de video. Decidimos mejorar la detección, el reconocimiento y el seguimiento de texto en esos sistemas. Examinamos diferentes técnicas e implementaciones obteniendo buenos resultados para cada bloque del proyecto y estas evaluaciones nos han permitido obtener ideas de desarrollos futuros para mejorar más el sistema. El propòsit d'aquest projecte és centrar-se en l'exploració de mètodes d'aprenentatge profund per al reconeixement de persones multimodals en seqüències de vídeo. El projecte es durà a terme en el context de sistemes d'anotació de persones sense supervisió per a programes de televisió de difusió. L'anotació de persones té com a finalitat determinar qui i on apareix en una seqüència de vídeo. Vam decidir millorar la detecció, el reconeixement i el seguiment de text en aquests sistemes. Examinem diferents tècniques i implementacions obtenint uns bons resultats per a cada bloc del projecte i aquestes avaluacions ens aporten alguns desenvolupaments futurs per millorar el sistema. |
Databáze: | OpenAIRE |
Externí odkaz: |