Clasificación automática de imágenes en aplicaciones sobre viviendas
Autor: | Ramón Arcoiza, David |
---|---|
Přispěvatelé: | Martín Muñoz, Mario, Universitat Politècnica de Catalunya. Departament de Ciències de la Computació |
Jazyk: | Spanish; Castilian |
Rok vydání: | 2018 |
Předmět: |
Neural networks (Computer science)
Clasificación de escenas y objetos en imágenes Informàtica [Àrees temàtiques de la UPC] Redes neuronales densas y convolucionales Visió per ordinador Visión computerizada Xarxes neuronals (Informàtica) Computer vision Dense convolutional and neural networks Scene and object classification |
Zdroj: | UPCommons. Portal del coneixement obert de la UPC Universitat Politècnica de Catalunya (UPC) Recercat. Dipósit de la Recerca de Catalunya instname |
Popis: | [CASTELLÀ] La clasificación de escenas es uno de las tareas más importantes en el campo de la visión computerizada. La existencia de grandes bases de datos etiquetadas y el aumento de las capacidades de computación permiten aplicar las técnicas necesarias para tener éxito. A diferencia del reconocimiento de objetos, en el que se han producido importantes avances, en el campo del reconocimiento de escenas aún hay una importante posibilidad de mejora. La escena se encuentra en un nivel de abstracción superior al estar compuesta por objetos y un entorno que pueden relacionarse de múltiples formas. Se ha desarrollado un modelo que clasifica imágenes en función de la escena representada aprovechando las características y capacidades predictivas de redes convolucionales especializadas en la detección de objetos. Se han evaluado también las capacidades de clasificación en base a las formas básicas activadas en dichas redes. La alta efectividad mostrada por los modelos en los análisis previos, inicialmente ajustados clasificar cuatro clases indoor, sugiere que se pueda ampliar el alcance del trabajo de forma que incorpore la clasificación de las clases outdoor del dataset escogido, así se hace con objeto de adquirir mayor conocimiento en este campo. El trabajo realizado se ha mostrado eficaz, produciendo modelos con una precisión cercana al 86% y 90% respectivamente sobre un total de 10 clases distintas: bedroom, bridge, church outdoor, classroom, conference room, dining room, kitchen, living room, restaurant y tower. Se ha analizado los modelos para entender sus predicciones, para ello se ha medido la relevancia de cada una de las características para cada clase, asimismo se ha detallado el error producido, se ayuda con ello a entender el proceso de visitón computerizada en este caso. [ANGLÈS] Scene classification is one of the most challenging tasks in computer vision. Huge labelled databases availability and high computational capabilities are the key aspects in order for the required techniques to be applied successfully to achieve such task. As opposed to object recognition, which has seen significant improvements, there is still work to do in scene classification in order to increase its capabilities. Scene is one abstraction level over objects because it’s a composition of objects itself, an environment and the relationships established between them. This work developed a model capable of successfully classify scene images leveraging the benefits of deep convolutional networks object recognition capabilities. In addition, traditional convolutional shapes provided by such networks have been used to fit another model in order to compare their results. High effectiveness shown by preliminary tests, initially adjusted to classify four indoor classes, suggests that the scope of the work is able to be extended to outdoor classes of the chosen dataset, as a result, more knowledge will be acquired in this field. This manuscript demonstrates the concept capabilities, which produced models with accuracies of 86% and 90%, respectively, over 10 different classes: bedroom, bridge, church outdoor, classroom, conference room, dining room, kitchen, living room, restaurant and tower. In order to understand the involved computer vision process, both models have been analysed to understand its errors and predictions; to do that, class predictions and feature relevance over such classes have been individually measured. |
Databáze: | OpenAIRE |
Externí odkaz: |