Semantic labelling of objects in street scenes
Autor: | Wittmann, Andreas |
---|---|
Jazyk: | angličtina |
Rok vydání: | 2019 |
Předmět: | |
DOI: | 10.34726/hss.2019.58605 |
Popis: | Um Fahrassistenzsysteme zu verbessern und um vollst��ndiges autonomes Fahren zu erm��glichen, ist eine automatische, robuste semantische Interpretation von Stra��enszenen notwendig. J��ngste Publikationen erzielten bemerkenswerte Ergebnisse im Bereich semantischer Segmentierung mittels Deep Learning. Die Berechnung von Neuronalen Netzen ist jedoch rechenintensiv. Klassische Machine Learning Ans��tze k��nnen diesen Rechenaufwand verringern und zus��tzlich die Komplexit��t der Algorithmen reduzieren. In dieser Diplomarbeit geben wir zun��chst einen umfassenden Literatur��berblick ��ber bestehende, klassische Machine Learning Ans��tze zur semantischen Szenensegmentierung. Der Schwerpunkt liegt dabei auf Ans��tzen, die sich mit der semantischen Segmentierung von Stra��enszenen befassen. Des Weiteren vergleichen wir pixelweise annotierte, frei verf��gbare Stra��enszenendatens��tze, die f��r das Trainieren und Evaluieren von semantischen Segmentierungsalgorithmen verwendet werden k��nnen. Im Hauptteil der Arbeit beschreiben wir die Entwicklung und Implementierung unseres Systems f��r semantische Szenensegmentierung. Wir implementieren zwei texturund kontext-basierte Features, welche on-the-fly in einem Random Forest berechnet werden. Wir evaluieren ausf��hrlich den Einfluss der einzelnen Featureparameter und Random Forestparameter auf die Segmentierungsergebnisse und vergleichen die Performance beider Features. Unsere Ergebnisse zeigen, dass texturbasierte Features, welche in semantisch unzusammenh��ngenden Kontextbereichen zur Klassifizierung von Pixeln betrachtet werden, nicht ausreichend Information beinhalten, um kleine Objekte in anspruchsvollen Stra��enszenen robust zu erkennen. Wir kommen zu dem Schluss, dass durch das Extrahieren zus��tzlicher Features und einer Vorsegmentierung des Bildes in zusammenh��ngende Kontextbereiche die Klassifizierungsergebnisse vermutlich verbessert werden k��nnten. An automatic and robust semantic interpretation of street scenes is required in order to improve driving assistance systems and to reach fully autonomous driving. Recent publications achieved remarkable prediction performances by using Deep Learning. However, the calculation of Neural Networks is computationally demanding. Classical Machine Learning approaches can reduce the complexity of the algorithms and computational demand. In this diploma thesis, we first give a comprehensive literature review of classical machine learning approaches for semantic scene labelling with a focus on street scenes. Furthermore, we compare pixel-wise annotated, freely available datasets of street scenes for the training and evaluation of semantic scene labelling algorithms. The main part of this thesis documents the development and implementation of our semantic scene labelling system. We implement two textureand context-based features and calculate them on-the-fly in a random forest. We extensively evaluate the influence of the feature parameters and random forest parameters on the prediction results and compare the performance of both features. Our results show that textural features in semantically unconnected regions fail to robustly detect small objects in challenging street scenes. Providing additional information by using a combination of multiple features and a pre-segmentation of the image in semantically connected regions could possibly improve the prediction results. |
Databáze: | OpenAIRE |
Externí odkaz: |