A Confidence Measure for Deep Convolutional Neural Network Regressors
Autor: | Samuelsson, Elin |
---|---|
Jazyk: | angličtina |
Rok vydání: | 2020 |
Předmět: | |
Druh dokumentu: | Text |
Popis: | Deep convolutional neural networks can be trained to estimate gaze directions from eye images. However, such networks do not provide any information about the reliability of its predictions. As uncertainty estimates could enable more accurate and reliable gaze tracking applications, a method for confidence calculation was examined in this project. This method had to be computationally efficient for the gaze tracker to function in real-time, without reducing the quality of the gaze predictions. Thus, several state-of-the-art methods were abandoned in favor of Mean-Variance Estimation, which uses an additional neural network for estimating uncertainties. This confidence network is trained based on the accuracy of the gaze rays generated by the primary network, i.e. the prediction network, for different eye images. Two datasets were used for evaluating the confidence network, including the effect of different design choices. A main conclusion was that the uncertainty associated with a predicted gaze direction depends on more factors than just the visual appearance of the eye image. Thus, a confidence network taking only this image as input can never model the regression problem perfectly. Despite this, the results show that the network learns useful information. In fact, its confidence estimates outperform those from an established Monte Carlo method, where the uncertainty is estimated from the spread of gaze directions from several prediction networks in an ensemble. Djupa faltningsnätverk kan tränas till att uppskatta blickriktningar utifrån ögonbilder. Sådana nätverk ger dock ingen information om hur pålitliga dess prediktioner är. Eftersom osäkerhetsskattningar skulle möjliggöra mer exakta och robusta tillämpningar har en metod för konfidensestimering undersökts i detta projekt. Denna metod behövde vara beräkningsmässigt effektiv för att kunna följa en blickriktning i realtid utan att reducera kvaliteten på blickriktningarna. Således valdes flera etablerade tillvägagångssätt bort till fördel för medelvärdes- och variansestimering, där ytterligare ett nätverk används för att estimera osäkerheter. Detta konfidensnätverk tränas baserat på hur bra blickriktningar det första nätverket, kallat prediktionsnätverket, genererar för olika ögonbilder. Två dataset användes för att utvärdera konfidensnätverket, inklusive effekten av olika sätt att designa det. En viktig slutsats var att osäkerheten hos en predicerad blickriktning beror av fler faktorer än bara ögonbildens utseende. Därför kommer ett konfidensnätverk med endast denna bild som indata aldrig kunna modellera regressionsproblemet perfekt. Trots detta visar resultaten att nätverket lär sig användbar information. Dess konfidensskattningar överträffar till och med dem från en etablerad Monte Carlo-metod, där osäkerheten skattas utifrån spridningen av blickriktningar från en samling prediktionsnätverk. |
Databáze: | Networked Digital Library of Theses & Dissertations |
Externí odkaz: |