Clustering Faces from the National Archives of Estonia

Autor: van Gent, Jan Aare
Přispěvatelé: Tambet Matiisen
Jazyk: angličtina
Rok vydání: 2018
Popis: Eesti Rahvusarhiivi kogud sisaldavad sadu tuhandeid digiteeritud pilte, kuid enamik isikuid nendel piltidel on märgendamata. Käsitsi märgendamise lihtsustamiseks pakutakse töös välja automaatse märgendamise süsteem, mis põhineb piltidelt tuvastatud nägudel. Iga leitud näo jaoks leitakse tehisnärvivõrkude abil tunnusvektor ning need tunnusvektorid klasterdatakse eukleidilise kauguse alusel. Töös on realiseeritud süsteemi prototüüp, mis sisaldab näotuvastust, klasterdamist ja märgendite automaatset määramist. Lisaks hinnati klasterdusalgoritmi parameetriks oleva raadiuse mõju tekkivate klastrite ühetaolisusele ja täielikkusele. Samuti hinnati protsessi erinevates etappides kasutatud aja ning mälu sõltuvust piltide arvust. Töö sisaldab ülevaadet näotuvastuse, näopunktide määramise, nägude joondamise, tunnuste eraldamise, klasterdamise ning automaatse märgendamise meetoditest.
The National Archives of Estonia contains hundreds of thousands of images, where many of the people are unlabeled. To assist manual labeling, a label prediction system is proposed that detects faces from images and uses an artificial neural network to generate a representation for each face in the form of a feature vector. These feature vectors can be clustered using euclidean distances since similar faces produce feature vectors that are close to each other in feature space. In this thesis, a proof-of-concept of the pipeline for face clustering and label prediction was created. Clustering results were evaluated with different clustering parameters and stages of the pipeline were profiled in terms of time taken for execution and average memory consumption. A survey of different methods for face detection, shape prediction, face alignment, feature extraction, clustering, and labeling was also presented.
Databáze: OpenAIRE