Sound analysis oh the environment for healthcare and recognition of daily life activities for the elderly

Autor:	Robin, Maxime
Přispěvatelé:	STAR, ABES
Jazyk:	francouzština
Rok vydání:	2018
Předmět:	Paramètres acoustiques [INFO.INFO-OH] Computer Science [cs]/Other [cs.OH] Remarkable Energy Rate (RER) Acoustic parameters Classiﬁcation in noisy environments Reconnaissance de sons [SPI.MECA.BIOM] Engineering Sciences [physics]/Mechanics [physics.med-ph]/Biomechanics [physics.med-ph] Sounds recognition I-vecteurs Classiﬁcation en milieux bruités Deep learning I-vectors Réseau de neurones profonds
Popis:	The average age of the French and European population is increasing; this observation brings new technical and societal challenges. Older people are the most fragile and vulnerable, especially in terms of domestic accidents and speciﬁcally falls. This is why many elderly people care projects : technical, academic and commercial have seen the light of day in recent years. This thesis work wasc arried out under Cifre agreement, jointly between the company KRG Corporate and the BMBI laboratory (Biomechanics and Bioengineering) of the UTC (Université of Technologie of Compiègne). Its purpose is to oﬀer a sensor for sound recognition and everyday activities, with the aim of expanding and improving the tele-assistance system already marketed by the company. Several speech recognition or speaker recognition methods have already been proven in the ﬁeld of sound recognition, including GMM (Modèle de mélange gaussien – Gaussian Mixture Model), SVM-GSL (Machine à vecteurs de support, GMM-super-vecteur à noyau linéaire – Support vector machine GMM Supervector Linear kernel) and HMM (Modèle de Markov caché – Hidden Markov Model). In the same way, we proposed to use i-vectors for sound recognition. I-Vectors are used in particular in speaker recognition, and have revolutionized this ﬁeld recently. Then we broadened our spectrum, and used Deep Learning, which currently gives very good results in classiﬁcation across all domains. We ﬁrst used them to reinforce the i-vectors, then we used them as our exclusive classiﬁcation system. The methods mentioned above were also tested under noisy and then real conditions. These diﬀerent experiments gaves us very satisfactory recognition rates, with neural networks as reinforcement for i-vectors and neural networks alone being the most accurate systems, with a very signiﬁcant improvement compared to the various speech and speaker recognition systems. L’âge moyen de la population française et européenne augmente, cette constatation apporte de nouveaux enjeux techniques et sociétaux, les personnes âgées étant les personnes les plus fragiles et les plus vulnérables, notamment du point de vue des accidents domestiques et en particulier des chutes. C’est pourquoi de nombreux projets d’aide aux personnes âgées : techniques, universitaires et commerciaux ont vu le jour ces dernières années. Ce travail de thèse a été eﬀectué sous convention Cifre, conjointement entre l’entreprise KRG Corporate et le laboratoire BMBI (Biomécanique et Bio-ingénierie) de l’UTC (Université de technologie de Compiègne). Elle a pour objet de proposer un capteur de reconnaissance de sons et des activités de la vie courante, dans le but d’étoﬀer et d’améliorer le système de télé-assistance déjà commercialisé par la société. Plusieurs méthodes de reconnaissance de parole ou de reconnaissance du locuteur ont déjà été éprouvées dans le domaine de la reconnaissance de sons, entre autres les techniques : GMM (Modèle de mélange gaussien–Gaussian Mixture Model), SVM-GSL (Machine à vecteurs de support, GMM-super-vecteur à noyau linéaire – Support vector machine GMM Supervector Linear kernel) et HMM (Modèle de Markov caché – Hidden Markov Model). De la même manière, nous nous sommes proposés d’utiliser les i-vecteurs pour la reconnaissance de sons. Les i-vecteurs sont utilisés notamment en reconnaissance de locuteur, et ont révolutionné ce domaine récemment. Puis nous avons élargi notre spectre, et utilisé l’apprentissage profond (Deep Learning) qui donne actuellement de très bon résultats en classiﬁcation tous domaines confondus. Nous les avons tout d’abord utilisés en renfort des i-vecteurs, puis nous les avons utilisés comme système de classiﬁcation exclusif. Les méthodes précédemment évoquées ont également été testées en conditions bruités puis réelles. Ces diﬀérentes expérimentations nous ont permis d’obtenir des taux de reconnaissance très satisfaisants, les réseaux de neurones en renfort des i-vecteurs et les réseaux de neurones seuls étant les systèmes ayant la meilleure précision, avec une amélioration très signiﬁcative par rapport aux diﬀérents systèmes issus de la reconnaissance de parole et de locuteur.
Databáze:	OpenAIRE
Externí odkaz:	https://explore.openaire.eu/search/publication?articleId=od_______166::1f5bbdc731af9d8ce2b0ad2069f1aeae https://theses.hal.science/tel-01986180 Zobrazit plný text záznamu