Towards a Practical Silent Speech Interface Based on Vocal Tract Imaging

Autor: Denby, B., Cai, J., Hueber, T., Roussel, P., Dreyfus, G., Crevier-Buchman, L., Claire Pillot-Loiseau, Chollet, G., Manitsaris, S., Stone, M.
Přispěvatelé: Laboratoire Signaux, Modèles et Apprentissage Statistique (SIGMA), Ecole Superieure de Physique et de Chimie Industrielles de la Ville de Paris (ESPCI Paris), Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-Centre National de la Recherche Scientifique (CNRS), GIPSA - Machines parlantes, Gestes oro-faciaux, Interaction Face-à-face, Communication augmentée (GIPSA-MAGIC), Département Parole et Cognition (GIPSA-DPC), Grenoble Images Parole Signal Automatique (GIPSA-lab), Université Stendhal - Grenoble 3-Université Pierre Mendès France - Grenoble 2 (UPMF)-Université Joseph Fourier - Grenoble 1 (UJF)-Institut polytechnique de Grenoble - Grenoble Institute of Technology (Grenoble INP )-Centre National de la Recherche Scientifique (CNRS)-Université Stendhal - Grenoble 3-Université Pierre Mendès France - Grenoble 2 (UPMF)-Université Joseph Fourier - Grenoble 1 (UJF)-Institut polytechnique de Grenoble - Grenoble Institute of Technology (Grenoble INP )-Centre National de la Recherche Scientifique (CNRS)-Grenoble Images Parole Signal Automatique (GIPSA-lab), Université Stendhal - Grenoble 3-Université Pierre Mendès France - Grenoble 2 (UPMF)-Université Joseph Fourier - Grenoble 1 (UJF)-Institut polytechnique de Grenoble - Grenoble Institute of Technology (Grenoble INP )-Centre National de la Recherche Scientifique (CNRS)-Université Stendhal - Grenoble 3-Université Pierre Mendès France - Grenoble 2 (UPMF)-Université Joseph Fourier - Grenoble 1 (UJF)-Institut polytechnique de Grenoble - Grenoble Institute of Technology (Grenoble INP )-Centre National de la Recherche Scientifique (CNRS), LPP - Laboratoire de Phonétique et Phonologie - UMR 7018 (LPP), Université Sorbonne Nouvelle - Paris 3-Centre National de la Recherche Scientifique (CNRS), Hôpital Européen Georges Pompidou [APHP] (HEGP), Assistance publique - Hôpitaux de Paris (AP-HP) (AP-HP)-Hôpitaux Universitaires Paris Ouest - Hôpitaux Universitaires Île de France Ouest (HUPO), Laboratoire Traitement et Communication de l'Information (LTCI), Télécom ParisTech-Institut Mines-Télécom [Paris] (IMT)-Centre National de la Recherche Scientifique (CNRS), Vocal Tract Visualization Lab [Baltimore] (VTVL), University of Maryland School of Dentistry [Baltimore] (UMSOD), University of Maryland System-University of Maryland System, David Ostry, Shari R. Baum, Lucie Ménard & Vincent L. Gracco, ANR-11-IDEX-0005,USPC,Université Sorbonne Paris Cité(2011), SIGMA Laboratory, ESPCI ParisTech, CNRS-UMR 7084 ( SIGMA Laboratory, ESPCI ParisTech ), ESPCI ParisTech, MAGIC ( GIPSA-MAGIC ), Département Parole et Cognition ( GIPSA-DPC ), Grenoble Images Parole Signal Automatique ( GIPSA-lab ), Université Pierre Mendès France - Grenoble 2 ( UPMF ) -Université Stendhal - Grenoble 3-Université Joseph Fourier - Grenoble 1 ( UJF ) -Institut Polytechnique de Grenoble - Grenoble Institute of Technology-Centre National de la Recherche Scientifique ( CNRS ) -Université Grenoble Alpes ( UGA ) -Université Pierre Mendès France - Grenoble 2 ( UPMF ) -Université Stendhal - Grenoble 3-Université Joseph Fourier - Grenoble 1 ( UJF ) -Institut Polytechnique de Grenoble - Grenoble Institute of Technology-Centre National de la Recherche Scientifique ( CNRS ) -Université Grenoble Alpes ( UGA ) -Grenoble Images Parole Signal Automatique ( GIPSA-lab ), Université Pierre Mendès France - Grenoble 2 ( UPMF ) -Université Stendhal - Grenoble 3-Université Joseph Fourier - Grenoble 1 ( UJF ) -Institut Polytechnique de Grenoble - Grenoble Institute of Technology-Centre National de la Recherche Scientifique ( CNRS ) -Université Grenoble Alpes ( UGA ) -Université Pierre Mendès France - Grenoble 2 ( UPMF ) -Université Stendhal - Grenoble 3-Université Joseph Fourier - Grenoble 1 ( UJF ) -Institut Polytechnique de Grenoble - Grenoble Institute of Technology-Centre National de la Recherche Scientifique ( CNRS ) -Université Grenoble Alpes ( UGA ), LPP - Laboratoire de Phonétique et Phonologie - UMR 7018 ( LPP ), Université Sorbonne Nouvelle - Paris 3-Centre National de la Recherche Scientifique ( CNRS ), Hôpital Européen Georges Pompidou [APHP] ( HEGP ), Laboratoire Traitement et Communication de l'Information ( LTCI ), Télécom ParisTech-Institut Mines-Télécom [Paris]-Centre National de la Recherche Scientifique ( CNRS ), Vocal Tract Visualization Lab [Baltimore] ( VTVL ), University of Maryland School of Dentistry [Baltimore] ( UMSOD ), David Ostry, Shari R. Baum, Lucie Ménard & Vincent L. Gracco, ANR-10-LABX-0083,Labex EFL,Programme 'Investissements d’avenir' géré par l’Agence Nationale de la Recherche ANR-10-LABX-0083 (Labex EFL), Lo Bue, Gwénaëlle, Université Sorbonne Paris Cité - - USPC2011 - ANR-11-IDEX-0005 - IDEX - VALID
Jazyk: angličtina
Rok vydání: 2011
Předmět:
Zdroj: ISSP 2011-9th International Seminar on Speech Production
ISSP 2011-9th International Seminar on Speech Production, Jul 2011, Montréal, Canada. pp.89-94
9th International Seminar on Speech Production (ISSP 2011)
David Ostry, Shari R. Baum, Lucie Ménard & Vincent L. Gracco. 9th International Seminar on Speech Production (ISSP 2011), Jul 2011, Montréal, Canada. pp.89-94, 2011
Scopus-Elsevier
Popis: The paper describes advances in the development of an ultrasound silent speech interface for use in silent communications applications or as a speaking aid for persons who have undergone a laryngectomy. It reports some first steps towards making such a device lightweight, portable, interactive, and practical to use. Simple experimental tests of an interactive silent speech interface for everyday applications are described. Possible future improvements including extension to continuous speech and real time operation are discussed.
Cet article décrit les avancements dans le développement d'une interface ultrasonore de parole silencieuse, pour des applications en communication silencieuse ou comme une aide pour les personnes laryngectomisées. Nous rapportons les premiers pas pour réaliser une telle interface portable, interactive, et pratique à utiliser. De simples tests expérimentaux de cette interface pour des applications quotidiennes sont décrits. Des améliorations futures possibles incluant l'extension à la parole continue et aux traitements en temps réels sont discutées.
Databáze: OpenAIRE