Handwritten Music Object Detection: Open Issues and Baseline Results
Autor: | Yann Ricquebourg, Kwon-Young Choi, Horst Eidenberger, Alexander Pacha, Richard Zanibbi, Bertrand Coüasnon |
---|---|
Přispěvatelé: | Institute for Software Technology and Interactive Systems, TU Wien, Vienna, Austria, intuitive user interaction for document (IntuiDoc), MEDIA ET INTERACTIONS (IRISA-D6), Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA), CentraleSupélec-Télécom Bretagne-Université de Rennes 1 (UR1), Université de Rennes (UNIV-RENNES)-Université de Rennes (UNIV-RENNES)-Institut National de Recherche en Informatique et en Automatique (Inria)-École normale supérieure - Rennes (ENS Rennes)-Université de Bretagne Sud (UBS)-Centre National de la Recherche Scientifique (CNRS)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-CentraleSupélec-Télécom Bretagne-Université de Rennes 1 (UR1), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA), Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES), Choi, Kwon-Young, Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-Institut National de Recherche en Informatique et en Automatique (Inria)-Télécom Bretagne-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS)-Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-Institut National de Recherche en Informatique et en Automatique (Inria)-Télécom Bretagne-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS)-Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-Institut National de Recherche en Informatique et en Automatique (Inria)-Télécom Bretagne-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS), Institut National des Sciences Appliquées (INSA) |
Rok vydání: | 2018 |
Předmět: |
Musical notation
Optical music recognition Vocabulary Computer science media_common.quotation_subject Speech recognition Feature extraction [INFO.INFO-NE] Computer Science [cs]/Neural and Evolutionary Computing [cs.NE] [INFO.INFO-TT] Computer Science [cs]/Document and Text Processing Handwritten Scores 02 engineering and technology [INFO.INFO-NE]Computer Science [cs]/Neural and Evolutionary Computing [cs.NE] Semantics Convolutional neural network [INFO.INFO-CV] Computer Science [cs]/Computer Vision and Pattern Recognition [cs.CV] Deep Learning Object Detection 0202 electrical engineering electronic engineering information engineering Optical Music Recognition media_common business.industry Deep learning [INFO.INFO-CV]Computer Science [cs]/Computer Vision and Pattern Recognition [cs.CV] 020206 networking & telecommunications Object detection [INFO.INFO-TT]Computer Science [cs]/Document and Text Processing 020201 artificial intelligence & image processing Artificial intelligence business |
Zdroj: | DAS 13th IAPR International Workshop on Document Analysis Systems 13th IAPR International Workshop on Document Analysis Systems, Apr 2018, Vienne, Austria |
DOI: | 10.1109/das.2018.51 |
Popis: | International audience; Optical Music Recognition (OMR) is the challenge of understanding the content of musical scores. Accurate detection of individual music objects is a critical step in processing musical documents, because a failure at this stage corrupts any further processing. So far, all proposed methods were either limited to typeset music scores or were built to detect only a subset of the available classes of music symbols. In this work, we propose an end-to-end trainable object detector for music symbols that is capable of detecting almost the full vocabulary of modern music notation in handwritten music scores. By training deep convolutional neural networks on the recently released MUSCIMA++ dataset which has symbol-level annotations, we show that a machine learning approach can be used to accurately detect music objects with a mean average precision of up to 80%. |
Databáze: | OpenAIRE |
Externí odkaz: |