Multidimensional Fitting for Multivariate Data Analysis

Autor: Nicolas Wicker, Nicolas Froloff, Wolfgang Raffelsberger, Olivier Poch, Myriam Maumy, Ravi Kiran Reddy Kalathur, Claude Berge
Přispěvatelé: Institut de Recherche Mathématique Avancée (IRMA), Université de Strasbourg (UNISTRA)-Centre National de la Recherche Scientifique (CNRS), Laboratoire des sciences de l'ingénieur, de l'informatique et de l'imagerie (ICube), École Nationale du Génie de l'Eau et de l'Environnement de Strasbourg (ENGEES)-Université de Strasbourg (UNISTRA)-Institut National des Sciences Appliquées - Strasbourg (INSA Strasbourg), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Les Hôpitaux Universitaires de Strasbourg (HUS)-Centre National de la Recherche Scientifique (CNRS)-Matériaux et Nanosciences Grand-Est (MNGE), Université de Strasbourg (UNISTRA)-Université de Haute-Alsace (UHA) Mulhouse - Colmar (Université de Haute-Alsace (UHA))-Institut National de la Santé et de la Recherche Médicale (INSERM)-Institut de Chimie du CNRS (INC)-Centre National de la Recherche Scientifique (CNRS)-Université de Strasbourg (UNISTRA)-Université de Haute-Alsace (UHA) Mulhouse - Colmar (Université de Haute-Alsace (UHA))-Institut National de la Santé et de la Recherche Médicale (INSERM)-Institut de Chimie du CNRS (INC)-Centre National de la Recherche Scientifique (CNRS)-Réseau nanophotonique et optique, Université de Strasbourg (UNISTRA)-Université de Haute-Alsace (UHA) Mulhouse - Colmar (Université de Haute-Alsace (UHA))-Centre National de la Recherche Scientifique (CNRS)-Université de Strasbourg (UNISTRA)-Centre National de la Recherche Scientifique (CNRS), Institut de Génétique et de Biologie Moléculaire et Cellulaire (IGBMC), Université de Strasbourg (UNISTRA)-Institut National de la Santé et de la Recherche Médicale (INSERM)-Centre National de la Recherche Scientifique (CNRS), Institut de génétique et biologie moléculaire et cellulaire (IGBMC), Université Louis Pasteur - Strasbourg I-Institut National de la Santé et de la Recherche Médicale (INSERM)-Centre National de la Recherche Scientifique (CNRS)
Rok vydání: 2010
Předmět:
Zdroj: Journal of Computational Biology
Journal of Computational Biology, 2010, 17 (5), pp.723-732. ⟨10.1089/cmb.2009.0126⟩
ISSN: 1557-8666
1066-5277
DOI: 10.1089/cmb.2009.0126
Popis: Large multidimensional data matrices are frequent in biology. However, statistical methods often have difficulties dealing with such matrices because they contain very complex data sets. Consequently variable selection and dimensionality reduction methods are often used to reduce matrix complexity, although at the expense of information conservation. A new method derived from multidimensional scaling (MDS) is presented for the case where two matrices are available to describe the same population. The presented method transforms one of the matrices, called the target matrix, with some constraints to make it fit with the second matrix, referred to as the reference matrix. The fitting to the reference matrix is performed on the distances computed for the two matrices, and the transformation depends on the problem at hand. A special feature of this method is that a variable can be only partially modified. The method is applied on the exclusive-or (XOR) problem and then on a biological application with large-scale gene expression data.
Databáze: OpenAIRE