Autor: |
COURBARIAUX, MARIE, Ambroise, Christophe, Dalmasso, Cyril, Szafranski, Marie, Consortium, MeMoDeep |
Přispěvatelé: |
Laboratoire de Mathématiques et Modélisation d'Evry (LaMME), Institut National de la Recherche Agronomique (INRA)-Université d'Évry-Val-d'Essonne (UEVE)-ENSIIE-Centre National de la Recherche Scientifique (CNRS), Institut de Recherche en Santé Digestive - IRSD [Purpan, Toulouse], Institut National de la Recherche Agronomique (INRA)-Université Toulouse III - Paul Sabatier (UPS), Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Ecole Nationale Vétérinaire de Toulouse (ENVT), Institut National Polytechnique (Toulouse) (Toulouse INP), Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Institut National Polytechnique (Toulouse) (Toulouse INP), Université Fédérale Toulouse Midi-Pyrénées-Institut National de la Santé et de la Recherche Médicale (INSERM)-Hôpital Purpan [Toulouse], CHU Toulouse [Toulouse]-CHU Toulouse [Toulouse], Institut du Cerveau et de la Moëlle Epinière = Brain and Spine Institute (ICM), Université Pierre et Marie Curie - Paris 6 (UPMC)-Institut National de la Santé et de la Recherche Médicale (INSERM)-CHU Pitié-Salpêtrière [APHP]-Centre National de la Recherche Scientifique (CNRS), Institut de Mathématiques de Toulouse UMR5219 (IMT), Université Toulouse 1 Capitole (UT1)-Université Toulouse - Jean Jaurès (UT2J)-Université Toulouse III - Paul Sabatier (UPS), Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-PRES Université de Toulouse-Institut National des Sciences Appliquées - Toulouse (INSA Toulouse), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS) |
Jazyk: |
angličtina |
Rok vydání: |
2018 |
Předmět: |
|
Popis: |
This work proposes an original method for disease subtyping from both longitudinal clinical variables and genetic markers via a mixture of regressions model, with logistic weights function of a potentially large number of genetic variables. In order to address these large-scale problems, variable selection is an essential step. We thus propose to discard genetic variables that may not be relevant for clustering by maximizing a penalized likelihood via a Classification Expectation Maximization algorithm. The proposed method is validated on simulations. The approach is applied to a data set from a cohort of Parkinson's disease patients. Several subtypes of the disease as well as genetic variants potentially having a role in this typology have been identified.; Ce travail propose une méthode pour le sous-typage de maladies à partir de variables cliniques longitudinales et de marqueurs génétiques via un modèle de mélange de régressions, avec des poids logistiques fonctions d'un nombre potentiellement important de variables génétiques. Pour traiter ce problème de grande dimension, la sélection des variables pertinentes est essentielle. Nous proposons donc d'exclure les variables génétiques qui ne seraient pas pertinentes pour la classification en maximisant une vraisemblance pénalisée par le biais d'un algorithme Classification Expectation Maximization. La méthode proposée est validée sur des simulations. L'approche est ensuite mise en application sur des données provenant d'une cohorte de patients atteints de la maladie de Parkinson. Plusieurs sous-types de la maladie ainsi que des variantes génétiques ayant un rôle potentiel dans cette typologie sont ainsi identifiés. |
Databáze: |
OpenAIRE |
Externí odkaz: |
|