Multiple imputation and dealing with uncertainty in quantitative proteomics data

Autor: Marie Chion, Frédéric Bertrand, Christine Carapito
Přispěvatelé: Laboratoire de Spectrométrie de Masse BioOrganique [Strasbourg] (LSMBO), Département Sciences Analytiques et Interactions Ioniques et Biomoléculaires (DSA-IPHC), Institut Pluridisciplinaire Hubert Curien (IPHC), Université de Strasbourg (UNISTRA)-Université de Haute-Alsace (UHA) Mulhouse - Colmar (Université de Haute-Alsace (UHA))-Institut National de Physique Nucléaire et de Physique des Particules du CNRS (IN2P3)-Centre National de la Recherche Scientifique (CNRS)-Université de Strasbourg (UNISTRA)-Université de Haute-Alsace (UHA) Mulhouse - Colmar (Université de Haute-Alsace (UHA))-Institut National de Physique Nucléaire et de Physique des Particules du CNRS (IN2P3)-Centre National de la Recherche Scientifique (CNRS)-Institut Pluridisciplinaire Hubert Curien (IPHC), Université de Strasbourg (UNISTRA)-Université de Haute-Alsace (UHA) Mulhouse - Colmar (Université de Haute-Alsace (UHA))-Institut National de Physique Nucléaire et de Physique des Particules du CNRS (IN2P3)-Centre National de la Recherche Scientifique (CNRS)-Université de Strasbourg (UNISTRA)-Université de Haute-Alsace (UHA) Mulhouse - Colmar (Université de Haute-Alsace (UHA))-Institut National de Physique Nucléaire et de Physique des Particules du CNRS (IN2P3)-Centre National de la Recherche Scientifique (CNRS), Institut de Recherche Mathématique Avancée (IRMA), Université de Strasbourg (UNISTRA)-Centre National de la Recherche Scientifique (CNRS), Institut de Recherche en Mathématiques, Interactions et Applications (Labex_IRMIA), Laboratoire Modélisation et Sûreté des Systèmes (LM2S), Institut Charles Delaunay (ICD), Université de Technologie de Troyes (UTT)-Centre National de la Recherche Scientifique (CNRS)-Université de Technologie de Troyes (UTT)-Centre National de la Recherche Scientifique (CNRS), Bertrand, Frédéric, Université de Strasbourg (UNISTRA)-Institut National de Physique Nucléaire et de Physique des Particules du CNRS (IN2P3)-Centre National de la Recherche Scientifique (CNRS)-Université de Strasbourg (UNISTRA)-Institut National de Physique Nucléaire et de Physique des Particules du CNRS (IN2P3)-Centre National de la Recherche Scientifique (CNRS)-Institut Pluridisciplinaire Hubert Curien (IPHC), Université de Strasbourg (UNISTRA)-Institut National de Physique Nucléaire et de Physique des Particules du CNRS (IN2P3)-Centre National de la Recherche Scientifique (CNRS)-Université de Strasbourg (UNISTRA)-Institut National de Physique Nucléaire et de Physique des Particules du CNRS (IN2P3)-Centre National de la Recherche Scientifique (CNRS)
Jazyk: francouzština
Rok vydání: 2019
Předmět:
Proteomics
[STAT.AP]Statistics [stat]/Applications [stat.AP]
[STAT.ME] Statistics [stat]/Methodology [stat.ME]
Imputation multiple
Moderated t-test
[STAT.TH] Statistics [stat]/Statistics Theory [stat.TH]
[STAT.TH]Statistics [stat]/Statistics Theory [stat.TH]
[STAT.CO] Statistics [stat]/Computation [stat.CO]
Test t-tempéré
[STAT.ML] Statistics [stat]/Machine Learning [stat.ML]
Moderated t-tests
[STAT] Statistics [stat]
[STAT]Statistics [stat]
Protéomique
[STAT.AP] Statistics [stat]/Applications [stat.AP]
[STAT.ML]Statistics [stat]/Machine Learning [stat.ML]
[CHIM.ANAL]Chemical Sciences/Analytical chemistry
[MATH.MATH-ST]Mathematics [math]/Statistics [math.ST]
Multiple imputation
Missing values
Valeurs manquantes
[STAT.CO]Statistics [stat]/Computation [stat.CO]
[MATH.MATH-ST] Mathematics [math]/Statistics [math.ST]
[STAT.ME]Statistics [stat]/Methodology [stat.ME]
ComputingMilieux_MISCELLANEOUS
Zdroj: GDR Stats et Santé
GDR Stats et Santé, Oct 2019, Paris, France
HAL
51èmes Journées de Statistique
51èmes Journées de Statistique, Jun 2019, Nancy, France
Popis: International audience; Proteomic analysis consists in studying proteins from a given biological system, at a given time and under given conditions. The most efficient techniques for determining protein abundance rely on measuring peptides intensities. These peptide data include missing values. Although usual statistical techniques for proteomics allow missing values imputation, they do not take into account the uncertainty caused by the imputation itself. We propose here to combine moderated t-tests techniques with multiple imputation methods and make them applicable to either peptide or protein data.; L'analyse protéomique consiste à étudier l'ensemble des protéines contenues dans un système biologique donné, à un instant donné et dans des conditions données. Les techniques les plus performantes pour déterminer l'abondance des protéines passent par la mesure des intensités peptidiques. Mais ces données peptidiques comportent des va-leurs manquantes. Bien que les techniques statistiques usuelles en protéomique permettent l'imputation de celles-ci, l'incertitude liée à l'imputation n'est pas prise en compte. Nous proposons ici de combiner les techniques d'estimation tempérée de la variance aux méthodes d'imputation multiple, en les rendant utilisables tant au niveau peptidique qu'au niveau protéique.
Databáze: OpenAIRE