Développement de nouvelles méthodologies statistiques pour l'analyse de données de protéomique quantitative
Autor: | Chion, Marie |
---|---|
Přispěvatelé: | Institut de Recherche Mathématique Avancée (IRMA), Université de Strasbourg (UNISTRA)-Centre National de la Recherche Scientifique (CNRS), Laboratoire de Spectrométrie de Masse BioOrganique [Strasbourg] (LSMBO), Département Sciences Analytiques et Interactions Ioniques et Biomoléculaires (DSA-IPHC), Institut Pluridisciplinaire Hubert Curien (IPHC), Université de Strasbourg (UNISTRA)-Institut National de Physique Nucléaire et de Physique des Particules du CNRS (IN2P3)-Centre National de la Recherche Scientifique (CNRS)-Université de Strasbourg (UNISTRA)-Institut National de Physique Nucléaire et de Physique des Particules du CNRS (IN2P3)-Centre National de la Recherche Scientifique (CNRS)-Institut Pluridisciplinaire Hubert Curien (IPHC), Université de Strasbourg (UNISTRA)-Institut National de Physique Nucléaire et de Physique des Particules du CNRS (IN2P3)-Centre National de la Recherche Scientifique (CNRS)-Université de Strasbourg (UNISTRA)-Institut National de Physique Nucléaire et de Physique des Particules du CNRS (IN2P3)-Centre National de la Recherche Scientifique (CNRS), Bourse de thèse du Labex IRMIA via l'Agence Nationale de la Recherche [ANR-11-LABX-0055 IRMIA], Université de Strasbourg, Frédéric Bertrand, Christine Carapito, ANR-11-LABX-0055,IRMIA,Institut de Recherche en Mathématiques, ses Interactions et Applications(2011), STAR, ABES, Institut de Recherche en Mathématiques, ses Interactions et Applications - - IRMIA2011 - ANR-11-LABX-0055 - LABX - VALID |
Jazyk: | angličtina |
Rok vydání: | 2021 |
Předmět: |
[STAT.AP]Statistics [stat]/Applications [stat.AP]
multiple imputation differential analysis données de grande dimension regression models [MATH.MATH-GM] Mathematics [math]/General Mathematics [math.GM] [SDV.BIBS]Life Sciences [q-bio]/Quantitative Methods [q-bio.QM] quantitative proteomics data missing values [STAT]Statistics [stat] high-dimensional data analyse différentielle [MATH.MATH-ST]Mathematics [math]/Statistics [math.ST] [SDV.BBM.GTP]Life Sciences [q-bio]/Biochemistry Molecular Biology/Genomics [q-bio.GN] imputation multiple [STAT.ME]Statistics [stat]/Methodology [stat.ME] modèles de régression valeurs manquantes données de protéomique quantitative |
Zdroj: | Statistics [math.ST]. Université de Strasbourg, 2021. English |
Popis: | Proteomic analysis consists of studying all the proteins expressed by a given biological system, at a given time and under given conditions. Recent technological advances in mass spectrometry and liquid chromatography make it possible to envisage large-scale and high-throughput proteomic studies.This thesis work focuses on developing statistical methodologies for the analysis of quantitative proteomics data and thus presents three main contributions. The first part proposes to use monotone spline regression models to estimate the amounts of all peptides detected in a sample using internal standards labelled for a subset of targeted peptides. The second part presents a strategy to account for the uncertainty induced by the multiple imputation process in the differential analysis, also implemented in the mi4p R package. Finally, the third part proposes a Bayesian framework for differential analysis, making it notably possible to consider the correlations between the intensities of peptides. L’analyse protéomique consiste à étudier l’ensemble des protéines exprimées par un système biologique donné, à un moment donné et dans des conditions données. Les récents progrès technologiques en spectrométrie de masse et en chromatographie liquide permettent d’envisager aujourd’hui des études protéomiques à large échelle et à haut débit. Ce travail de thèse porte sur le développement de méthodologies statistiques pour l’analyse des données de protéomique quantitative et présente ainsi trois principales contributions. La première partie propose d’utiliser des modèles de régression par spline monotone pour estimer les quantités de tous les peptides détectés dans un échantillon grâce à l'utilisation de standards internes marqués pour un sous-ensemble de peptides ciblés. La deuxième partie présente une stratégie de prise en compte de l’incertitude induite par le processus d’imputation multiple dans l’analyse différentielle, également implémentée dans le package R mi4p. Enfin, la troisième partie propose un cadre bayésien pour l’analyse différentielle, permettant notamment de tenir compte des corrélations entre les intensités des peptides |
Databáze: | OpenAIRE |
Externí odkaz: |