A Multivariate approach to study the genetic determinants of phenotypic traits

Autor: Garrido Martín, Diego, 1992
Přispěvatelé: Guigó Serra, Roderic, Calvo, Miquel (Calvo Llorca), Universitat Pompeu Fabra. Departament de Ciències Experimentals i de la Salut
Rok vydání: 2020
Předmět:
Zdroj: TDX (Tesis Doctorals en Xarxa)
TDR. Tesis Doctorales en Red
instname
Popis: We have developed an efficient and reproducible pipeline for the identification of genetic variants affecting splicing (splicing quantitative trait loci or sQTLs), based on an approach that captures the intrinsically multivariate nature of this phenomenon. We employed it to study the multi-tissue transcriptome GTEx dataset, generating a comprehensive catalogue of sQTLs in the human genome. Downstream analyses of this catalogue provide novel insights into the mechanisms underlying alternative splicing regulation and its contribution to human complex traits and diseases. To facilitate the visualization of splicing events in GTEx and other large-scale RNA-seq studies, we developed a software to generate sashimi plots, which supports the aggregated representation of hundreds of samples. Given the growing interest in efficient methods to identify genetic effects on multiple traits, we extended the statistical framework employed for sQTL mapping (Anderson test) to accommodate any quantitative multivariate phenotype and experimental design. We derived the limiting distribution of the test statistic, allowing to compute asymptotic p values. We further demonstrated the advantages and applicability of our approach to GWAS and QTL mapping analyses using simulated and real datasets. Hemos desarrollado un método computacional eficiente y reproducible, que permite la identificación de variantes genéticas que afectan al splicing (splicing quantitative trait loci o sQTLs), y que es capaz de capturar la naturaleza multivariante de este fenómeno. Lo hemos empleado para estudiar el conjunto de datos GTEx, que contiene información sobre el transcriptoma en múltiples tejidos, generando un catálogo completo de sQTLs en el genoma humano. El análisis de dicho catálogo proporciona nuevos conocimientos sobre los mecanismos que subyacen a la regulación del splicing alternativo, así como sobre su contribución a los rasgos complejos y enfermedades humanas. Con el objetivo de facilitar la visualización de eventos de splicing en GTEx y otros estudios de secuenciación de ARN a gran escala, hemos desarrollado un software para generar gráficos de tipo sashimi, que permite la representación agregada de cientos de muestras. En vista del creciente interés por métodos capaces de analizar efectos genéticos en múltiples rasgos de manera eficiente, hemos extendido el marco estadístico empleado para la identificación de sQTLs (test de Anderson) para acomodar cualquier fenotipo multivariante cuantitativo y diseño experimental. Hemos derivado la distribución límite del estadístico, lo que nos permite calcular p valores asintóticos. Además, demostramos las ventajas y la aplicabilidad de nuestro método en GWAS y análisis de QTLs, empleando conjuntos de datos tanto simulados como reales.
Databáze: OpenAIRE