Dimension reduction methods for Single cell Rna -seq data classification
Autor: | Hernández Castañeda, Julián |
---|---|
Přispěvatelé: | Lopez Kleine, Liliana, Grupo de Investigación en Bioinformática y Biología de Sistemas |
Jazyk: | Spanish; Castilian |
Rok vydání: | 2021 |
Předmět: | |
Zdroj: | Repositorio UN Universidad Nacional de Colombia instacron:Universidad Nacional de Colombia |
Popis: | ilustraciones, gráficas, tablas El estudio de datos de expresión en células unitarias ha venido creciendo en los últimos años dada su gran utilidad, ya que permite entender el funcionamiento de los sistemas biológicos a nivel molecular. Estos datos son muy extensos en términos informáticos por lo que es importante usar un método de reducción de dimensión adecuado para poder interpretar y visualizar la información. Actualmente, hay varios métodos y algoritmos que realizan esta labor. Sin embargo, carecen de buenos resultados o sustentos teóricos estadísticos fuertes. Por medio de simulaciones se comparan los métodos más populares, analizando sus fortalezas, debilidades y limitaciones. Se plantea un método de reducción de dimensión basado en un modelo lineal mixto, tratando de capturar toda la información importante para datos de single cell RNA sequencing. Además, se propone una metodología particularmente fácil de implementar, que permite destacar los genes influyentes de un proceso biológico. Esta metodología es implementada en datos de oligodendrogliomas, mostrando 3 vías metabólicas que pueden ayudar a entender la heterogeneidad celular de este tipo de tejido. (Texto tomado de la fuente). The study of single cell expression data has been growing in recent years given its great utility since it allows us to understand how the biological systems work in a molecular level. These data are very extensive in computational terms, then it is important to use an adequate dimension reduction method to be able to interpret and visualize the information. Currently, there are several methods and algorithms that perform this work. However, they lack good results or strong statistical theoretical support. With simulations, it is proposed to compare the most popular methods, analyzing its strengths, weaknesses and limitations. It is proposed a dimension reduction method based on a mixed linear model that aims to capture all the important information of single cell RNA sequencing data. Moreover, it is proposed a particularly easy-to-apply methodology that let the researcher mark the influyent genes in a biological process. This methodology is applied to oligodendrogioma data, showing 3 methabolic pathways that can lead to a better understanding of the celular heterogenity of this Tissue. Incluye anexos Maestría Magíster en Ciencias - Estadística Estadística genómica |
Databáze: | OpenAIRE |
Externí odkaz: |