A new clustering algorithm for tridimensional gene expression data

Autor: Tiago José da Silva Lopes
Přispěvatelé: Guilherme Pimentel Telles, Alexandre Cláudio Botazzo Delbem, Maria Emília Machado Telles Walter
Jazyk: portugalština
Rok vydání: 2007
Předmět:
Zdroj: Biblioteca Digital de Teses e Dissertações da USP
Universidade de São Paulo (USP)
instacron:USP
Popis: Neste trabalho desenvolvemos um novo algoritmo para clustering para dados de expressão gênica. As abordagens tradicionais utilizam um conjunto de dados na forma de uma tabela de duas dimensões, onde as linhas são os genes e as colunas são as condições experimentais. Nós utilizamos uma estrutura de três dimensões, acrescentando fatias de tempo. Implementamos nosso algoritmo e testamos com conjuntos de dados sintéticos e dados reais, usando índices de validação para comparar os resultados obtidos pelo nosso algoritmo com os resultados produzidos pelo algoritmo TriCluster. Os resultados mostraram que o nosso algoritmo é bom para dados de expressão gênica em três dimensões e pode ser aplicado a dados de outros domínios In this study we developed a new clustring algorithm for gene expression data. Previous solutions use a dataset in the form of a table, where the rows are the genes and the columns are the experimental conditions. We used a three-dimensional structure adding time-slices. We implemented this algorithm and tested it with synthetic and real data, using validation index to compare our results with the results obtained by the TriCluster algotithm. Results show that our solution is good for three dimensional gene expression data and can be employed to other domains
Databáze: OpenAIRE