Structural equation models for genome-wide association study in Coffea arabica
Autor: | Matheus Massariol Suela |
---|---|
Přispěvatelé: | Azevedo, Camila Ferreira, Caixeta, Eveline Teixeira, Morota, Gota, Nascimento, Moysés |
Rok vydání: | 2022 |
Předmět: | |
Zdroj: | LOCUS Repositório Institucional da UFV Universidade Federal de Viçosa (UFV) instacron:UFV |
DOI: | 10.47328/ufvbbt.2021.164 |
Popis: | O melhoramento em café foi baseado em técnicas clássicas por muito tempo, porém, com o advento de técnicas genômicas e de fenotipagem de precisão, os programas de melhoramento vêm apresentando melhores resultados e mais velozes, mesmo com os programas se tornando cada vez mais complexos, em termos de quantidades e tipos de características estudadas. Dessa forma, a existência de interrelações entre caracteres podem gerar impactos importantes em um programa de melhoramento, como por exemplo, na descoberta de regiões genômicas que contribuem para determinadas características. Especificamente, tais características podem atuar tanto de forma direta quanto indireta na característica em estudo. Sabendo disso, compreender os efeitos diretos e indiretos que um caráter exerce em outro, é de grande importância para a fase de seleção. Tradicionalmente, para realizar o estudo das associações entre características, técnicas multivariadas são aplicadas, porém, são tais metodologias negligenciam as inter- relações entre as mesmas. Dessa forma, a utilização da Rede Bayesiana (BN) em conjunto com Modelo de Equações Estruturadas (SEM) sob o enfoque do estudo de associação genômica ampla (GWAS), permite quantificar o efeito dos marcadores, particionando seus valores em efeitos diretos e indiretos para as características presentes na rede formada. Com o objetivo de explorar estas inter-relações, foram analisados fenótipos relacionados às características morfológicas (tamanho do fruto, número de nós reprodutivos), fisiológicas (vigor vegetativo) e produtivas (produção) em 195 genótipos de Coffea arabica, provenientes de uma parceria entre a Empresa de Pesquisa Agropecuária de Minas Gerais (EPAMIG), Empresa Brasileira de Pesquisa Agropecuária (EMBRAPA) e Universidade Federal de Viçosa (UFV). A rede fenotípica inferida por meio do algoritmo Hill Climbing foi usada para estimar os coeficientes estruturais. Realizando uma integração entre modelos multivariados - GWAS e SEM-GWAS foi possível identificar inter-relação positiva entre vigor vegetativo em produção e de vigor vegetativo pra número de nós reprodutivos e negativo de número de nós reprodutivos e tamanho do fruto para produção. Também foi possível detectar regiões genômicas significativas, e assim, identificar três genes que atuam diretamente sobre produção. Palavras-chave: Coffea arabica. Redes Bayesianas. Modelo de Equações Estruturadas. GWAS. Coffee breeding techniques were based on classical techniques for a long time, however, with the advent of genomic techniques and precision phenotyping, breeding programs have been showing best and faster results, even with the programs becoming more complex, in terms of quantities and types of characteristics studied. Thus, the existence of interrelationships between characters can generate important impacts in a breeding program, such as the discovery of genomic regions that contribute to certain characteristics, these can act directly, or indirectly. Knowing this, understanding the direct and indirect effects that one character has on another is of great importance for the selection phase. Traditionally, multivariate techniques are applied, but phenotypic interrelationships are neglected. Thus, the use of the Bayesian Network (BN) in conjunction with the Structured Equation Model (SEM) under the focus of the genomic wide association study (GWAS), allows quantifying genetic parameters, partitioning such values into direct and indirect effects for the traits. present in the formed network. In order to explore these interrelationships, they were able to phenotypes related to morphological (fruit size and number of reproductive nodes), physiological (vegetative vigor) and productive (production) characteristics in 195 Coffea arabica genotypes from a partnership between Empresa de Pesquisa Agropecuária de Minas Gerais (EPAMIG), Empresa Brasileira de Pesquisa Agropecuária (EMBRAPA) and Federal University of Viçosa (UFV). The phenotypic network inferred by means of the Hill Climbing algorithm was used to estimate the appropriate coefficients. By performing an integration between multivariate models - GWAS and SEM- GWAS it was possible to identify a positive interrelationship between vegetative vigor in yield and vegetative vigor for the number of reproductive nodes and negative for the number of reproductive nodes and fruit size for yield. It was also possible to detect significant genomic regions, and thus identify three genes that act directly on yield. Keywords: Coffea arabica. Bayesian Network. Structural Equation Models. GWAS. |
Databáze: | OpenAIRE |
Externí odkaz: |