Popis: |
A human genome laid out in a straight line would measure 2m from end to end, but in living cells it is folded into a compact structure contained in a nuclear space with a diameter of 2µm. This compact genome is hierarchically organized and spatiotemporally regulates distinct cellular gene expression mechanisms via promoter - enhancer chromatin loops. Additionally, large scale genomic studies have identified enhancer regions enriched with complex disease risk variants but uncovering their contribution to disease pathology remains challenging. This thesis reports the genome-wide generation and analysis of regulatory and functional regions in complex disease relevant cell types. High throughput sequencing methods including whole genome/exome sequencing, capture Hi-C (HiCap), RNA sequencing, and ChIP sequencing were used to create a snapshot of the functional and genomic landscape of cell types relevant to complex diseases. Paper I present a technical comparison of variant calls generated using two genotyping technologies: whole exome and whole genome sequencing (WGS and WES). This comparison unequivocally shows that variant quality from moderately sequenced WGS variant calls is stable and concordant with deeply sequenced WES calls. Papers II and III report the assignment of target genes to cardiovascular risk SNPs using capture Hi-C (HiCap) and other functional assays and identify both known and novel biological processes related to cardiovascular pathology. Finally, paper IV reports the use of whole genome sequencing and capture Hi-C data to identify rare variants in putative enhancer regions in a patient with a congenital heart defect and reveals a number of processes and genes relevant to the pathology. In conclusion, this thesis demonstrates that combining capture Hi-C with functional high throughput sequencing methods can improve our understanding of the etiology of complex diseases. We believe that the resulting mechanistic understanding of complex disease pathologies will enable effective intervention using drugs targeting regulatory processes. Ett mänskligt genom som läggs ut i en rak linje skulle mäta två meter från ena änden till den andra,men i levande celler viks det ihop till en kompakt struktur förvarad i en liten instängd avdelningmed en diameter på två µm. Detta kompakta genom är hierarkiskt organiserat och utförspatiotemporal reglering av genuttryck via promotor- och enhancer-kromatinloopar. Storskaligagenomstudier har dessutom identifierat enhancer-regioner berikade med riskvarianter associerademed komplexa sjukdomar, men att utröna deras bidrag till patologin är fortfarande utmanande. Denna avhandling beskriver genomtäckande generering och analys av regulatoriska ochfunktionella regioner i celltyper relevanta vid komplexa sjukdomar. High throughputsekvenseringsmetoder, inkluderande helgenom/exomsekvensering, Capture Hi-C (HiCap), RNAsekvensering och ChIP-sekvensering, användes för att skapa en ögonblicksbild av det funktionellaoch genomiska landskapet för celltyper som är relevanta för komplexa sjukdomar. Artikel I presenterar en teknisk jämförelse av så kallade “variant calls”, genererade med hjälp avtvå olika tekniker för bestämning av den genetiska uppsättningen: helexom- ochhelgenomsekvensering (WGS och WES). Denna jämförelse visar otvivelaktigt att den statistiskastyrkan för enbaspolymorfi från WGS med lågt sekvenseringsdjup är tillräckligt hög ochöverensstämmer väl med vad man erhåller från djupare sekvenserad WES. Artikel II och IIIbeskriver hur man med hjälp av HiCap och andra funktionella analyser kan bestämma vilka genersom påverkas av SNPs tidigare associerade med kardiovaskulära sjukdomar, men som återfinns iicke-kodande regioner av genomet utan självklar gen-tillhörighet.. Resultatet är identifikation avbåde kända och nya biologiska processer relaterade till hjärt- och kärlpatologi. Slutligen beskriverartikel IV en metod för att kombinera data från helgenomsekvensering och Capture Hi-C för attidentifiera sällsynta varianter i hypotetiska enhancer-regioner i celler från en patient med medfötthjärtfel. Den erhållna datan används även för att avslöja och kategorisera flertalet processer ochgener med trolig påverkan för den patologiska statusen. Sammanfattningsvis påvisar denna avhandling att Capture Hi-C i kombination med highthroughput-sekvenseringsmetoder kan förbättra vår förståelse gällande etiologin bakom komplexasjukdomar. Vi tror att den mekanistiska förståelsen av komplexa sjukdomar kommer att möjliggöra effektiv intervention med hjälp av läkemedel som är inriktade på just dessa identifieraderegulatoriska processer. QC 2020-11-20 |