Přispěvatelé: |
University of Helsinki, Faculty of Biological and Environmental Sciences, Doctoral Programme in Biomedicine, Finnish Red Cross Blood Service, Helsingin yliopisto, bio- ja ympäristötieteellinen tiedekunta, Biolääketieteellinen tohtoriohjelma, Helsingfors universitet, bio- och miljövetenskapliga fakulteten, Doktorandprogrammet i biomedicin, Lie, Benedicte, Saavalainen, Päivi, Partanen, Jukka |
Popis: |
The advent of next generation sequencing (NGS) technologies has changed the nature of human leukocyte antigen (HLA) research. Thanks to its increased sequencing throughput, NGS empowers high-accuracy HLA genotyping in clinical settings, disease association studies, and the development of potential future immunotherapeutics. Current NGS can be divided into two different approaches. Illumina’s technology with massively parallel sequencing produces a high number of short reads. Illumina provides highly accurate data with a minimal number of sequencing errors; however, the short reads can cause issues with alignment and phasing in HLA genotyping. In contrast, the long-read technologies, Oxford Nanopore Technologies (ONT) and Pacific Biosciences (PacBio), offer a single-molecule sequencing approach enabling sequencing of ultra-long reads. However, these two suffer from higher error rates, making HLA genotyping potentially less accurate. Concurrently with the development of NGS applications, several bioinformatics software have been developed for assigning HLA alleles based on existing genomic and RNA sequencing (RNA-seq) data and for imputing HLA alleles using single-nucleotide polymorphism (SNP) markers. In addition to HLA genotyping, NGS provides a powerful tool for studying the expression of several HLA genes and alleles in multiple samples simultaneously, replacing more conventional methods such as quantitative PCR (qPCR) and microarray. At the beginning of this thesis, earlier studies had already identified associations between differential HLA gene- and allele-level expression and human diseases. However, an RNA-seq method providing accurate and multiplexed way to study HLA gene- and allele-specific expression was lacking. To study comprehensively HLA gene- and allele-specific expression in normal peripheral blood mononuclear cells (PBMCs), a highly multiplexed RNA-seq method for Illumina using unique molecular identifiers (UMIs) in expression quantification was developed in study I. The combination of a personalized HLA reference and an in-house pipeline, written in R, allowed an extensive comparison of HLA gene and allotype expression in PBMC samples of 50 individuals. The results showed that although the expression in HLA was clearly gene- and allele-specific, there was also variation within genes and alleles representing the differential expression between individuals. Additionally, study I revealed haplotype-specific expression of six common Finnish HLA haplotypes. Interestingly, two autoimmune haplotypes, which have been associated with e.g. celiac disease and type I diabetes, had very distinct expression levels suggesting that the level of haplotype expression alone is not the primary predisposing factor. In study II, a targeted RNA-based method was developed for HLA ONT sequencing. The method employed PCR-based enrichment and barcoding, enabling 10 samples and several HLA genes to be multiplexed and sequenced in a single sequencing run. By using the MinION sequencer together with SpotOn flow cells, a sufficient number of reads per sample for HLA genotyping was generated. To achieve the best possible genotyping accuracy, only the higher quality 2D reads were included in the analysis. Despite the sequencing errors that ONT introduces during sequencing, the HLA genotyping results were obtained in 80% of HLA class I alleles and 95% of HLA class II alleles. Since HLA has a crucial role in immune surveillance and in the initiation of antitumor immune responses, the aim of study III was to investigate HLA expression in tumor samples acquired from a longitudinal high-grade serous ovarian cancer (HGSC) cohort. The sample material consisted of ovarian tumors and various intra-abdominal anatomical sites collected prior and after chemotherapy. In the inter-tissue analysis, differential expression levels in mainly non-classical HLA genes were found between distinct anatomical sites, indicating tissue-specific HLA expression levels. Additionally, the results in study III showed that in one of the anatomical sites, omentum, chemotherapy altered the expression of class II. Interestingly, the intra-patient analysis revealed that the allelic imbalance between two heterozygous alleles changed in the samples acquired from different tissues and treatment phases. To conclude, this thesis provides novel insights into gene- and allele-level HLA expression in different tissues. Additionally, it introduces new RNA-based methods for HLA genotyping and HLA expression quantification, which can be applied in future studies. Finally, it provides a comprehensive review of methods and bioinformatics tools designed for HLA allele-specific expression and the diseases associated with differential HLA allele expression. Uuden sukupolven sekvensointimenetelmät ovat muuttaneet HLA-tutkimuksen luonteen. Nämä korkean suoritustehon sekvensointimenetelmät mahdollistavat tänä päivänä tarkemman HLA-genotyypityksen, tautiassosiaatiotutkimukset sekä uusien immunoterapioiden kehittämisen. Uuden sukupolven sekvensointimenetelmät jaetaan tavallisesti kahteen luokkaan. Illuminan sekvensointiteknologia tarjoaa tarkemman sekvensointituloksen, mutta sen tuottamat lyhyet sekvensointifragmentit aiheuttavat linjausongelmia HLA-genotyypityksessä. Sen sijaan Oxford Nanopore - ja PacBio-sekvensointiteknologiat mahdollistavat erittäin pitkien molekyylien sekvensoimisen yhtenä fragmenttina. Ne kuitenkin tuottavat enemmän sekvensointivirheitä, mikä voi huonontaa genotyypitystulosten tarkkuutta. Uusien sekvensointimenetelmien kehittymisen lisäksi myös uusien genomisen ja RNA-pohjaisen datan HLA-genotyypitykseen sekä HLA-imputaatioon tarkoitettujen laskennallisten työkalujen määrä on kasvanut. Uuden sukupolven sekvensointimenetelmät tarjoavat myös tehokkaan työkalun useiden näytteiden HLA geeni- ja alleelitason ekspression samanaikaiseen määrittämiseen korvaten aiemman kvantitatiivisen PCR-menetelmän ekspression tutkimisessa. Ennen väitöskirjatutkimuksen aloittamista, aiemmissa tutkimuksissa oli jo saatu viitteitä HLA-geeni- ja alleeliekspression vaikutuksesta useissa eri taudeissa. Saatavilla ei kuitenkaan ollut RNA-sekvensointimenetelmää, joka olisi mahdollistanut tarkan HLA-geeni- ja alleelitason ekspression määrittämisen useista näytteistä samanaikaisesti. HLA geeni- ja alleelispesifisen ekspression tutkimisen mahdollistamiseksi veren mononukleaarisoluista, tutkimuksessa I kehitettiin useiden näytteiden samanaikaiseen sekvensointiin tarkoitettu RNA-sekvensointimenetelmä, joka hyödyntää uniikkeja molekyylitunnisteita ekspression määrittämisessä. Näytekohtaisen HLA-referenssin käyttäminen yhdessä R-komentokieleen perustuvan analyysityökalun kanssa mahdollisti HLA geeni- ja alleelispesifisen ekspression vertaamisen ääreisveren mononukleaarisoluissa 50 verenluovuttajan välillä. Tutkimus I:n tulokset paljastivat, että vaikka ekspressiotaso eri HLA-geenien ja -alleelien välillä oli selvästi geeni- ja alleelispesifistä, ekspressioprofiileissa oli myös vaihtelua geenien ja alleelien sisällä indikoiden verenluovuttajien välisiä eroja. Tutkimus I:n tulokset osoittivat myös HLA-ekspression vaihtelevan kuuden suomalaisilla yleisen HLA-haplotyypin välillä. Kaksi aiemmin keliakiaan ja tyypin 1 diabetekseen yhdistettyä haplotyyppiä sijoittuivat ekspressiovertailussa kauimmaksi toisistaan. Näin ollen näyttäisi, ettei HLA-haplotyyppien ekspressiotasot ole näille taudeille altistava tekijä. Tutkimuksessa II kehitettiin HLA-geeneille kohdennettu RNA-pohjainen menetelmä Oxford Nanopore-sekvensointialustalle. Menetelmässä HLA-geenit rikastettiin komplementaarisesta DNA:sta PCR:n avulla. Monistettuihin HLA-molekyyleihin lisättiin näytekohtaiset tunnisteet, joka mahdollisti kymmenen näytteen ja useiden HLA-geenien samanaikaisen sekvensoinnin yhdessä sekvensointiajossa. Sekvensointi MinION-laitteella ja SpotON-virtauskennoilla tuotti tyydyttävän määrän sekvenssifragementteja näytettä kohden. Mahdollisimman tarkan HLA-genotyypitystuloksen varmistamiseksi tyypityksessä käytettiin ainoastaan Nanoporen korkeampilaatuisia 2D-sekvenssifragmentteja. Huolimatta Oxford Nanopore -teknologian sekvensoinnin aikana tapahtuvista sekvensointivirheistä, HLA-tyypitystulos saatiin 80%.lla HLA:n luokka I -alleeleista ja 95%:lla luokka II -alleeleista. Koska HLA:lla on elintärkeä rooli immuunijärjestelmän monitoroimisessa ja anti-tuumorivälitteisen vasteen aikaansaamisessa, haluttiin tutkimuksessa III tutkia syöpänäytteiden HLA-geenien ilmenemistä. Osatyössä III käytettiin näytemateriaalina huonosti erilaistuneeseen seroosiin munasarjasyöpään sairastuneiden potilaiden näytteitä, jotka olivat kerätty sekä munasarjakudoksesta että useista eri muista kiinteistä kudoksista sekä askites-nesteestä ennen ja jälkeen kemoterapian. Vertailu eri kudosten välillä paljasti HLA-ekspression vaihtelevan eri kudosten välillä ja näin ollen olevan kudosspesifiä. Lisäksi tulokset osoittivat kemoterapian muokkaavan HLA-ekspressiota tietyissä kudoksissa. Mielenkiintoinen tulos saatiin vertaamalla saman potilaan eri kudoksista ja hoitovaiheista otettujen näytteiden HLA:n alleelispesifistä ekspressiota kahden alleelin välillä heterotsygooteissa alleelipareissa. Tulokset paljastivat, että osalla potilaista ekspressiosuhde kahden HLA-alleelin välillä muuttuu kudosten ja hoitovaiheiden mukaan. Yhteenvetona voidaan todeta, että väitöskirja tarjoaa uusia näkökulmia kudoksen ja kemoterapian vaikutuksesta HLA:n geeni- ja alleelispesifiseen ekspressioon. Lisäksi väitöskirjassa esitellään uusia RNA-sekvenointiin perustuvia menetelmiä HLA-genotyypitykseen ja HLA-ekspression määrittämiseen, joita voidaan hyödyntää tulevissa tutkimuksissa. Lopuksi väitöskirja tarjoaa kattavan katsauksen HLA:n alleelispefisen ekspression tutkimukseen käytettävistä menetelmistä ja analyysityökaluista sekä HLA-ekspression ja sairauksien raportoiduista yhteyksistä. |