Popis: |
Tietoa ihmisen geneettisistä eroista saadaan nykyaikaisilla menetelmillä nopeasti, mutta niiden mahdollisista yhteyksistä sairauksiin ja geneettisten sairauksien molekyylitason mekanismeista ei ymmärretä vielä riittävästi. Tämä johtuu siitä, että informaatiota kyetään tuottamaan nopeammin kuin analysoimaan kokeellisesti. Laskennallisilla menetelmillä informaatiota voidaan analysoida tehokkaammin, ja bioinformatiikan menetelmin tuotettua tietoa voidaan käyttää esimerkiksi kokeellisten tutkimusten suunnitteluun ja kiinnostavimpien geenimuutosten priorisointiin. Yhden emäksen muutokset eli pistemutaatiot DNA:ssa ovat yleisin ihmisten välisen geneettisen variaation muoto. Osa pistemutaatioista aiheuttaa aminohapon muuttumisen toiseksi proteiinissa, jonka aminohappokoostumuksen geeni määrittää. Noin puolet ihmisen perinnöllisistä sairauksista aiheutuu patogeenisista yhden aminohapon muutoksista. Yhden aminohapon muutokset voivat aiheuttaa moninaisia ja eriasteisia, ääritapauksessa vakavaan sairauteen johtavia rakenteen ja toiminnan muutoksia proteiineissa. Tässä työssä tutkittiin yhden aminohapon muutosten laaja-alaisia vaikutuksia proteiineihin, ja analysoitiin siten perinnöllisten sairauksien molekyylitason syitä. Aminohappomuutosten bioinformatiikka-analyysille kehitettiin protokolla, jota sovellettiin ja kehitettiin sairauksien syitä tutkittaessa. Tutkimuksessa kehitetty protokolla toimii perustana jatkossa kehitettävälle uudelle tietokoneohjelmalle, joka on monipuolinen aminohappomuutosten vaikutusten analysointimenetelmä. Useita laskennallisia menetelmiä aminohappomuutosten vaikutusten ennustamiseksi on jo kehitetty. Näiden ohjelmien tavoitteena on automatisoida yhden aminohapon muutosten vaikutusten tutkimista. Automatisointi olisi suureksi hyödyksi mutaatiotutkimukselle, jonka tavoitteena on selvittää, mitkä variaatiot aiheuttavat geneettisiä sairauksia. Tässä työssä tehtiin yhdeksän ennustusmenetelmän vertaileva tutkimus käyttämällä yli 60 000 neutraalin ja sairauden aiheuttavan aminohappomuutoksen aineistoa. Ohjelmien luotettavuuden havaittiin vaihtelevan merkittävästi, ja toimintaperiaatteeltaan samankaltaisilla ohjelmilla saatiin hyvin erilaisia tuloksia. Vertailun perusteella ohjelmat pystyttiin asettamaan paremmuusjärjestykseen, ja parhailla ohjelmilla voidaan saada riittävän luotettavia tuloksia aminohappomuutosten priorisoimiseksi jatkotutkimuksia varten. Tarkempien menetelmien kehittäminen on kuitenkin tarpeen, jotta geneettisten variaatioiden mahdollinen patogeenisuus voitaisiin luotettavasti ennustaa. Tässä tutkimuksessa saavutettiin kiinnostavia näkökohtia muutamiin pistemutaatioiden aiheuttamiin perinnöllisiin sairauksiin. Näitä tuloksia voidaan hyödyntää kyseisten sairauksien molekyylitason syiden kokeellisessa tutkimuksessa. Mutaatioanalyysiprotokolla on perusteellinen menetelmä mutaatioiden vaikutusten tutkimiseksi, ja protokollan kehittäminen verkkopalveluksi mahdollistaa sen tehokkaan soveltamisen mutaatiotutkimuksessa. Uuden analysointiohjelman tavoitteena on tuottaa nykyisiä menetelmiä monipuolisempia ja laadukkaampia ennusteita pistemutaatioiden aiheuttamien aminohappomuutosten vaikutuksista. Available data on polymorphisms in the human genome are expanding rapidly, however knowledge of the possible disease association of polymorphisms and the molecular mechanisms of genetic disease is lagging due to the laborious and time-consuming nature of experimental studies. Bioinformatics studies can efficiently produce useful information to rationalise and guide further experimental study, and to short-list the most interesting cases from the pool of accumulating data. Some genetic variations, termed non-synonymous single nucleotide polymorphisms (nsSNPs), cause amino acid substitutions in the protein product of the gene. nsSNPs are the most common type of genetic variation among humans, and pathogenic nsSNPs, also termed missense mutations, account for approximately half of the allelic variants causative of hereditary disease. Amino acid substitutions may have diverse effects on protein structure and function, although some are functionally neutral. In this study, the wide-ranging effects of amino acid substitutions were investigated at the protein level, and based on the analyses of missense mutations, the molecular basis of a number of hereditary diseases was elucidated. A protocol for the bioinformatics study of mutational effects was designed and implemented. The protocol serves as a basis for the development of a new service for predicting the effects of a missense mutation. Several computational methods for predicting the possible pathogenicity of nsSNPs have been developed. These methods are based on evolutionary information and/or varying structural descriptors of the protein in question. These methods aim at automating the annotation process of nsSNP effects and therefore would be very useful for the mutation research community. In this study the performance of nine available prediction methods was evaluated using a dataset of over 60,000 missense mutations and polymorphisms. Significant differences in the prediction power of individual programs were observed, regardless of the apparent similarities between the programs. Some of the predictors perform well enough to be used in prioritising cases for further investigation; however more accurate methods are needed for reliable annotation of the putative effects of an nsSNP. This study yielded interesting insights at the molecular level mechanisms of hereditary diseases, which can be utilised in further experimental studies. The protocol for mutation analysis is a comprehensive method for studying mutational effects and its further development into a web service will provide the mutation research community a novel tool for efficient analysis beyond the scope of existing methods. |