Popis: |
Käesoleva magistritöö eesmärk on leida võimalusi andmaks geenidoonoritele tagasisidet nende päritolu kohta, lähtudes SNPde andmetest. Nendele tuginedes on leitud peakomponendid, millele rajaneb edasine analüüs. Esmalt kirjeldatakse päritolu rahvuste tasandil, mille käigus antakse doonorile tõenäosuslik hinnang kuulumise kohta 22 rahvusgrupi hulka. Sellele järgnevalt kirjeldatakse päritolu Eesti-siseselt, kus leitakse K-keskmiste klasterdamise algoritmi abil Eesti sees tekkivad klastrid, mis moodustavad geograafiliselt loogilisi tervikuid. Klasterdamise tulemusi rakendatakse selleks, et klassifitseerida tekkinud klastrite alusel ning pakkuda ka hinnang klastritesse kuulumise tõenäosustele. Ühtlasi kontrollitakse, kui hästi töötab Eesti-sisene klassifitseerimine, valides klassideks maakonnad. Klassifitseerimismeetoditest võrreldakse lineaarset diskriminantanalüüsi, tugivektormasinaid ning juhuslikke metsi. |