Popis: |
Väitöskirjani keskittyy kielievoluutioon ja sen laskennallisiin analyysitekniikoihin. Viime vuosikymmeninä laskennalliset lähestymistavat ovat kasvattaneet suosiotansa kielitieteen piirissä tarjoten muun muassa korkeampaa objektiivisuutta, helpompaa replikoitavuutta ja tapoja tutkia aiempaa isompia aineistoja. Lisääntynyt suosio on tuonut mukanaan uusia analyysitekniikoita muilta tutkimusaloilta kielitieteeseen. Näihin kuuluu evoluutiobiologiasta lainattuja menetelmiä, kuten fylogeneettiset tekniikat, joilla tutkitaan biologisten lajien välisiä suhteita, sekä populaatiogeneettisiä tekniikoita, joilla tutkitaan lajinsisäisten populaatioiden suhteita. Kielitieteessä fylogenetiikkaa voidaan soveltaa samaan kielikuntaan läheistä sukua olevien kielten tutkimiseen, ja populaatiogeneettisiä menetelmiä puolestaan lähisukukielten tai saman kielen sisäisten varianttien tutkimukseen. Fylogeneettisiin ja populaatiogeneettisiin analyysitekniikoihin perehdytään tässä väitöskirjassa neljän tutkimusartikkelin kautta. Artikkeleissa tutkitaan lähestymistapojen soveltuvuutta kielitieteelliseen tutkimukseen sekä ehdotetaan uusia laskennallisia lähestymistapoja historialliseen kielitieteeseen ja murteiden tutkimukseen. Tutkimus esittelee evoluutiopohjaista metodologiaa uralilaisten kielten ja suomen kielen murteiden tutkimukseen. Koko tutkimus on toteutettu osana monitieteistä BEDLAN-hanketta ja sen jatkohankkeita. Tutkimuksessa käytetään kieliaineistona uralilaisista kielistä kerättyä perussanastoaineistoa, joka on kerätty osana BEDLAN-hanketta ja sen jatkohankkeita, ja julkaistu osana tätä väitöskirjatyötä. Uralilaisia kieliä ei ole aiemmin tutkittu fylogeneettisilla tekniikoilla, mutta kielikuntaa on kattavasti tutkittu perinteisemmillä lähestymistavoilla; tämän suhteen kielikunta on otollinen näiden uusien tekniikoiden koestamiseen. Perussanastoaineiston lisäksi väitöskirja käyttää BEDLAN-hankkeen korjaamaa ja Kotuksen julkaisemaa Lauri Kettusen murrekartaston digitaalista versiota. Uralilaisten kielten tavoin myös suomen murteet tarjoavat otollisen kokeilualustan uusille tekniikoille niiden kattavan tutkimushistorian ansiosta. Näiden kieliaineistojen lisäksi väitöskirja käyttää myös simuloitua kieliaineistoa metodologian testaamisessa ja evaluoinnissa. Tutkimusartikkelien tulosten perusteella evoluutiopohjaiset analyysitekniikat toimivat hyvin sekä kielten että murteiden tutkimiseen ottaen huomioon miltä saadut tulokset näyttävät aiemmin julkaistun tutkimuksen valossa. Artikkelit tuovat myös uusia tekniikoita evoluutiobiologiasta kielitieteeseen mukaan lukien murrealueiden inferenssi populaatiogeneettisen klusteroinnin avulla ja fylogeneettinen TIGER-metriikka tapana arvioida kuinka puumainen rakenne kieliaineistolla on. Artikkelit tarjoavat myös perustaa jo käynnissä olevalle monitieteiselle ihmishistorian tutkimukselle. This dissertation focuses on quantitative analysis techniques that relate to language evolution. Over the last few decades an increasing number of linguists have acknowledged the benefits that quantitative analysis approaches can bring to the study of language data, such as increased objectivity, ease of replication as well as increased ability to handle large volumes of data. In addition to a more widespread acceptance of quantitative approaches in general, this has also brought analysis techniques from other research fields to linguistics. This includes methods from evolutionary biology, such as phylogenetic techniques, used to study historical relationships between different species, and population genetic techniques, which explore the relationships between the populations of a species. In the field of linguistics phylogenetic techniques can be used to quantitatively study related languages, while population genetic techniques are useful for studying more closely-related languages or varieties of the same language. The present work focuses on phylogenetic and population genetic analysis techniques through four research articles that explore the applicability of these approaches in linguistic research, and also proposes new quantitative techniques to the toolkits of historical linguistics and dialectology. It also brings evolutionary research to both Uralic languages and Finnish dialects. The research is part of the work done by the multidisciplinary BEDLAN research initiative and its follow-up projects. The language data used in the research comes from a dataset of Uralic basic vocabulary, compiled as part of the BEDLAN research initiative and its follow-up projects, and made publicly available as part of this dissertation’s work. This language family has not previously been explored using phylogenetic techniques, but is well-researched from a traditional standpoint, making it a good test subject for these techniques. In addition to the basic vocabulary data, the dissertation also uses dialect data from the digitized version of Lauri Kettunen’s Dialect Atlas of Finnish, error-checked and revised by the BEDLAN project and released by Kotus. Similarly to the Uralic language family, Finnish dialects also represent a good testing ground for new population genetic analyses due to the large amount of traditional research done on them. In addition to real-life datasets, the dissertation’s research also employs simulated language data as part of its methodological exploration. The four research articles show that evolutionary techniques work well for modeling relationships both between languages and within dialects, based on how the overall results compare to the literature. The articles also bring new techniques from evolutionary biology to linguistics, including population genetic clustering as a way of inferring dialect areas and a phylogenetic metric called TIGER values as a way of estimating how treelike a linguistic dataset is. The research that makes up this work has also laid groundwork for multidisciplinary research on languages as part of the overarching study of human history. |