Statistilised meetodid murdekorpuse ühendverbide tuvastamisel

Autor: Kristel Uiboaed
Jazyk: English<br />Estonian
Rok vydání: 2010
Předmět:
Zdroj: Eesti Rakenduslingvistika Ühingu Aastaraamat, Vol 0, Iss 6, Pp 307-326 (2010)
Druh dokumentu: article
ISSN: 1736-2563
DOI: 10.5128/ERYa6.19
Popis: Sõnadevahelise seose tugevuse mõõtmise statistikuid kasutatakse arvutilingvistikas püsiühendite tuvastamisel. Statistikud võimaldavad korpuses kahele sõnale arvutada nendevahelise seose tugevuse väärtuse, mille põhjal võib otsustada, kas tegemist on püsiühendiga või mitte. Statistikute kasutamise eelis on, et arvesse ei võeta ainult sõnade koosesinemise, vaid ka ühendit moodustavate sõnade eraldiesinemise sagedusi. Artiklis teen katse rakendada statistikuid Eesti murrete korpuse kaheliikmeliste ühendverbide automaatsel tuvastamisel. Katsetatud on kolme murderühma peal eraldi nelja statistikut: t-skoori, vastastikuse informatsiooni väärtust MI, hii-ruut statistikut ning log-tõepära funktsiooni.DOI: http://dx.doi.org/10.5128/ERYa6.19
Databáze: Directory of Open Access Journals