Automaatne ajaväljendite tuvastamine eestikeelsetes tekstides

Autor: Siim Orasmaa
Jazyk: English<br />Estonian
Rok vydání: 2012
Předmět:
Zdroj: Eesti Rakenduslingvistika Ühingu Aastaraamat, Vol 0, Iss 8 (2012)
Druh dokumentu: article
ISSN: 1736-2563
DOI: 10.5128/ERYa8.10
Popis: Artikkel käsitleb eestikeelsete tekstide arvutianalüüsi alamprobleemi: ajaväljendite automaatset tuvastamist tekstist. Ülesanne on püstitatud kaheosalisena: tekstist tuleb üles leida ajaväljendid (piiritleda ajaväljendifraasid) ning normaliseerida leitud ajaväljendite semantika (st esitada semantika eeldefineeritud märgenduskeele raamides). Artiklis kirjeldatakse ajaväljendite tuvastamisel kasutatavat märgenduskeelt ning piiritletakse vaadeldavate ajaväljendite hulk lähtuvalt märgenduskeele (aga ka praktilise analüüsi) võimalustest. Antakse ülevaade loodud reeglipõhise ajaväljendite tuvastaja tööpõhimõtetest ajaväljendite leidmisel ning semantika normaliseerimisel kasutatavatest strateegiatest. Programmi testimiseks moodustatakse Tartu Ülikooli koondkorpuse tekstidest u 70 000-sõnaline korpus, millel parandatakse käsitsi automaatse tuvastamise vead ning hinnatakse tuvastaja töö kvaliteeti.DOI: http://dx.doi.org/10.5128/ERYa8.10
Databáze: Directory of Open Access Journals