Zobrazeno 1 - 3
of 3
pro vyhledávání: '"Kuparinen, Olli Vilhelm"'
Language label tokens are often used in multilingual neural language modeling and sequence-to-sequence learning to enhance the performance of such models. An additional product of the technique is that the models learn representations of the language
Externí odkaz:
https://explore.openaire.eu/search/publication?articleId=od______1593::5cd538d61626e235fe1db11df6604cb1
http://hdl.handle.net/10138/358171
http://hdl.handle.net/10138/358171
Autor:
Kuparinen, Olli Vilhelm
This paper presents Murreviikko, a dataset of dialectal Finnish tweets which have been dialectologically annotated and manually normalized to a standard form. The dataset can be used as a test set for dialect identification and dialect-to-standard no
Externí odkaz:
https://explore.openaire.eu/search/publication?articleId=od______1593::733860b2c05487a873ba0543af38e038
http://hdl.handle.net/10138/358172
http://hdl.handle.net/10138/358172
Publikováno v:
Virittäjä
Artikkeli tarkastelee yleiskielen hd-yhtymän (kahdeksan) esiintymiä Helsingin puhekielessä ja mallintaa katomuotojen (kaheksan) etenemistä reaaliajassa. Artikkelin aineistona käytetään osaa Helsingin puhekielen pitkittäiskorpuksesta, joka kat