Dabartinės rašomosios lietuvių kalbos dažninis žodynas ir jo bazė
Autor: | Grumadienė, Laima |
---|---|
Jazyk: | litevština |
Rok vydání: | 2002 |
Předmět: |
Dabartinės rašomosios lietuvių kalbos dažninis žodynas
Lietuva (Lithuania) Lithuanian Language Corpus of Kaunas University electronic databases for Lithuanian Lietuvių kalbos elektroninė duomenų bazė Kauno VDU lietuvių kalbos tekstynas Kaunas. Kauno kraštas (Kaunas region) Frequency Dictionary of Modern Written Lithuanian |
Zdroj: | Acta linguistica Lithuanica 2002, t. 46, p. 19-37. |
ISSN: | 1648-4444 |
Popis: | Elektroninių dabartinės lietuvių kalbos duomenų bazių nėra daug, didžiausios iš jų yra V. Žilinskienės ir L. Grumadienės Dabartinės rašomosios lietuvių kalbos dažninio žodyno (1200000 žodžių pavartojimų) ir Vytauto Didžiojo universiteto Lietuvių kalbos tekstynas (60000000 žodžių pavartojimų). Lituanistikoje dar nėra tinkamos praktikos naudotis tiek elektroninėmis dabartinės kalbos duomenų bazėmis, tiek lingvostatistiniais leidiniais. Visų pirma, per mažai pratinama taip dirbti Lietuvos aukštosiose mokyklose, bet yra ir kita medalio pusė - per maža viešai prieinamų elektroninių lietuvių kalbos duomenų bazių. Viena iš atsilikimo priežasčių yra ir ta, kad elektroninės duomenų bazės nėra įteisinamos kaip autorinis darbas. Viena iš aktualiausių problemų Lietuvoje, susijusių su elektroninėmis duomenų bazėmis, yra jų sudarymo koncepcijos silpnumas: dažnai elektroninėmis duomenų bazėmis numatoma naudotis tik kaip elektronine forma pateiktu tekstu, nenumatant kompiuterinių technologijų pritaikymo duomenims apdoroti. Lituanistai turėtų susitarti dėl elektroninių duomenų bazių, kuriose naudojami specifiniai ženklai, pvz., senųjų raštų, transkribuotų tarmių tekstų, nes neretai tenka iš naujo perrinkti straipsnius su tokio tipo pavyzdžiais. Dabar leidžiami tarmių žodynai, tarmių tekstai, nors ir būdami elektroninės formos, yra tik spaustuvės modernėjimo ženklas, nes jų tekstais naudotis kaip elektronine duomenų baze neįmanoma. Nesant lituanistų susitarimo dėl bendros kodavimo sistemos viešas naudojimasis elektroniniais duomenų bankais labai apsunkinamas ir ribotas. There are few electronic databases for Lithuanian. The largest are the Frequency Dictionary of Modern Written Lithuanian, compiled by V. Žilinskienė and L. Grumadienė, and the Lithuanian Language Corpus of Kaunas University. The former is presented in detail here: the principles of its compilation and its possible uses are discussed, and the hitherto published work in statistical linguistics based on it is briefly characterised. The main problems in connection with the databases for modern Lithuanian are: (1) their insufficient differentiation (they reflect only the written, not the spoken language), (2) their not being optimally used, as the Lithuanian scholarly community lacks the preparation needed for working with such tools, and (3) the fact that the efforts of scholars compiling them receive too little public recognition and are not valued as original scholarly achievements. |
Databáze: | OpenAIRE |
Externí odkaz: |