Vardų distribucijos tyrimas statistikos metodais

Autor: Klijūnaitė, Ina, Nausėda, Aurimas
Jazyk: litevština
Rok vydání: 2010
Předmět:
Zdroj: Jaunųjų mokslininkų darbai, ISSN 1648-8776, 2010, [Nr.] 2(27), p. 81-86
Popis: Tekstuose ir tekstynuose vardai, kaip kalbiniai vienetai, turi distribucijas – susijusių leksemų visumą. Straipsnyje apžvelgiami lotyniškos ir lietuviškos kilmės dažnesni bei retesni vardai, pavartoti rašomojoje kalboje. Distribucija buvo ribojama sakinių ilgiu (iki 300 ženklų su tarpais), o jų visumos parametrai nustatomi statistiškai – pagal imtį (vardų vartojimo dažnumą). Lotynų kilmės vardai sulietuvinti. Visų vardų aplinkos leksinė sudėtis gretinama su dažnesnių bei retesnių lietuviškų vardų distribucijomis. Statistinės analizės rezultatai apibūdina vardų vartojimo ypatumus: 1) labiau paplitusių lietuviškos bei lotyniškos kilmės vardų pamatu susidarydavo gerokai didesnės distribucijos imtys; 2) rečiau vartojamų vardų distribucijos imtys buvo daug mažesnės. Vardai čia buvo tarsi sąlyginiai teminiai žodžiai, kurie atspindi reikšmines sąsajas su Lietuvos realijomis. Distribucijų statistinė analizė parodė, jog lietuviškų vardų dažninis vartojimas neretai sietinas su dėsningu kai kurių leksemų vartojimu. Pavyzdžiui, su vardais Audronė, Birutė, Eglė, Jūratė, Algirdas, Giedrius, Mindaugas, Vytautas sistemingai ir dažnai vartojami tokie žodžiai: buvo, yra, Lietuva, Vilnius, lietuvių, gyvenimas, galėti ir pan. Tačiau esama nemažai atsitiktinai ir retai vartojamų pavyzdžių, kurie sąlygojami laikmečio, madų bei kitokių faktorių. Tarkim, kompiuterinės programos pagrindu ne itin didelės distribucijų imtys buvo sudarytos su kai kuriais skolintiniais vardais (Akvilė, Kristina... [toliau žr. visą tekstą] In texts and corpora names as the linguistic units have distributions – the aggregate of related lexemes. Frequent and rare proper names of Latin and Lithuanian origin used in a written language are reviewed in the article. Distribution was limited by length of sentences (up to 300 characters, spaces included) and their aggregate parameters estimated statistically according to sampling (frequency of usage of proper names). The names of Latin origin were made Lithuanian. The lexical composition of all names was compared to distributions of more frequent and rare Lithuanian proper names. The results of statistical analysis describe usage of proper names: 1) on the basis of more widespread Lithuanian and Latin origin proper names, reasonably large distribution samplings were formed; 2) samplings of distributions of rarely used proper names were considerably smaller. Here names have been as conditionally thematic words, which reflect notional links to Lithuanian realia. Statistical analysis of distributions has shown that frequency of usage of Lithuanian names is often related to regular use of some lexemes. For example, with proper names Audronė, Birutė, Eglė, Jūratė; Algirdas, Giedrius, Mindaugas, Vytautas regularly and frequently words buvo, yra, Lietuva, Vilnius, lietuvių, gyvenimas, galėti, etc. are related. However, many accidental and rare use examples conditioned by time, fashion and other factors exist. Suppose, based on computer software not large distributions’... [to full text]
Databáze: OpenAIRE