German Loanwords in Digital Environment

Autor: Tepeš Golubić, Lidija
Jazyk: chorvatština
Rok vydání: 2022
Předmět:
Zdroj: Sociologija i prostor : časopis za istraživanje prostornoga i sociokulturnog razvoja
Volume 60
Issue 2 (224)
ISSN: 1849-0387
1846-5226
Popis: Okosnicu istraživanja opisanom u članku čini popis germanizama formiran iz rječnika hrvatskoga jezika, rječnika stranih riječi i doktorskih disertacija koje se bave proučavanjem germanizama u hrvatskom jeziku. Pripremljeni popis germanizama omogućio je njihovu računalnu analizu u medijskom prostoru, odnosno hrvatskom mrežnom korpusu hrWaC-u, koji obuhvaća tekstove objavljene na web-u u razdoblju od 4 godine. Jezične tehnologije potpomognute naknadnom ručnom obradom podataka omogućile su utvrđivanje učestalosti korištenja germanizama u pisanim tekstovima. Metodama automatske detekcije germanizama pronašli smo germanizme u svim njihovim oblicima koji su danas u uporabi u suvremenim tekstovima, čime je ujedno stvoren i čestotni rječnik germanizama. Provedenim istraživanjem utvrđena je zastupljenost germanizama u tekstovima suvremenog hrvatskog jezika. Iako ukupni broj germanizama koji se danas pojavljuje u hrvatskim rječnicima i ostalim konzultiranim izvorima iz kojih je formiran osnovni popis iznosi 17 988 lema, u uporabi je u suvremenim tekstovima dokazano 8 400 lema. Potvrđenih 8 400 lema dokaz su tomu da se leksičko blago hrvatskog jezika zabilježeno u rječnicima nije izgubilo u suvremenom hrvatskom jeziku, nego je sustavno ušlo u korpus hrvatskog jezika te postoji u tekstovima koji nisu nužno standardnojezični.
The framework of this research make German loan words compiled from the dictionaries of the Croatian language, dictionaries of foreign words, and PhD thesis studying German loanwords in the Croatian language. The list of German loanwords found in the contemporary Croatian texts was analised using linguistic technologies supported by subsequent manual data processing. The compiled list of gathered loan words allowed for their computational analysis in the hrWaC web corpus comprising the texts from the whole .hr domain collected in a period of four years. This research has established the presence of the German loan words in contemporary Croatian language texts. Although the total number of German loan words that appeared in contemporary dictionaries of the Croatian language and other sources consulted during the research was 17 988 lemmas, we were able to confirm the usage for only 8 400 lemmas in contemporary texts. Applying the automatic detection method, we have found all German loan words used in contemporary texts in all of their forms, simultaneously creating the German loan words frequency dictionary. The confirmed 8 400 lemmas serve as proof that the lexical treasure of the Croatian language recorded in dictionaries has not been lost in the contemporary Croatian language. On the contrary, it has systematically entered into the web corpus of the Croatian language and is found in the texts that do not necessarily belong to the standard language.
Databáze: OpenAIRE