Vispārinātie lineārie modeļi skaita tipa datu analīzei

Autor: Siliņš, Emīls
Přispěvatelé: Pahirko, Leonora, Latvijas Universitāte. Fizikas, matemātikas un optometrijas fakultāte
Jazyk: lotyšština
Rok vydání: 2022
Předmět:
Popis: Bakalaura darbs ir veltīts vispārināto lineāro modeļu, kas piemēroti skaita tipa datu analīzei, teorijas apskatam. Darbā apskatīts Puasona regresijas modelis, kā arī modeļi, kas piemēroti pārāk lielas dispersijas gadījumā (kvazi-Puasona un negatīvā binomiālā sadalījuma regresijas modeļi). Skaita tipa datos var būt situācijas, kad liels datu daudzums ir 0, tāpēc šādu datu analīzei aprakstīti īpaši piemēroti modeļi, jo iepriekšminētie modeļi šādiem datiem nevar sniegt korektus novērtējumus. Atsevišķi tika aprakstīta arī empīriskās ticamības funkcijas metode vispārināto lineāro modeļu koeficientu novērtēšanai un ticamības intervālu konstruēšanai, kuru var izmantot Puasona modeļa gadījumā. Darbā veiktas simulācijas, lai salīdzinātu dažādu modeļu sniegtos koeficientu novērtējumus, ticamības intervālu pārklājumu precizitātes un iegūto ticamības intervālu garumus. Simulāciju analīzes rezultātā ilustrētas atšķirības starp modeļu veidiem. Sniegta arī praktiska skaitu datu piemēra analīze, kas dod ieskatu piemērotākā modeļa izvēlē un iegūto regresijas koeficientu interpretācijā.
This bachelor thesis is devoted to generalized linear models for count data. The emphasis is on the Poisson regression model and other models that are appropriate for the overdispersion in data, such as Quasi-Poisson and negative binomial regression models. If there are frequent zeros in the data, the above models tend to give biased coefficient estimates, therefore zero-inflated regression models are also described in the thesis. The theory of the empirical likelihood function method was investigated. The extension of empirical likelihood method for general linear models can be used for estimating the coefficients and confidence intervals in case of Poisson regression models. Various data simulation scenarios were carried out to compare the coefficient estimates, confidence interval length and coverage for all types of models. The results obtained from simulation analysis show advantages and disadvantages of the described models. An analysis of real data example is also included in the thesis to provide insights into application of model fitting, the model diagnostics and the interpretation of the obtained regression coefficients.
Databáze: OpenAIRE