Suderinamumo su normaliuoju skirstiniu hipotezių tikrinimo kriterijų kūrimas ir galingumo lyginamasis tyrimas taikant Monte Karlo metodą
Autor: | Arnastauskaitė, Jurgita |
---|---|
Přispěvatelé: | Ruzgas, Tomas |
Jazyk: | litevština |
Rok vydání: | 2022 |
Předmět: | |
Popis: | Šiuolaikinėje duomenų analitikoje sudėtingesnių sprendimų priėmimas neįmanomas be hipotezių tikrinimo. Duomenų analitikai stengiasi panaudoti statistinę ir apriorinę informaciją. Paprastai jie savo tyrimus pradeda nuo hipotezių apie duomenų pasiskirstymą tikrinimo. Tai daroma dėl labai svarbių priežasčių: žinomas duomenų skirstinys gali paaiškinti duomenis generuojantį procesą, skirstinio charakteristikos gali būti susijusios su pradinio modelio parametrais, pagal žinomą duomenų skirstinį galima tikslingai taikyti tinkamus modelius ir sumažinti skaičiavimo kompiuteriu resursus. Dėl aptartų priežasčių ir didelės praktinės reikšmės disertacijoje nagrinėjama suderinamumo hipotezės tikrinimo problematika. Darbo tikslas buvo sukurti ir ištirti suderinamumo hipotezės tikrinimo vienmačius ir daugiamačius kriterijus, kurie būtų efektyvūs normalumo prielaidos atveju. Darbe yra pristatytas N-metrikos teorija paremtas suderinamumo hipotezės tikrinimo kriterijus, kuris yra galingesnis už kitus galingiausius vienmačius kriterijus dideliems imties dydžiams. Darbe taip pat pasiūlytas pasiskirstymo tankių skirtumo vertinimu ir apvertimo formulės taikymu paremtas daugiamatis suderinamumo hipotezės tikrinimo kriterijus, kuris pasižymi kur kas didesne galia nei kiti galingiausi kriterijai simetrinių ir mišriųjų skirstinių grupėms. Pagal gautus rezultatus galima padaryti išvadą, kad šiame darbe pristatyti statistiniai kriterijai gali būti sėkmingai taikomi realių duomenų analizės suderinamumo hipotezės tikrinimo uždaviniuose. In modern data analytics, making more complex decisions is not possible without testing hypotheses. Data analysts try to use statistical and a priori information. They usually start their research by testing hypotheses about the distribution of data. The information about data distribution can be useful in several of ways, for example: it can provide insights about the observed process, parameters of the model could be inferred from the characteristics of data distributions, it can help to choose more specific and computationally efficient methods. For these reasons and great practical significance, this study examines the issue of testing goodness-of-fit hypotheses. The aim of the work was create and examine univariate and multivariate tests for testing goodness-of-fit hypotheses that would be effective under the normality assumption. In this study. This work presents a goodness-of-fit hypothesis test based on N-metric theory, which is more powerful than other most powerful univariate tests for large sample sizes. The thesis also proposed a multivariate goodness-of-fit hypothesis test based on the evaluation of the difference in distribution densities and the application of the inversion formula, which has significantly higher power than the other most powerful tests for a groups of symmetric and mixed distributions. The statistical tests presented in this work can be successfully applied in real data analysis goodness of fit hypothesis testing tasks. |
Databáze: | OpenAIRE |
Externí odkaz: |