Regresinės analizės taikymas didiesiems duomenims
Autor: | Indrė Baltušninkaitė, Nomeda Bratčikovienė |
---|---|
Jazyk: | English<br />Lithuanian |
Rok vydání: | 2018 |
Předmět: | |
Zdroj: | Lithuanian Journal of Statistics, Vol 57, Iss 1 (2018) |
Druh dokumentu: | article |
ISSN: | 1392-642X 2029-7262 |
DOI: | 10.15388/LJS.2018.5 |
Popis: | [straipsnis ir santrauka lietuvių kalba; santrauka anglų kalba] Šiame straipsnyje nagrinėjamos didžiųjų duomenų regresinės analizės galimybės ir galimi sunkumai. Straipsnyje išskirtos ir paaiškintos pagrindinės juos nusakančios charakteristikos, nustatyti galimi iššūkiai, kylantys didžiųjų duomenų analitikoje. Atsižvelgiant į tai, pasiūlyta keletas didžiųjų duomenų regresinėje analizėje naudojamų metodų, kurie leidžia sumažinti skaičiavimų naštą ir atrinkti nepriklausomus kintamuosius, geriausiai nusakančius priklausomą kintamąjį, bei pasiekti didesnį modelio tikslumą. Vienas iš darbo tikslų – metodų pritaikymas realiems didiesiems duomenims, todėl didelis dėmesys skiriamas tiriamajai daliai. Realių duomenų regresijos modelių sudarymui ir parametrų vertinimui naudojami išskaidytos ir stebinių įtakos indeksu paremtos regresijos metodai, o geriausiai priklausomąjį kintamąjį nusakančių nepriklausomų kintamųjų atrinkimui naudojama LASSO ir LARS regresija. Straipsnyje taip pat pateikiami atlikti modelių tinkamumo ir tikslumo vertinimai, jų tarpusavio rezultatų palyginimai. |
Databáze: | Directory of Open Access Journals |
Externí odkaz: |