XGBOOST: classification of parameters of regression analysis methods

Jazyk: ruština
Rok vydání: 2022
Předmět:
DOI: 10.18720/spbpu/3/2023/vr/vr23-530
Popis: Тема выпускной квалификационной работы: XGBOOST: классификация параметров методов регрессионного анализа.Объектом исследования данной работы является PW-эстиматор – один из методов оценки параметров кусочно-полиномиальной модели для Ð½ÐµÑÑ‚Ð°Ñ†Ð¸Ð¾Ð½Ð°Ñ€Ð½Ñ‹Ñ Ð²Ñ€ÐµÐ¼ÐµÐ½Ð½Ñ‹Ñ Ñ€ÑÐ´Ð¾Ð², точнее, один из его гиперпараметров – минимальный размер сегмента перед точкой разладки. Реализация данного эстиматора содержится во фреймворке А.А. Иванкова [8].Для этого разработаны программные модули фреймворка для редактирования ÐºÐ¾Ð½Ñ„Ð¸Ð³ÑƒÑ€Ð°Ñ†Ð¸Ð¾Ð½Ð½Ñ‹Ñ Ñ„Ð°Ð¹Ð»Ð¾Ð² и формирования множества оценок качества регрессионного анализа по различным метрикам; собрана (с исправлениями) библиотека XGBoost, на основании которой был реализован программный модуль для классификации гиперпараметра метода регрессионного анализа.Полученные результанты дают возможность выдвинуть ряд гипотез о поведении оценок качества регрессионного анализа и Ð·Ð°Ð²Ð¸ÑÐ¸Ð¼Ð¾ÑÑ‚ÑÑ Ð¼ÐµÐ¶Ð´Ñƒ оценками качества и значением гиперпарамметра.
The subject of graduate qualification work is XGBOOST: classification of parameters of regression analysis methods.The object of study in this thesis is the PW-estimator, one of the methods for estimating the parameters of a piecewise polynomial model for non-stationary time series. The study is aimed on its hypermarapeter, the minimum size of segment before break point. The A.A. Ivankov`s framework [8] contain the implementation of this estimator.There are software modules of this framework have been developed for editing configuration files and generating a set of quality evaluation for various metrics; compiled (with fixes) the XGBoost library, on the basis of which a software modules was implemented for classification of the hyperparameter of the regression analysis method.The results obtained make it possible to put forward a number if hypotheses about the behavior of the regression analysis quality estimates and the dependencies between the quality estimates and the value of the hyperparameter.
Databáze: OpenAIRE