Classification of electrocardiograms using digital signal processing and the classifier of the vector support machine

Jazyk: ruština
Rok vydání: 2022
Předmět:
DOI: 10.18720/spbpu/3/2023/vr/vr23-633
Popis: Тема выпускной квалификационной работы: «Классификация электрокардиограмм с помощью цифровой обработки сигнала и классификатора машины векторной поддержки». В данной работе исследуется возможность применения метода машины Ð¾Ð¿Ð¾Ñ€Ð½Ñ‹Ñ Ð²ÐµÐºÑ‚Ð¾Ñ€Ð¾Ð² для классификации аритмии по электрокардиограммам. Основной целью данной работы является построение алгоритма классификации аритмии по электрокардиограмме, в котором будут использованы разлиыне методики машинного обучения для создания модели машины Ð¾Ð¿Ð¾Ñ€Ð½Ñ‹Ñ Ð²ÐµÐºÑ‚Ð¾Ñ€Ð¾Ð². Задачами данной работы является изучение Ñ Ð°Ñ€Ð°ÐºÑ‚ÐµÑ€Ð¸ÑÑ‚Ð¸Ðº электрокардиограмм, изучение Ñ€Ð°Ð·Ð»Ð¸Ñ‡Ð½Ñ‹Ñ Ð¼Ð¾Ð´ÐµÐ»ÐµÐ¹ классификации, изучение машины Ð¾Ð¿Ð¾Ñ€Ð½Ñ‹Ñ Ð²ÐµÐºÑ‚Ð¾Ñ€Ð¾Ð², изучение Ñ€Ð°Ð·Ð»Ð¸Ñ‡Ð½Ñ‹Ñ Ð¼ÐµÑ‚Ð¾Ð´Ð¸Ðº улучшения модели классификации, построение данной модели и оценка ее работы. Для формирования модели классификации аритмии по электрокардиограмме был выбран метод конвейеризации, в котором объединяются несколько этапов предобработки Ð´Ð°Ð½Ð½Ñ‹Ñ Ð¸ последним этапом ставится модель машины Ð¾Ð¿Ð¾Ñ€Ð½Ñ‹Ñ Ð²ÐµÐºÑ‚Ð¾Ñ€Ð¾Ð². Предобработка Ð´Ð°Ð½Ð½Ñ‹Ñ ÑÐ¾ÑÑ‚Ð¾Ð¸Ñ‚ из Ð´Ð²ÑƒÑ ÑÑ‚Ð°Ð¿Ð¾Ð². Первым этапом является применение фильтра Савицкого-Голая для сглаживания Ð²Ñ Ð¾Ð´ÑÑ‰ÐµÐ³Ð¾ сигнала и удаления шумов из сигнала. Вторым этапом является масштабирование, которое позволяет привести все Ð²Ñ Ð¾Ð´ÑÑ‰Ð¸Ðµ к одному виду, тем самым значительно упростить работу модели. Так же применяются методы для улучшения модели, такие как поиск по сетке для 5 выбора Ð¾Ð¿Ñ‚Ð¸Ð¼Ð°Ð»ÑŒÐ½Ñ‹Ñ Ð³Ð¸Ð¿ÐµÑ€Ð¿Ð°Ñ€Ð°Ð¼ÐµÑ‚Ñ€Ð¾Ð², а так же метод One-Vs-Rest для Ð¿ÐµÑ€ÐµÑ Ð¾Ð´Ð° от бинарной классификации к мультиклассовой. Итогом данной работы является обученная модель, которая объединяет этапы препроцессинга и машины Ð¾Ð¿Ð¾Ñ€Ð½Ñ‹Ñ Ð²ÐµÐºÑ‚Ð¾Ñ€Ð¾Ð² в единую сущность. Оценка работы данной модели проводилась с помощью метода перекрестной проверки, который показал точность модели в 94 процента. Данную модель можно использовать в медицинской практике для облегчения получения диагноза аритмии, причем не просто для определения есть нарушения ритма или нет, а для определения конкретного типа аритмии. Так же данную модель можно использовать как один из Ð¾ÑÐ½Ð¾Ð²Ð½Ñ‹Ñ ÐºÐ¾Ð¼Ð¿Ð¾Ð½ÐµÐ½Ñ‚Ð¾Ð² ПО, которое можно использовать для анализа Ð±Ð¾Ð»ÑŒÑˆÐ¸Ñ ÐºÐ°Ñ€Ð´Ð¸Ð¾Ð³Ñ€Ð°Ð¼Ð¼, Ñ‚Ð°ÐºÐ¸Ñ ÐºÐ°Ðº в Ð¿Ñ€Ð¸Ð±Ð¾Ñ€Ð°Ñ ÑÑƒÑ‚Ð¾Ñ‡Ð½Ð¾Ð³Ð¾ мониторирования. Такое ПО может сильно облегчить определения патологий в работе сердца и будет оказывать серьезную помощь врачу для поставлния диагноза. Основным выводом данной работы является утверждение, что метод машины Ð¾Ð¿Ð¾Ñ€Ð½Ñ‹Ñ Ð²ÐµÐºÑ‚Ð¾Ñ€Ð¾Ð², вкупе с использованием Ñ‚Ð°ÐºÐ¸Ñ Ð¼ÐµÑ‚Ð¾Ð´Ð¾Ð² предобработки Ð´Ð°Ð½Ð½Ñ‹Ñ , как фильтр Савицкого-Голая и масштабирования, а так же при использовании методов определения Ð¾Ð¿Ñ‚Ð¸Ð¼Ð°Ð»ÑŒÐ½Ñ‹Ñ Ð³Ð¸Ð¿ÐµÑ€Ð¿Ð°Ñ€Ð°Ð¼ÐµÑ‚Ñ€Ð¾Ð² с помощью поиска по сетке и Ð¿ÐµÑ€ÐµÑ Ð¾Ð´ от бинарной классификации к мультиклассовой с помощью метода One-Vs-Rest, показывает Ñ Ð¾Ñ€Ð¾ÑˆÐ¸Ðµ результаты для задачи классификации аритмий по электрокардиограммам. Точность такой модели состоавляет 94 процента.
Topic of the final qualification work: "Classification of electrocardiograms using digital signal processing and the classifier of the vector support machine." In this paper, we investigate the possibility of using the support vector machine method for classifying arrhythmias from electrocardiograms. The main goal of this work is to build an algorithm for classifying arrhythmia by electrocardiogram, which will use various machine learning techniques to create a support vector machine model. The objectives of this work are to study the characteristics of electrocardiograms, the study of various classification models, the study of the support vector machine, the study of various methods for improving the classification model, the construction of this model and the evaluation of its work. To form a classification model for arrhythmia according to the electrocardiogram, a pipelinerization method was chosen, in which several stages of data preprocessing are combined, and the support vector machine model is set as the last stage. Data preprocessing consists of two stages. The first step is to apply the Savitsky-Golay filter to smooth the incoming signal and remove noise from the signal. The second stage is scaling, which allows you to bring all inputs to the same view, thereby greatly simplifying the work of the model. Methods are also used to improve the model, such as grid search to select the optimal hyperparameters, as well as the One-Vs-Rest method for the transition from binary classification to multiclass. The result of this work is a trained model that combines the stages of preprocessing and support vector machines into a single entity. The performance of this model was evaluated using the cross-validation method, which showed an accuracy of 94 percent of the model. 7 This model can be used in medical practice to facilitate the diagnosis of arrhythmia, and not just to determine whether there is a rhythm disorder or not, but to determine the specific type of arrhythmia. Also, this model can be used as one of the main components of software that can be used to analyze large cardiograms, such as in 24-hour monitoring devices. Such software can greatly facilitate the determination of pathologies in the work of the heart and will provide serious assistance to the doctor for making a diagnosis. The main conclusion of this work is the assertion that the support vector machine method, coupled with the use of data preprocessing methods such as the Savitsky-Golay filter and scaling, as well as when using methods for determining optimal hyperparameters using grid search and the transition from binary classification to multiclass using the One-Vs-Rest method, shows good results for the task of classifying arrhythmias from electrocardiograms. The accuracy of this model is 94 percent.
Databáze: OpenAIRE