Kan değerleri ile Covid-19 enfekte düzeyinin rassal orman sınıflandırıcı ile tahmin edilmesi = Prediction of Covid-19 infection level by blood samples with random forest classifier
Autor: | Gök, Elif Ceren, 1997- author 221547, Olgun, Mehmet Onur, 1985- thesis advisor 9380, Süleyman Demirel Üniversitesi. Fen Bilimleri Enstitüsü. Endüstri Mühendisliği Anabilim Dalı. 9372 issuing body |
---|---|
Jazyk: | turečtina |
Předmět: | |
Popis: | Covid-19 pandemisi ile meydana gelen ölüm oranlarındaki artış nedeniyle hastalık, dünya üzerinde ciddi bir sorun haline gelmiştir. Pandeminin dünyada sağlık güvenliği, ekonomik güvenlik, sosyal yaşam ve daha birçok alanda olumsuz etkileri görülmektedir. Covid-19 hastalığının zor ve vakit alan tanı süreci nedeni ile virüs istemsizce hızlı bir şekilde birçok çevreye yayılmaktadır. Hızlı ve etkin teşhis, yaşanılan sürecin üstesinden gelmek için önemli bir yer tutmaktadır. Covid-19 hastalığının teşhisinin doğru bir şekilde sağlanması büyük önem taşımakta ve bilgisayar destekli tıbbi teşhis sistemleri uygulamaları bu sebeple yaygın bir şekilde kullanılmaktadır. Bu çalışmada Brezilya Einstein Hastanesi'nden toplanan hastaların kan ve laboratuvar sonuçlarını içeren veri seti kullanılarak makine öğrenmesi algoritmaları ile hastaların Covid-19 hastalık seviyesi tahmin edilmiştir. Çalışma iki aşamadan oluşmaktadır: Birinci aşamada, veri madenciliği yöntemleri kullanılmadan veri seti üzerinde makine öğrenmesi yöntemleri uygulanırken, ikinci aşamada veri ön işleme yöntemleri ile veri setinin kullanılabilirliği artırılarak daha yüksek doğruluk oranına ulaşılmıştır. Çalışmanın sonunda, veri madenciliği uygulamalarından yararlanılarak hiperparametreleri optimize edilmiş Rassal Orman algoritması, 0.979 doğruluk oranı ile hastaların Covid-19 hastalık seviyesini başarılı bir şekilde tahminlemiştir. Anahtar Kelimeler: Covid-19, Veri Doldurma, Makine Öğrenmesi, Rassal Orman, SMOTE-NC Covid-19 has become a serious pandemic situation in the world with the spread rate and the increase in death rates that come with it. The negative effects of the pandemic in health security, economic security, social life, and many other areas are seen in the world. Due to the difficult and time-consuming diagnosis process of Covid-19, the virus spreads to many environments involuntarily. Fast and effective diagnosis has an importance in overcoming the pandemic process. Correct diagnosis of Covid-19 is of great importance and computer-aided medical diagnosis systems applications are widely used for this reason. In this study, the Covid-19 disease level of the patients was estimated by using the data set containing the blood and laboratory results of the patients collected from the Brazil Einstein Hospital and by machine learning algorithms. The study consists of two stages: In the first stage, machine learning methods were applied to the data set without using data mining methods, while in the second stage, the usability of the data set was increased with data preprocessing methods and a higher accuracy rate was achieved. At the end of the study, by using data mining applications and the Random Forest algorithm, whose hyperparameters were optimized, successfully predicted the Covid-19 disease level of the patients with an accuracy rate of 0.979. Keywords: Covid-19, Imputation, Machine Learning, Random Forest, SMOTE-NC Tez (Yüksek Lisans) - Süleyman Demirel Üniversitesi, Fen Bilimleri Enstitüsü, Endüstri Mühendisliği Anabilim Dalı, 2021. Kaynakça var. |
Databáze: | OpenAIRE |
Externí odkaz: |