Popis: |
Tez (Yüksek Lisans) -- İstanbul Ticaret Üniversitesi -- Kaynakça var. ÖZET Dünyadaki 50 milyondan fazla kişiden oluşan tüm nüfusun yaklaşık %1'i epilepsi ve epileptik nöbetlerden etkilenmektedir. Epileptik nöbetler, beynin elektriksel aktivitesindeki bir rahatsızlıktan kaynaklanır. Epilepsi nöbetinin saptanması genellikle elektroensefalografik (EEG) sinyal incelendikten sonra uzman görüşü tarafından gerçekleştirilir. Bu manuel bir süreçtir ve büyük ölçüde doktorun uzmanlığına dayanır. Bu nedenle, doktorların daha az hatayla teşhis koymasına yardımcı olmak için otomatik tanı veya yardım sistemleri gereklidir. Bu çalışmada, epileptik nöbetlerin varlığını sınıflandırmak için iyi bilinen bir veri kümesi kullanılmıştır. Veri setinin farklı konfigürasyonları literatürde bir kısmı Lojistik Regresyon, Dalgacık yöntemi, Karar Ağacı, Destek Vektör Makinesi, Yoğun Sinir Ağları, vb. birçok veri madenciliği ve makine öğrenme algoritması ile incelenmiştir. İyi tanı beklentisini karşılamak için Rassal Orman kullanılarak sınıflandırma modeli geliştirilmiştir ve sonuçlar aynı veri seti üzerinde incelenen farklı yöntemlerle karşılaştırılmıştır. Çalışılan deneylerin bazı vakalarında %99,78 oranında doğruluk, %99,95 özgüllük ve %99,61 hassasiyet elde edilmiştir ve sonuçlar modelinin başarılı şekilde sınıflandırdığını göstermektedir. Anahtar Kelimeler: EEG, Hiper Parametre Optimizasyonu, Makine öğrenmesi ABSTRACT About %1 of the whole population of the world which constitutes more than 50 million people are affected by epilepsy and epileptic seizures. Epileptic seizures are caused by a disturbance in the electrical activity of the brain. Detecting epileptic seizure is generally carried out by the expert opinion after examining the electroencephalographic (EEG) signal. This is a manual process and heavily relies on the expertise of the physician. Therefore automated diagnosis or aiding systems are required to assist physicians to diagnose with fewer errors. In this study, a well known dataset is used for classifying the existence of epileptic seizures. Different configurations of the data set have been studied with many data mining and machine learning algorithms in the literature, some of which are Logistic Regression, Wavelet Method, Decision Tree, Support Vector Machine, Dense Neural networks, etc. In this study, a classification model was developed by using Random Forest to meet the good diagnosis expectation, and results were compared with different methods studied on the same data set. In some cases of the studied experiments above 99,78 percent of accuracy, 99,95% specificity, and 99,61% sensitivity are obtained, indicating a good sign of classification model. Keywords: EEG, Hyper Parameter Optimization, Machine Learning. İÇİNDEKİLER İÇİNDEKİLER . i ÖZET . iii ABSTRACT . iv TEŞEKKÜR . v ŞEKİLLER DİZİNİ . vi ÇİZELGELER DİZİNİ . viii SİMGELER VE KISALTMALAR DİZİNİ . ix 1. GİRİŞ. 1 2. LİTERATÜR ÖZETİ . 2 3. MATERYAL VE YÖNTEM . 4 3. 1. Veri Seti . 4 3. 2. Ağaç Temelli Yaklaşım Ve Rassal Orman Algoritması . 5 3. 2. 1. Sınıflandırma ve regresyon ağaçları . 5 3. 2. 2. Sınıfladırma ve regresyon ağaçlarının kolektif metotlara evrimi . 8 3. 2. 3. Rassal orman algoritması. 9 3. 3. Hiper Parametre Optimizasyonu Ve Temel Bileşenler Analizi . 11 3. 3. 1. Hiper parametre optimizasyonu . 11 3. 3. 2. Temel bileşenler analizi . 13 3. 4. Makine Öğrenmesi Tekniğinin Uygulanması . 21 3. 4. 1. Python programlama dili ve özellikleri . 22 3. 4. 2. Yardımcı yöntemler ve başarım metrikleri . 22 3. 4. 2. 1. K katlı çapraz doğrulama . 23 3. 4. 2. 2. Karmaşıklık matrisi . 24 3. 4. 2. 3. Doğruluk . 25 3. 4. 2. 4. Hassaslık . 25 3. 4. 2. 5. Özgüllük . 26 3. 4. 3. Rassal orman algoritmasının uygulanması . 26 4. ARAŞTIRMA BULGULARI VE TARTIŞMA . 28 5. SONUÇ VE ÖNERİLER . 36 KAYNAKLAR . 37 ÖZGEÇMİŞ . 43 |