Přispěvatelé: |
Ünal, Deniz, Çukurova Üniversitesi, Fen Bilimleri Enstitüsü, İstatistik Anabilim Dalı, Ünal Özpalamutcu, Deniz, İstatistik Anabilim Dalı |
Popis: |
TEZ10604 Tez (Yüksek Lisans) -- Çukurova Üniversitesi, Adana, 2017. Kaynakça (s. 63-68) var. xvi, 72 s. : res. (bzs. rnk.), tablo ; 29 cm. Günümüzde büyük veri ve uygulamaları içinde barındırdığı bilgi boyutu nedeniyle oldukça önemlidir. Özellikle bankacılık ve sigortacılıkta, büyük veri analizleri, veri madenciliği analizleri, temerrüde düşme olasılığını hesaplamak için kullanılmaktadır. Bu çalışmada Türkiye İstatistik Kurumu'ndan alınan 14 değişken ve 22745 gözlemden oluşan veri kullanılmıştır. Bu çalışmanın amacı, bireylerin özelliklerine göre temerrüde düşme olasılıklarının belirlenmesini sağlayan en iyi sınıflandırma algoritmasını seçmektir. Sınıflandırma algoritmaları; Bayes ağları, Naive Bayes, J48, rastgele orman, çok katmanlı algılayıcı, lojistik regresyon; kök ortalama hata kareler, doğruluk, anma, duyarlılık, ROC alanı istatistikleriyle karşılaştırılmış ve en iyi sınıflandırma algoritması belirlenmiştir. Analizler için WEKA açık kaynak kodlu veri madenciliği yazılımı kullanılmıştır. Nowadays Big Data and its applications have become very important because of the size of the information it has contained. Especially, banking and insurance industries use big data analysis, data mining analysis, to determine the default risk. In this study, the data which was taken from Turkish Statistical Institution, containing 22745 instances and 14 attributes, was used. The purpose of this study is to select classification algorithm that can help to determine default risk of individuals according to their characteristics. Bayes Network, Naive Bayes, Logistic Regression, J48, Random Forest, Multi Layer Perceptron classification algorithms were selected and compared by using accuracy, root mean squared error, Roc curve , recall, and precision statistics and the best classification algorithm was determined. To do analysis WEKA an open source data mining program was used. Bu çalışma Ç.Ü. Bilimsel Araştırma Projeleri Birimi tarafından desteklenmiştir. Proje No: FYL20178454. |