Lisans yerleştirme sınavında yerleşme başarısının karar ağaçlarına göre bagging ve boosting yöntemleriyle sınıflandırılması

Autor: Tuğ Karoğlu, Tuğba
Přispěvatelé: Okut, Hayrettin, Zootekni Anabilim Dalı
Jazyk: turečtina
Rok vydání: 2018
Předmět:
Popis: Bu tez çalışması; 2010-2013 yılları arasında Türkiye'nin 81 ilinde Öğrenci Seçme ve Yerleştirme Merkezi (ÖSYM) tarafından düzenlenen Yükseköğrenime Giriş Sınavına (YGS) giren; 180 ve üzeri puan alarak ikinci basamak sınavı olan Lisans Yerleştirme Sınavına (LYS) girmeye hak kazanan öğrencilerin Ensemble modellerinden ikisi olan `Bagging` ve `Boosting` yöntemleri ile sınıflandırılmasının yapılması amacıyla gerçekleştirilmiştir.Bu amaçla Türkiye İstatistik Kurumu (TÜİK)'ten ve ÖSYM arşivinden değişkenlerle ilgili veriler toplanmıştır. ÖSYM sınav kılavuzu incelenerek değerlendirmelerin yapılmasında bu kılavuzdaki esaslar dikkate alınmıştır.Literatür taramaları yapılmış, veriler toplanmış ve MATLAB bilgisayar programında Baggingve Boosting yöntemleriyle sınıflandırma işlemleri gerçekleştirilmiş, R bilgisayar programında da Kümeleme Analizi yapılarak desteklenmiştir. Hiyerarşik kümeleme sonuçları Doğu Anadolu'daki illerin kendi arasında, Marmara, Batı Ege ve Batı Akdeniz Bölgeleri'ndeki illerin ise kendi arasında gruplaşmış olduğu gözlenmiştir. İç Anadolu ile Orta ve Doğu Karadenizde bulunan iller ile Gaziantep, Malatya ve Elazığ benzerlikleri ayrıca dikkat çekicidir.Çalışma sonucunda `Bagging` ve `Boosting` yöntemleri sınıflandırma sonucundaki performansları karşılaştırılmış ve ayrıca kümeleme analizi ile yapılan sınıflandırmalar desteklenmiştir. Buna göre; `Bagging` ve `Boosting` yöntemlerinin hatayı düşürmede iyi bir performans sergiledikleri belirlenmiştir.Anahtar kelimler:AdaBoost,Bagging, Boosting, Bootstrap, Ensemble Modeller,Kümeleme. This study was conduted to classify the student those took Undergraduate Placement Exam (LYS) organized by Student Selection and Placement Center (OSYM). For the classification, two ensemble methods, Bagging and Boosting were considered.Therefore, data compromised student exam scores and related variables were retrieved from the archives of Turkish Statistical Institue (TUIK) and Student and Placement Center.The evalution has been done by considering the regulations specified in the Handbook of Student Selection and Placement Center (OSYM). MATLAB and R package programs were used to obtained clustering, corrograms, biclustering and bagging and boosting results. Hierarchical clustering results depicted that the provinces within Eastern Anatolia clustered in the same cluster group. Likewise, the provinces of Marmara, Western Eagen and Southern Mediterranean regions clustered into the same cluster in term of similarities. The provinces of Center Aanatolia and Center and Eastern Black Sea, as well as Gaziantep and Elazığ, clustered into the same cluster in terms of similarities distance was used for clustering. These classifications were supported by bagging and boosting. Frther, the conclusion has been done that bagging and boosting have a good predictive ability to classify results by decrease the sum of the squared error term.Keywords:AdaBoost, Bagging, Boosting, Bootstrapping,Ensemble Models, Clustring. 127
Databáze: OpenAIRE