Popis: |
Örnekleme yöntemleri kullanılarak yapılan araştırmalarda hedef yığın ilgilenilen karakteristikler için en iyi şekilde temsil edilmelidir. Temsil sorunu ile karşılaşmamak ve parametreleri etkin biçimde tahmin etmek için hedef yığını olabildiğince kapsayan bir örnekleme çerçevesi oluşturulmalıdır. Bu çerçeve kullanılarak birimlerin seçim olasılıklarının farklı olduğu durumlarda tasarım ağırlıklarının kullanımını gerektiren örnekleme tasarımları geliştirilir. Cevapsızlık, kapsamdışılık gibi sorunların tasarım ağırlıklarında olumsuz etkisini azaltmak amacıyla bazı düzeltme işlemleri yapılır. Kalibrasyon yaklaşımı, yardımcı bilgi kullanarak bilinen yığın değerlerine uyum sağlayan bir ağırlıklandırma işlemidir. Bu tez çalışmasındaki amaç, aykırı değer, aykırı ağırlık ve farklı korelasyon yapılarının olduğu büyük veri setlerinde kullanılabilecek ağırlıklandırma ve kalibrasyon işlemlerinin etkinliklerinin araştırılmasıdır. Bu durumlarda genellikle ağırlık budaması kullanılarak sorunlar giderilmektedir. Bu çalışmada, ağırlık budamasına alternatif olarak uygulamada kullanımı daha kolay olan minimum uzaklık yöntemlerinden sınırlandırılmış kalibrasyon tahmin edicileri incelenmiştir. Ayrıca yardımcı değişkenlerin korelasyon yapısının kalibrasyon tahmin edicilerinin etkinliklerini ne düzeyde etkilediği de araştırılmıştır. Simülasyon çalışması yapılarak, ele alınan tahmin edicilerin etkinlikleri farklı korelasyon yapıları ve aykırı değer durumları için elde edilmiştir. Simülasyon çalışması sonucunda, kalibrasyon tahmin edicilerinin Horvitz-Thompson tahmin edicisinden daha etkin olduğu; yardımcı değişkenlerin hedef değişkenle korelasyonu arttığında etkinliğin belirgin biçimde arttığı gözlemlenmiştir. Bunlara ek olarak hedef ve yardımcı değişkenlerde aykırı değerler olduğunda, kalibrasyon tahmin edicilerinin göreli etkinliğinin sorunsuz veri setlerine göre çok daha büyük olduğu da belirlenmiştir. Tezin uygulama kısmında ise 2017 Yıllık Sanayi ve Hizmet İstatistikleri verisi kullanılmış ve `Ciro` gibi varyansı yüksek olan değişkenlerin tahmininde sınırlandırılmış kalibrasyon tahmin edicilerinin Genelleştirilmiş regresyon tahmin edicisinden daha etkin oldukları tespit edilmiştir. Özellikle küçük örnekleme oranlarında, kalibrasyon işlemi sonrasında karşılaşılan negatif ve birden küçük ağırlık sorununu çözme konusunda sınırlandırılmış kalibrasyon tahmin edicilerinin, ağırlık budaması ile elde edilen tahmin edicilerden daha etkin sonuçlar verdiği belirlenmiştir. Target population should be represented in the best way for the related characteristics in the sample surveys. A sampling frame that covers the target population as much as possible is constructed in order not to encounter the problem of representation and estimate the parameters efficiently. By using this frame, sampling designs in which the probability of selection of units is generally different and therefore require design weights usage are developed. For reducing the negative effects of non-response and out-of-scope problems some adjustments are made in design weights. The calibration approach is a weighting process that agree with the known population values by using auxiliary information. The purpose of this thesis is to analyze the efficiency of calibration and weighting processes that can be used in large data sets with outliers, extreme weights and different correlation structures. In these cases, problems are usually solved by using weight trimming. In this study, restricted calibration estimators, which are easier to apply in practice as an alternative to weight trimming, are examined. It was also investigated that how the correlation structure of the auxiliary variables affects the efficiency of the calibration estimators. As a result of the simulation study, the calibration estimators are more efficient than the Horvitz-Thompson estimator. The efficiency increase explicitly when the correlation of auxiliary variables with target variable increased. Moreover, the relative efficiency of the calibration estimators is much greater when there are outliers in the target and auxiliary variables against smooth data sets. 2017 Annual Industry and Service Statistics data was used in the application and it was determined that restricted calibration estimators are more efficient than Generalized Regression estimator for the estimation of high variance variables such as `Turnover`. Especially in small sample fractions, it was recognized that the restricted calibration estimators more efficient than the weight trimming about to solve the negative and less than one weights problem encountered after the calibration process. 125 |