Comparative Analysis Of High Dimensional Survival Data With Supervised Principal Components, Penalized Cox Regression, And Extreme Learning Machines Methods

Autor: Cantaş Türkiş, Fulden
Přispěvatelé: Kurt Ömürlü, İmran, Aydın Adnan Menderes Üniversitesi, Sağlık Bilimleri Enstitüsü, Tıp Fakültesi, Temel Tıp Bilimleri Bölümü, Biyoistatistik Anabilim Dalı
Jazyk: turečtina
Rok vydání: 2022
Předmět:
Popis: Amaç: Bu çalışmanın amacı farklı sansür oranlarına göre türetilen yüksek boyutlu sağkalım verilerinde aşırı öğrenme makineleri tabanlı sağkalım modelleri, denetimli temel bileşenler analizi ile L2-cezalı Cox regresyon modellerinin sağkalım süresi ve kısa dönem sağkalım durumu tahminindeki performanslarının karşılaştırılması, birbirlerine benzerlik ve birbirlerinden farklılıklarının belirlenmesidir. Gereç ve Yöntem: n=200 birim ve aralarındaki korelasyon düzeyi -0,7 ile 0,7 arasında değişen p=1000 gen ifade değeri içeren yüksek boyutlu sağkalım veri setleri rastgele türetilmiştir. Türetilen veri setleri 70:30 oranında eğitim ve test setlerine rastgele ayrılmıştır. Eğitim setleri kullanılarak aşırı öğrenme makineleri tabanlı sağkalım, denetimli temel bileşenler ve L2-cezalı Cox regresyon modelleri eğitilmiştir. 1000 döngü ile gerçekleştirilen simülasyon sonunda modellerin test setinde sağkalım süresi ve kısa dönem sağkalım tahminlerine ilişkin performanslarının belirlenmesi için C-indeks, integrali alınmış Brier skoru, duyarlılık, özgüllük, doğruluk, negatif tanımlama, pozitif tanımlama oranları ile pozitif tanımlama oranı-duyarlılık eğrisi altında kalan alan, alıcı işlem karakteristiği eğrisi altında kalan alan, F1 skoru, Cohen’in kappa katsayısı ve Matthews korelasyon katsayısı performans ölçütleri hesaplanmıştır. Bulgular: Simülasyon bulguları incelendiğinde, çalışmada kullanılan sağkalım modellerinin performanslarının birbirine yakın olduğu belirlenmiştir. Sağkalım modellerinin hem sağkalım süresi hem de kısa dönem sağkalım tahminine ilişkin performanslarının sansür oranındaki artış ile düşüş eğiliminde olduğu gözlenmiştir. Uygulanan aşamalı kümeleme analizine göre, değişen sansür oranlarına göre birbirine yakın performans gösteren yöntemlerin aynı kümede yer aldığı tespit edilmiştir. Tüm senaryolarda olabilirlik tabanlı boosting aşırı öğrenme makineleri ve L2-cezalı Cox regresyon analizi yöntemlerinin birbirine en yakın performans gösteren yöntemler olduğu, model tabanlı boosting aşırı öğrenme makineleri yönteminin ise diğer tüm yöntemlerden daha uzak ve düşük bir performans gösterdiği dikkat çekmiştir. Sonuç: Sonuç olarak, sağkalım verilerindeki sansür oranının yüksek olması sağkalım modellerinin performanslarını olumsuz etkilemektedir. Modellerin yüksek boyutlu sağkalım verilerinin analizindeki performansları birbirine yakın olduğundan, denetimli temel bileşenler analizi gibi boyut indirgeme yöntemlerinin ve cezalı modellerin yerine yüksek boyutlu sağkalım verilerini özellikle doğrudan analiz edebilen aşırı öğrenme makineleri tabanlı sağkalım modellerinin kullanışlı ve diğer yöntemlere tercih edilebilir olduğu ortaya konmuştur. Anahtar kelimeler: Aşırı öğrenme makineleri, Cezalı Cox regresyon analizi, Denetimli temel bileşenler, Sağkalım, Simülasyon KABUL VE ONAY i TEŞEKKÜR ii İÇİNDEKİLER iii SİMGELER VE KISALTMALAR DİZİNİ v ŞEKİLLER DİZİNİ ix TABLOLAR DİZİNİ x ÖZET xi ABSTRACT xiii 1. GİRİŞ 1 1.1. Tezin Amacı 2 2. GENEL BİLGİLER 4 2.1. Cezalı Kısmi Logaritmik Olabilirlik Fonksiyonu 4 2.1.1. Parçalı Uyarlanabilir Ridge-Cezalı Cox Regresyon Modeli 5 2.1.2. L2-Cezalı Cox Regresyon Analizi 6 2.2. Denetimli Temel Bileşenler Analizi 7 2.3. Aşırı Öğrenme Makineleri (ELM) 10 2.3.1. Cezalı Cox Modelli Aşırı Öğrenme Makineleri (ELMCox) 13 2.3.2. Topluluk Öğrenme ve Cezalı Cox Modelli Aşırı Öğrenme Makineleri (ELMCoxEN) 14 2.3.3. Parçalı Uyarlanabilir Ridge Cezalı Cox Modelli Aşırı Öğrenme Makineleri (ELMCoxBAR) 14 2.3.4. Olabilirlik Tabanlı Boosting Aşırı Öğrenme Makineleri (ELMCoxBoost) 15 2.3.5. Model Tabanlı Boosting Aşırı Öğrenme Makineleri (ELMmBoost) 17 2.4. Model Değerlendirme Ölçütleri 18 3. GEREÇ VE YÖNTEM 22 3.1. Simülasyon Algoritması 22 3.1.1. Simülasyon Algoritması – I 22 3.1.2. Simülasyon Algoritması – II 23 3.2. Tahmin Modellerine İlişkin Parametreler 23 3.3. Kullanılan Programlar 24 4. BULGULAR 25 4.1. Sağkalım Süresi Tahminine İlişkin Bulgular 26 4.2. Kısa Dönem Sağkalım Durumu Tahminine İlişkin Bulgular 32 5. TARTIŞMA 51 6. SONUÇ VE ÖNERİLER 54 KAYNAKLAR 56 BİLİMSEL ETİK BEYANI 61 ÖZGEÇMİŞ 62
Databáze: OpenAIRE