Covariate Adjusted ROC Curve Analysis and An Application

Autor: Ertugrul Colak, Cengiz Bal, Ilker Etikan, Kazım Özdamar, Hasan Çetin Ekerbiçer, Unal Erkorkmaz
Rok vydání: 2015
Předmět:
Zdroj: Volume: 5, Issue: 3 140-149
Sakarya Tıp Dergisi
ISSN: 2146-409X
2146-2585
DOI: 10.5505/sakaryamj.2015.95914
Popis: Objective: Aim of this study is to analyze the change of the area under the adjusted ROC (AdjROC) curve in certain conditions via binormal distribution model using simulation studies and application of this algorithm to real data. Materials and Methods: Data sets simulated according to various conditions. PSA and age values of 125 patients who were examined prostate biopsy with pre-diagnosis of prostate cancer in Gaziosmanpasa University Faculty of Medicine Department of Urology at the years of 2005 to 2007. An algorithm and code program was written that make simulation according to various condition using PROC IML procedure in SAS statistical software.Results: According to the simulation study, if biomarker indicators in healthy group are constant and are lower or equal in healthy group than/to disease group, both adjusted AUC (AdjAUC) and AUC have small values and, no significant difference was found between them. The AUC was significantly larger when the biomarker indicators in disease group were higher. In addition, if the correlation between the covariate and biomarker is high in disease group and if AUC is approximately 0.75, then there is significant difference between adjusted AUC and AUC. PSA (Prostate Specific Antigen), a biomarker used for prostate cancer diagnosis, was analyzed based on the adjustments by age. It was found that adjusted AUC value was higher than unadjusted AUC value. Conclusions: For the adjusted ROC model being applicable, covariate and biomarker distributions must show double binormal distribution. If the biomarker can distinguish disease and healthy individuals correctly, then covariate is not needed. If correlation of healthy is approaching to 0 and correlation of disease is 0.50, and if AUC is less than 0.75, then covariate must be included in the model. Model does not work well when sample size of disease and healthy are less than 50.
Amaç: Bu araştırmada, benzetim çalışmalarından yararlanarak düzeltilmiş ROC eğrisi altında kalan alanın belirli koşullardaki değişiminin iki değişkenli normal dağılım modeli ile incelenmesi ve bu algoritmanın gerçek verilerle uygulanması amaçlanmıştır. Gereç ve Yöntemler: Benzetimde kullanılacak veri seti farklı koşullar altında türetilmiştir. Gerçek uygulama verisi olarak Gaziosmanpaşa Üniversitesi Tıp Fakültesi Üroloji Anabilim Dalında 2005-2007 yılları arasında prostat kanseri ön tanısı için prostat biyopsisi yapılan 125 hastanın PSA değerleri ile yaşları kullanılmıştır. Algoritma ve kodlar farklı koşullardaki benzetim modellerine göre SAS istatistik yazılımında PROC IML prosedürü kullanılarak yazılmıştır. Bulgular: Benzetim çalışmasına göre, biomarker göstergeleri sağlam grupta sabit ve hasta grupta sağlam gruba göre daha düşük veya eşit ise hem AUC (ROC Eğrisi Altında Kalan Alan) hem de düzeltilmiş AUC’nin düşük değerler aldığı bulunmuş ancak aralarında önemli fark görülmemiştir. Hasta grupta daha yüksek biomarker göstergeleri olduğunda ROC eğrisi altında kalan alan belirgin şekilde yüksek bulunmuştur. Ayrıca biomarker ile ortak değişken arasındaki korelasyon hasta grupta yüksek ve AUC yaklaşık 0.75 ise düzeltilmiş AUC ile AUC arasındaki fark önemli bulunmuştur. Prostat Kanseri biomarker’ı olan PSA’yı yaşa göre düzeltilmiş olarak incelediğimizde, düzeltilmiş AUC değerinin düzeltilmemiş AUC değerine göre daha yüksek olduğu bulunmuştur. Sonuç: Düzeltilmiş ROC modelinin uygulanabilir olması için ortak değişken ile biomarker, dağılımlarının çift iki değişkenli normal dağılım göstermesi gerekmektedir. Biomarker, hasta ve sağlam ayrımını iyi yapıyorsa ek bir değişkene ihtiyaç duyulmamaktadır. Sağlam gruptaki korelasyon 0’a yaklaştıkça ve hasta gruptaki korelasyon 0.50 ise ve AUC 0.75 ve daha küçük ise ortak değişkenin modele katılması gerekir. Hasta ve sağlam gruplarda örnek büyüklüğü 50’den küçük olması durumunda model etkili biçimde çalışmamaktadır.
Databáze: OpenAIRE