Deteksi Dini Penyakit Diabetes Menggunakan Machine Learning dengan Algoritma Logistic Regression

Autor: null Erlin, null Yulvia Nora Marlim, null Junadhi, null Laili Suryati, null Nova Agustina
Rok vydání: 2022
Zdroj: Jurnal Nasional Teknik Elektro dan Teknologi Informasi. 11:88-96
ISSN: 2460-5719
2301-4156
DOI: 10.22146/jnteti.v11i2.3586
Popis: Diabetes menjadi salah satu penyakit yang mematikan di dunia, termasuk di Indonesia. Diabetes dapat menyebabkan komplikasi di banyak bagian tubuh dan secara keseluruhan dapat meningkatkan risiko kematian. Salah satu cara untuk mendeteksi penyakit diabetes adalah dengan memanfaatkan algoritma machine learning. Logistic regression merupakan model klasifikasi dalam machine learning yang banyak digunakan dalam analisis klinis. Pada makalah ini, dirancang model prediksi menggunakan logistic regression pada Python IDE untuk deteksi dini dengan memberikan prediksi seseorang terindikasi penyakit diabetes atau tidak berdasarkan data awal yang diberikan. Eksperimen dilakukan menggunakan dataset dari Pima Indians Diabetes Database yang terdiri atas 768 data pasien dengan delapan variabel independen dan satu variabel dependen. Exploratory data analysis dilakukan untuk mendapatkan wawasan maksimal dari dataset yang dimiliki menggunakan bantuan statistik dan mempresentasikannya melalui teknik visual. Beberapa variabel dataset memuat data yang tidak lengkap. Nilai data yang hilang digantikan dengan nilai median dari setiap variabel. Penanganan terhadap data yang tidak seimbang dilakukan menggunakan synthetic minority over-sampling technique (SMOTE) untuk meningkatkan kelas minoritas melalui sampel data sintesis. Model dievaluasi berdasarkan confusion matrix yang memperlihatkan kinerja yang cukup baik dengan nilai akurasi sebesar 77%, presisi 75%, recall 77% dan F1-score 76%. Selain itu, pada makalah ini juga digunakan teknik grid search sebagai hyperparameter tuning yang dapat meningkatkan kinerja dari model logistic regression. Kinerja model dasar dengan model sesudah dilakukan penerapan teknik grid search diuji dan dievaluasi. Hasil percobaan memperlihatkan bahwa model berbasis hyperparameter tuning mampu meningkatkan kinerja algoritma logistic regression untuk prediksi dengan nilai akurasi sebesar 82%, presisi 81%, recall 79%, dan F1-score 80%.
Databáze: OpenAIRE