Model Random Forest Regression Untuk Peramalan Penyebaran Covid-19 Di Indonesia

Autor: null Diana Tri Susetianingtias, null Eka Patriya, null Rodiah
Rok vydání: 2022
Zdroj: Decode: Jurnal Pendidikan Teknologi Informasi. 2:84-95
ISSN: 2775-1813
2775-2984
Popis: Penyebaran COVID-19 sangat cepat yang membuat pada tanggal 27 Februrari 2020, sudah menginfeksi 78630 orang di China dan 2747 orang lainnya meninggal dunia. Keberadaan COVID-19 di Indonesia sendiri pertama kali terkonfirmasi pada tanggal 2 Maret 2020. Pada penelitian ini, peneliti akan melakukan peramalan penyebaran COVID-19 di Indonesia menggunakan metode Random Forest Regression. Raw Dataset yang digunakan adalah dataset yang di dapat dari situs www.kaggle.com yang berisikan record sebanyak 10695 record yang dirangkum dari tanggal 1 Maret 2020 hingga 21 Januari 2021. Jumlah fitur yang dimiliki raw dataset sebanyak 37 fitur. Proses preprocessing pada penelitian ini terdiri dari konversi fitur, seleksi fitur dan mendapatkan fitur untuk model. Metode seleksi fitur yang digunakan adalah Recursive Feature Elimination yang berhasil menyeleksi fitur dari dataset yang tadinya berjumlah 37 menjadi 20 fitur. Pelatihan model menggunakan training set yang berjumlah 8555 record. Peramalan menggunakan model Random Forest Regression akan menggunakan validation set yang berjumlah 2139 record. Hasil perhitungan error pada model Random Forest Regression tidak besar, yaitu sebesar 6.477 untuk peramalan New Cases, dan 0.2469 untuk peramalan New Deaths yang artinya hasil nilai yang diramalkan dengan nilai aktual tidak berbeda jauh.
Databáze: OpenAIRE