Popis: |
Strojno učenje sve je popularniji alat korišten u medicinskoj dijagnostici. U ovom je radu istraženo strojno učenje u svrhu predikcije šećerne bolesti na temelju metagenomskih podataka pacijenata. Modeli su izgrađeni algoritmima slučajne šume, stroja potpornih vektora i ekstremnog pojačivanja gradijentom. Uz to, skupu podataka smanjena je dimenzionalost koristeći različite metode odabira značajki. Kako bi se model bolje prilagodio problemu, napravljena je i verzija algoritma rekurzivne eliminacije za odabir značajki. Dobiveni rezultati su analizirani i vizualizirani te uspoređeni s postojećim rješenjem. Rješenje je predloženo u programskom jeziku Python pomoću biblioteka Scikit-learn i XGBoost. Machine learning is becoming an increasingly popular tool used in medical diagnostics. This study explores machine learning for the purpose of predicting diabetes based on patients’ metagenomic data. Models were built using algorithms such as random forest, support vector machines and extreme gradient boosting. Additionally, the dimensionality of the dataset was reduced using various feature selection methods. To enhance the model’s adaptability to the problem, a custom version of the recursive feature elimination algorithm was additionally implemented. The obtained results were analyzed, visualized and compared to the existing solution. The solution was implemented in the Python programming language using the Scikit-learn and XGBoost libraries. |