Strojno učenje u uvjetima manje raspoloživosti podataka

Autor: Vedran Juričić
Jazyk: English<br />Croatian
Rok vydání: 2023
Předmět:
Zdroj: Politehnika, Vol 7, Iss 2, Pp 26-32 (2023)
Druh dokumentu: article
ISSN: 2584-5373
2584-6264
DOI: 10.36978/cte.7.2.3
Popis: Strojno učenje je predmet istraživanja brojnih znanstvenih i stručnih projekata, i važan sastavni dio sustava koji se koriste u medicini, bankarstvu, računalnoj sigurnosti, komunikaciji i brojnim drugim domenama. Jedno je od najaktivnijih područja istraživanja, s konstantnim napretkom i razvojem novih algoritama i pristupa, te poboljšanjem postojećih metoda. Značajan utjecaj na performanse modela strojnog učenja ima skup podataka nad kojim je napravljeno treniranje, odnosno kvaliteta podataka, ravnomjerna razdioba vrijednosti i veličina skupa. To predstavlja potencijalan problem kod metoda strojnog učenja koje zahtijevaju prethodno označene podatke, jer prikupljanje podataka može biti iznimno složeno, skupo i vremenski zahtjevno. U tom slučaju klasičan model strojnog učenja vrlo vjerojatno neće imati dobre performanse. Jedan od pristupa rješavanja ovog problema je primjena učenja prijenosom, u kojem model koristi skup podataka ne samo iz promatrane domene, već i iz druge, idealno srodne domene. U radu su simulirani uvjeti manje raspoloživosti skupa podataka, na kojem su analizirane performanse tri modela temeljena na neuronskim mrežama, od kojih se jedan temelji na prethodno istreniranom modelu. Opisan je postupak kreiranja skupova za treniranje i prezentirani su rezultati analize navedena tri modela s različitim veličinama skupova.
Databáze: Directory of Open Access Journals