Popis: |
Sustavi za preporučivanje se koriste na mnogim internetskim stranicama. Njihov cilj je prepoznati što je korisniku zanimljivo te izdvojiti i prikazati takve predmete. Za to je potrebno prikupiti podatke koji otkrivaju korisnikov ukus tj. ocjene, događaje i ponašanje korisnika. Podaci se spremaju u obliku korisnik-predmet matrice u kojoj se za svaki korisnik-predmet par daje vrijednost koja predstavlja stupanj preferencije tog korisnika za taj predmet. Sustavi za preporučivanje se dijele na sustave temeljene na sadržaju i sustave temeljene na suradnji. Sustavi temeljeni na sadržaju su usredotočeni na atribute predmeta i daju preporuke temeljene na sličnosti među predmetima, a sustavi temeljeni na suradnji su usredotočeni na odnose između korisnika i predmeta tj. na sličnosti među korisnicima i/ili predmetima. Glavna značajka sustava za preporučivanje je određivanje koliko su dva predmeta ili korisnika slična, a to se može izračunati koristeći neku od mjera sličnosti. Najčešće korištena mjera sličnosti je kosinusna sličnost te je ona korištena i kod implementacije algoritama u ovom radu. Za evaluaciju sustava za preporučivanje izvan mreže koriste se statističke mjere preciznosti koje računaju koliko sustav precizno može predvidjeti kako bi korisnici ocijenili filmove koje su već vidjeli. U ovom radu opisane su različite metode i algoritmi koji se koriste pri implementaciji sustava za preporučivanje. Isprobani su neki od najčešće korištenih algoritama koji su objašnjeni uz priložene dijelove koda. Algoritmi su evaluirani koristeći mjere preciznosti. Korišten je skup podataka MovieLens koji sadrži podatke s internetske stranice za preporuku filmova. Za implementaciju je korišten programski jezik Python i njegove programske knjižice Pandas i Surprise. |