Taksi maršrutų didelio duomenų kiekio apdorojimas ir analizė
Autor: | Dundulis, Arnas |
---|---|
Přispěvatelé: | Kavaliauskas, Mindaugas, Gatautis, Rimantas |
Jazyk: | litevština |
Rok vydání: | 2017 |
Předmět: | |
Popis: | Analizuojant taksi maršrutų duomenis, vienas iš kriterijų, leidžiančių vairuotojui padidinti pajamas yra tai, ar keleivis už kelionę davė arbatpinigių. Kadangi tai nėra privaloma, norima gebėti prognozuoti, ar bus duodama arbatpinigių už tam tikrą kelionę.Vienas iš būdų pagerinti tokio prognozavimo tikslumą – duomenų grupavimas pagal tam tikrus kriterijus. Šiame darbe apžvelgiama socialiniai aspektai susiję su arbatpinigiais, aprašomi būdai, kaip galima klasterizuoti ir klasifikuoti taksi keliones. Panaudojamas k-vidurkių metodas klasterizavimui, palyginama klasifikavimo tikslumas tarp sprendimų medžių, atsitiktinių miškų ir neuroninių tinklų. Analyzing taksi trip data one of the criteria that allows drivers to increase their income is the whether the rider leaves a tip for the trip. Since this is not mandatory the ability to determine if a tip will be given after a ride is sought after. One of the ways to increase the accuracy of such a prediction is data grouping by some criteria. This article will explore the social aspects associated with gratuity and describe the ways in which taxi trip data can be clustered and classified. K-means method will be used for clusterization and classification accuracy will be compared between decision tree, random forest and neural network methods. |
Databáze: | OpenAIRE |
Externí odkaz: |