Algoritmo para raspagem de dados públicos relacionados às informações de atividades físicas para criação de um banco de dados e suas análises
Autor: | Afonseca, Leonardo Amaral |
---|---|
Přispěvatelé: | Watanabe, Renato Naville, Ackermann, Marko, Mena-Chalco, Jesús Pascual, Duarte, Marcos, Universidade Federal do ABC |
Rok vydání: | 2022 |
Předmět: | |
Zdroj: | Repositório Institucional da UFABC Universidade Federal do ABC (UFABC) instacron:UFABC |
Popis: | Orientador(a): Prof(a). Dr(a). Renato Naville Watanabe Coorientador: Prof. Marcos Duarte Dissertação (mestrado) - Universidade Federal do ABC, Programa de Pós Graduação em Engenharia Biomédica. São Bernardo do Campo, 2022 Neste trabalho, relatamos a geração de um dataset público, contendo dados de múltiplos esportes praticados por corredores de longa distância. Através de técnicas de web scraping, extraímos informações relacionadas a 37 esportes dos meses de 2019 e 2020 da plataforma Strava. Foram extraídas 14.644.391 atividades de 37.595 atletas de todo o mundo. Neste primeiro momento focamos na análise dos dados de corrida, no contexto individual e em grupos, além de análises dos volumes de treinamentos semanais comparados aos tempos médios de conclusão da maratona. Avaliamos como o treinamento de corredores foi afetado pela pandemia COVID-19, restringindo o dataset a 10.703.690 atividades de corrida de 36.412 atletas. Em 2020, relativamente a 2019, houve uma diminuição de 7% no volume de treinamento de corrida e de 7% do número de corredores. Também observamos grandes variações destas variáveis ao longo de 2020, chegando a 35% menos volume de corrida em setembro de 2020. In this work, we report the generation of a public dataset, containing data from multiple sports practiced by long distance runners. Through web scraping techniques, we extracted information related to 37 sports in the months of 2019 and 2020 from the Strava platform. 14,644,391 activities were extracted from 37,595 athletes from all over the world. We focused on the analysis of the running data, in the individual context and in groups. Additionaly, analyses of the weekly training volumes compared to the average times of the marathon conclusion were performed. We assessed how runner training was affected by the COVID-19 pandemic, restricting the dataset to 10,703,690 running activities by 36,412 athletes. In 2020, compared to 2019, there was a 7 % decrease in the volume of running training and a 7 % decrease in the number of runners. We also observed large variations in these variables throughout 2020, reaching 35 % less running volume in September 2020. |
Databáze: | OpenAIRE |
Externí odkaz: |