Popis: |
O crescimento do uso das redes sociais online pela sociedade as tornou importantes fontes de estudos em vários campos, desde o mercado de ações e previsão de eleições até o comportamento humano. No entanto, amostras de dados extraídas dessas redes tornaram-se vulneráveis à atividade de contas bots. Por isso, este trabalho propõe uma abordagem supervisionada para extração de conhecimento a partir de uma base de dados da literatura, utilizando técnicas que visam não apenas classificar, mas também descrever as principais características dos bots e das contas genuínas no Twitter. O modelo de classificação baseado em regras foi gerado com o objetivo de contribuir para a construção de um framework para coletar dados do Twitter com pouca interferência de contas maliciosas. Os resultados foram considerados satisfatórios, se comparados a outros trabalhos relacionados. |