Popis: |
Em geral, a aplicação de algoritmos de aprendizado de máquina em problemas de redes utilizam datasets gerados a partir de traces de pacotes. Entretanto, o processo de geração dos datasets atuais não segue critérios que permitam identificar as informações necessárias para a reprodução e extensão dos mesmos. Dessa forma, este trabalho realiza um estudo detalhado sobre formas e ferramentas para reprodução dos tráfegos de rede dos datasets. Diante dos problemas de reprodutibilidade identificados, propomos uma metodologia para geração de datasets de traces de pacotes, de forma a minimizar esses problemas, possibilitando a reprodução dos seus tráfegos de rede e estendê-los com novos dados. |