DFedForest: Floresta Federada Descentralizada

Autor: Lucas Airam C. de Souza, Gabriel Antonio F. Rebello, Gustavo F. Camilo, Lucas C. B. Guimarães, Otto Carlos M. B. Duarte
Rok vydání: 2020
Zdroj: Anais do XX Simpósio Brasileiro de Segurança da Informação e de Sistemas Computacionais (SBSeg 2020).
DOI: 10.5753/sbseg.2020.19249
Popis: A eficácia dos sistemas de aprendizado de máquina depende fortemente da relevância dos dados que são empregados no treino. Usualmente, os dados são sensíveis e privados, pois são coletados de dispositivos e sensores usados no dia a dia das pessoas. A Lei Geral de Proteção de Dados (LGPD) coloca em risco a abordagem atual, pois regula o processamento remoto centralizado de dados sensíveis coletados de forma distribuída. Este artigo propõe um sistema de aprendizado de máquina distribuído baseado em algoritmos locais de floresta aleatória criados com árvores de decisão compartilhadas através da corrente de blocos. Os resultados mostram que a abordagem proposta iguala ou supera os resultados obtidos com o emprego de florestas aleatórias apenas com dados locais. Além disso, a proposta aumenta a detecção de novos ataques quando os domínios possuem distribuições de ameaça diferentes.
Databáze: OpenAIRE