Acelerando Convoluções em Dispositivos Reprogramáveis

Autor: Welbert Hime Lino Castro, Fabio Luis Livi Ramos, Bruno Neves
Rok vydání: 2020
Zdroj: Anais da Escola Regional de Alto Desempenho da Região Sul (ERAD RS 2020).
DOI: 10.5753/eradrs.2020.10760
Popis: As Redes Neurais Convolucionais (RNC) executam tarefas como classificação e detecção de objetos, exigindo alto poder de processamento. Este trabalho descreve duas arquiteturas para dispositivos FPGA para aceleração da inferência das RNC, otimizando os acessos aos pixels nas convoluções. A versão com paralelismo apresenta ganho em latência proporcional ao número de unidades de operação utilizadas com baixo custo em área do dispositivo.
Databáze: OpenAIRE