Técnicas de aprimoramento de equidade em aprendizado: uma revisão sistemática de literatura

Autor: Kuhn, Nubia Stein
Přispěvatelé: Ribeiro, António Rui Trigo, Belfo, Fernando Paulo dos Santos Rodrigues
Jazyk: portugalština
Rok vydání: 2022
Předmět:
Popis: Decisões baseadas em algoritmos de aprendizado de máquina podem reproduzir tendências ou preconceitos presentes em dados históricos enviesados, oferecendo graves consequências sociais a grupos de indivíduos mal representados. Tendo como motivação principal poder contribuir para combater os preconceitos e vieses em aprendizado de máquina, esta dissertação tem como questão de investigação central a identificação de técnicas para o aprimoramento da equidade em aprendizado de máquina, através da realização de uma revisão sistemática de literatura sobre este tema. Com base no método PRISMA, apresentamos a revisão sistemática de literatura efetuada, a qual identificou 15 estudos recentes, com propostas e abordagens técnicas focadas em aprimorar a equidade em sistemas algorítmicos. Os trabalhos selecionados foram publicados em inglês nos últimos cinco anos e foram classificados e discutidos de acordo com as métricas de equidade e desempenho, os estágios de intervenção (pré-processamento, processamento ou pós-processamento), os conjuntos de dados e algoritmos utilizados nos experimentos. Foram identificadas 48 técnicas para aprimorar a equidade em aprendizado de máquina, as quais se apresentam neste trabalho. Verificou-se que a maioria das publicações procura a equidade através da métrica de paridade demográfica, e no estágio de pré-processamento dos dados. Uma parte significativa das referidas técnicas foram desenvolvidas através de algoritmos de regressão logística e de Random Forest. Relativamente aos datasets utilizados, o UCI Adult e COMPAS são largamente explorados em experimentações sobre o tema, o que, se por um lado, permite uma maior uniformização quanto à interpretação dos resultados, por outro lado, pode representar uma limitação quanto aos grupos envolvidos e as variáveis exploradas. A identificação de padrões sobre experimentações em equidade algorítmica, tais como em relação a métrica, técnicas e datasets utilizados, contribui com uma visão mais unificada que ajuda a democratizar e a promover o tema.
Databáze: OpenAIRE