Comparação de métodos de agrupamentos hierárquicos aglomerativos em indicadores de sustentabilidade em municípios do estado do Pará
Autor: | Crispim, Diêgo Lima, Fernandes, Lindemberg Lima, Filho, David Figueiredo Ferreira, Lira, Bruna Roberta Pereira |
---|---|
Jazyk: | portugalština |
Rok vydání: | 2020 |
Předmět: | |
Zdroj: | Research, Society and Development; Vol. 9 No. 2; e60922067 Research, Society and Development; Vol. 9 Núm. 2; e60922067 Research, Society and Development; v. 9 n. 2; e60922067 Research, Society and Development Universidade Federal de Itajubá (UNIFEI) instacron:UNIFEI |
ISSN: | 2525-3409 |
Popis: | This study aimed to compare the performance of hierarchical agglomerative clustering methods using a data set composed of several sustainability indicators referring to the municipalities of the state of Pará. As well as determining the number of initial groups to be formed by applying of validity indexes. For the selection of indicators, a check-list of national, regional and local scientific studies addressing the theme of sustainability was carried out. Subsequently, the indicators were standardized due to the units and scales of different measures, not interfering in the result and having similar weights in the calculation of the coefficient of similarity. The measure of dissimilarity used was the Euclidean distance, and to determine the hierarchical grouping method was used the agglomerative coefficient (AC). Validation indexes were used to establish the initial grouping number. The agglomerative method with the best performance regarding the (AL) was Ward with 0.94, indicating a better strength and quality among the agglomerative techniques. The Davies Bouldin (DB), Dunn (D) and Silhouette (SIL) validation indexes indicated that the ideal amount of initial clusters to be formed is 2, however the PBM index found that the ideal formation is with 4 groups. Regarding the municipalities with greater homogeneity, it was found that in the composition with 2 groups, the most similar observations were m105 (Salinópolis) and m109 (Santa Izabel do Pará), followed by the observations m102 (Rio Maria) and m144 (Xinguara), all inserted in group 1. El objetivo de este estudio fue comparar el desempeño de los métodos de agrupación aglomerativa jerárquica utilizando un conjunto de datos compuesto por varios indicadores de sostenibilidad referidos a los municipios del estado de Pará. Además de determinar el número de grupos iniciales que se formarán mediante la aplicación de índices de validación. Para la selección de los indicadores, se llevó a cabo una lista de control de estudios científicos nacionales, regionales y locales sobre el tema de la sostenibilidad. Posteriormente, los indicadores se estandarizaron debido a las unidades y escalas de las diferentes medidas, no interfiriendo en el resultado y teniendo pesos similares en el cálculo del coeficiente de similitud. La medida de disimilitud utilizada fue la distancia euclídea, y para determinar el método de agrupación jerárquica se utilizó el coeficiente aglomerativo (CA). Se utilizaron índices de validación para establecer el número de agrupación inicial. El método aglomerativo con el mejor rendimiento respecto al (AL) fue Ward con 0,94, lo que indica una mayor resistencia y calidad entre las técnicas aglomerativas. Los índices de validación de Davies Bouldin (DB), Dunn (D) y Silhouette (SIL) indicaron que la cantidad ideal de clusters iniciales a formar es 2, sin embargo el índice PBM encontró que la formación ideal es con 4 grupos. En cuanto a los municipios con mayor homogeneidad, se encontró que en la composición con 2 grupos, las observaciones más similares fueron m105 (Salinópolis) y m109 (Santa Izabel do Pará), seguidas por las observaciones m102 (Río María) y m144 (Xinguara), todas insertadas en el grupo 1. Este estudo teve como objetivo comparar o desempenho dos métodos de agrupamento hierárquico aglomerativo utilizando um conjunto de dados composto por diversos indicadores de sustentabilidade referentes aos municípios do estado do Pará. Assim como, definir a quantidade de agrupamentos iniciais a serem constituídos pela utilização dos índices de validade. Para seleção dos indicadores, foi feito um check-list de estudos científicos de abrangência nacional, regional e local que abordam a temática da sustentabilidade. Posteriormente, foi realizado a padronização dos indicadores, devido às unidades e escalas de medidas diferentes, não interferindo no resultado e possuindo pesos semelhantes no cômputo do coeficiente de similaridade. A medida de dissimilaridade empregada foi a distância euclidiana, e para determinar o método de agrupamento hierárquico foi utilizado o coeficiente aglomerativo (CA). Para estabelecer o número de agrupamento inicial foram empregados índices de validação. O método aglomerativo com melhor desempenho quanto ao (CA) foi de Ward com 0,94, indicando uma melhor força e qualidade entre as técnicas aglomerativos. Os índices de validação Davies Bouldin (DB), Dunn (D) e Silhouette (SIL), indicaram que a quantidade ideal de agrupamentos iniciais a ser formado são 2, todavia o índice PBM constatou que a formação ideal é com 4 grupos. Com relação aos municípios maior homogeneidade, verificou-se que na composição com 2 grupos, as observações mais similares foram m105(Salinópolis) e m109(Santa Izabel do Pará), seguido das observações m102 (Rio Maria) e m144 (Xinguara), todas inseridas no grupo 1. |
Databáze: | OpenAIRE |
Externí odkaz: |