基于三阶张量的大规模数据谱聚类集成算法

Autor: 仵匀政, 杜韬, 周劲, 陈迪, 王心耕
Jazyk: čínština
Rok vydání: 2024
Předmět:
Zdroj: 大数据, Vol 10, Iss 3, Pp 133-148 (2024)
Druh dokumentu: article
ISSN: 2096-0271
DOI: 10.11959/j.issn.2096-0271.2024007
Popis: 为了降低大规模数据谱聚类计算负担,进一步提高聚类的准确性和鲁棒性,提出了一种基于三阶张量的大规模数据谱聚类集成算法。首先,提出一种混合代表最近邻近似方法构造数据间的稀疏亲和子矩阵;然后将稀疏亲和子矩阵表示为二部图,通过图分割的方法得到初步聚类结果;最后,提出三阶张量集成方法,将多个聚类结果进行融合,得到最终的聚类结果。在大规模的真实数据集和合成数据集上验证,相较经典的谱聚类算法、聚类集成算法以及近年来对其改进的算法,该算法表现出更优异的性能。
Databáze: Directory of Open Access Journals