KERNEL FUZZY CLUSTERING OF DATA STREAMS BASED ON THE ENSEMBLE OF NEURAL NETWORKS

Jazyk: ukrajinština
Rok vydání: 2018
Předmět:
Zdroj: Innovative Technologies and Scientific Solutions for Industries; № 4 (6) (2018); 42-49
Современное состояние научных исследований и технологий в промышленности; № 4 (6) (2018); 42-49
Сучасний стан наукових досліджень та технологій в промисловості; № 4 (6) (2018); 42-49
ISSN: 2522-9818
2524-2296
Popis: The subject matter of the study is data clustering based on the ensemble of neural networks. The goal of the work is to create a new approach to solving the tasks of clustering in data streams when information is fed observation-by-observation in online mode. The following tasks were solved in the article: the model of neural network ensembles for data clustering was created, the methods of data clustering to process mass data were developed, the methods of online data clustering of data using neural network ensembles working in the parallel mode were developed. The following results were obtained: the operation principles of the ensembles of the Kohonen neural network were formulated and practical requirements for dealing with mass data were specified. The probable approaches to solving these problems were indicated. The operation principle of the ensemble of parallel tuned Kohonen clustering networks was studied. The procedures based on the WTA and WTM principles were used to train layers of the neural network ensemble. Radial basis functions were used to increase the dimension of the input space. The mathematical model was developed for solving the problem of data clustering in online mode. The mathematical model was developed to determine the quality of clustering using the Davies-Bouldin index, which was rewritten for online mode. Conclusions. The paper proposes a new approach to solving the problem of clustering data streams when information is fed observation-by-observation in online mode, provided that the number and shape of clusters are unknown in advance. The main idea of this approach is based on the ensemble of neural networks, which consists of Kohonen self-organizing maps. All members of the ensemble process information that is sequentially fed into the system in parallel mode. Experimental results confirmed the fact that the considered system can be used to solve a wide range of Data Stream Mining tasks.
Предметом исследования в статье является кластеризация данных на основе ансамбля нейронных сетей. Цель работы – создание нового подхода в задачах кластеризации потоков данных, когда информация поступает в online режиме наблюдения за наблюдением. В статье решаются следующие задачи: формирование модели ансамблей нейронных сетей для кластеризации данных, разработка методов кластеризации данных при работе с данными больших размерностей, разработка методов онлайн кластеризации данных с использованием ансамблей нейронных сетей, работающих в параллельном режиме. Получены следующие результаты: сформулированы принципы работы ансамблей нейронных сетей Т. Кохонена, и определены практические требования для работы с данными большой размерности. Показаны возможные подходы для решения перечисленных задач. Исследован принцип работы ансамбля параллельно настроенных кластеризующих сетей Т. Кохонена. Для обучения слоев ансамбля нейронных сетей использовались процедуры, работающие по принципу WTA и WTM. Были использованы радиально-базисные функции для повышения размерностей входного пространства. Разработана математическая модель для решения задачи кластеризации данных в online режиме. Разработана математическая модель для определения качества кластеризации с использованием индекса Дэвиса-Булдена, который был переформулирован для online режима. Выводы: В работе предложен новый подход к задаче кластеризации потоков данных, когда информация поступает в online режиме наблюдение за наблюдением при условии, что количество и форма кластеров заранее неизвестны. Основная идея этого подхода базируется на ансамбле нейронных сетей, который состоит из самоорганизующихся карт Кохонена. Все члены ансамбля обрабатывают информацию, которая последовательно подается в систему в параллельном режиме. Экспериментальные результаты подтвердили тот факт, что рассматриваемая система может быть использована для решения широкого круга задач Data Stream Mining.
Предметом дослідження в статті є кластерування даних на основі ансамблю нейронних мереж. Мета роботи - створення нового підходу в задачах кластерування потоків даних, коли інформація надходить в online режимі спостереження за спостереженням. У статті вирішуються наступні завдання: формування моделі ансамблів нейронних мереж для кластерування даних, розробка методів кластерування даних при роботі з даними великих розмірностей, розробка методів онлайн кластерування даних з використанням ансамблів нейронних мереж, які працюють у паралельному режимі. Отримані наступні результати: сформульовано принципи роботи ансамблів нейронних мереж Т. Кохонена, і визначені практичні вимоги для роботи з даними великої розмірності. Показані можливі підходи для вирішення перерахованих завдань. Досліджено принцип роботи ансамблю паралельно налаштованих кластерувальних мереж Т. Кохонена. Для навчання шарів ансамблю нейронних мереж використовувалися процедури, які працюють за принципом WTA і WTM. Були використані радіально-базисні функції для підвищення розмірностей вхідного простору. Розроблено математичну модель для вирішення задачі кластерування даних в online режимі. Розроблено математичну модель для визначення якості кластерування з використанням індексу Девіса-Булдена, який був переформульований для online режиму. Висновки: В роботі запропоновано новий підхід до завдання кластерування потоків даних, коли інформація надходить в online режимі спостереження за спостереженням за умов, що кількість і форма кластерів заздалегідь невідома. Основна ідея підходу базується на ансамблі нейронних мереж, який складається з самоорганізованих мап Кохонена. Всі члени ансамблю обробляють інформацію, яка послідовно подається в систему в паралельному режимі. Експериментальні результати підтвердили той факт, що система може бути використана для вирішення широкого кола завдань Data Stream Mining.
Databáze: OpenAIRE