Cleaning Sensor Data in Intelligent Heating Control System

Autor: Zymbler, M.L., Kraeva, Ya.A., Latypova, E.A., Ivanova, E.V., Shnayder, D.A., Basalaev, A.A.
Rok vydání: 2021
Předmět:
Popis: Цымблер Михаил Леонидович, д.ф.-м.н., доцент, кафедра системного программирования, Южно-Уральский государственный университет (национальный исследовательский университет) (Челябинск, Российская Федерация). Краева Яна Александровна, преподаватель, кафедра системного программирования, Южно-Уральский государственный университет (национальный исследовательский университет) (Челябинск, Российская Федерация). Латыпова Елизавета Альбертовна, студент, кафедра системного программирования, Южно-Уральский государственный университет (национальный исследовательский университет) (Челябинск, Российская Федерация). Иванова Елена Владимировна, к.ф.-м.н., кафедра системного программирования, Южно-Уральский государственный университет (национальный исследовательский университет) (Челябинск, Российская Федерация). Шнайдер Дмитрий Александрович, д.т.н., доцент, кафедра «Автоматика и управление», Южно-Уральский государственный университет (национальный исследовательский университет) (Челябинск, Российская Федерация). Басалаев Александр Анатольевич, к.т.н., кафедра «Автоматика и управление», Южно-Уральский государственный университет (национальный исследовательский университет) (Челябинск, Российская Федерация). M.L. Zymbler, Ya.A. Kraeva, E.A. Latypova, E.V. Ivanova, D.A. Shnayder, A.A. Basalaev South Ural State University (pr. Lenina 76, Chelyabinsk, 454080 Russia) E-mail: mzym@susu.ru, kraevaya@susu.ru, latypovaea@susu.ru, elena.ivanova@susu.ru,shnaiderda@susu.ru, basalaevaa@susu.ru В современных интеллектуальных системах управления отоплением зданий зачастую возникают пропуски значений или выбросы в показаниях температурных и других датчиков ввиду сбоев программного или аппаратного обеспечения либо человеческого фактора. Для обеспечения эффективного анализа данных и принятия решений некорректные данные датчиков следует очищать путем восстановления пропущенных значений и сглаживания выбросов. В данной статье представлен пример SCADA-системы ПолиТЭР для управления отоплением, установленной в Южно-Уральском государственном университете, и описана структура и принципы реализации Модуля очистки данных, внедренного в указанную систему. Модуль очистки данных реализован с помощью технологий интеллектуального анализа данных и нейронных сетей в виде набора следующих подсистем. Препроцессор извлекает необработанные данные из хранилища данных системы и подготавливает обучающий набор данных для дальнейшей обработки. Предиктор представляет собой рекуррентную нейронную сеть для прогнозирования следующего значения датчика на основе его исторических данных. Реконструктор определяет, является ли текущее значение датчика выбросом, и в таком случае заменяет его на синтетическое значение, полученное Предиктором. Наконец, Детектор аномалий в режиме реального времени обнаруживает аномальные промежутки в данных датчика. В вычислительных экспериментах на реальных данных разработанный модуль показал относительно высокую и стабильную точность, а также адекватное обнаружение аномалий. Sometimes, smart heating control applications are partially equipped with missing values and outliers in the sensor data due to software/hardware failures/human errors. To provide an effective analysis and decision-making, erroneous sensor data should be cleaned by imputation of missing values and smoothing outliers. In this paper, we present a case of the Smart Heating Control System (SHCS) installed in the South Ural State University, and describe the structure and development principles of Data Cleaning Module (DCM) of the system. We implement DCM through data mining and neural network technologies as a set of the following subsystems. The preprocessor extracts raw data from the system's data warehouse and prepares a training data for further processing. Predictor provides Recurrent Neural Network (RNN) to forecast the next value of a sensor based on its historical data. Reconstructor determines if the current value of a sensor is an outlier, and if so, imputes it by the synthetic value from Predictor. Finally, Anomaly Detector subsystem discovers anomalous sequences in the sensor data. In the experiments on the real sensor data, DCM showed relatively high and stable accuracy as well as adequate detection of anomalies. Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований (грант№ 20-07-00140) и Министерства образования и науки РФ (государственное задание FENU-2020-0022).
Databáze: OpenAIRE