ИСПОЛЬЗОВАНИЕ МЕТОДА АНАЛИЗА ИЕРАРХИЙ И ЭЛЕМЕНТОВ НЕЧЕТКОЙ ЛОГИКИ ДЛЯ ОПТИМИЗАЦИИ СТРУКТУРЫ БАЗЫ ДАННЫХ
Jazyk: | angličtina |
---|---|
Rok vydání: | 2022 |
Předmět: |
corporate information system
database management system distributed database SQL-query data replication multicriteria problem analytic hierarchy process fuzzy logic classification problem naive Bayes algorithm корпоративная информационная система система управления базами данных распределенная база данных SQL-запрос репликация данных многокритериальная задача метод анализа иерархий нечеткая логика задача классификации наивный алгоритм Байеса корпоративна інформаційна система система управління базами даних розподілена база даних SQLзапит реплікація даних багатокритеріальна задача метод аналізу ієрархій нечітка логіка задача класифікації наївний алгоритм Байєса |
Zdroj: | Radio Electronics, Computer Science, Control; No. 2 (2022): Radio Electronics, Computer Science, Control ; 101 Радиоэлектроника, информатика, управление; № 2 (2022): Радиоэлектроника, информатика, управление; 101 Радіоелектроніка, iнформатика, управління; № 2 (2022): Радіоелектроніка, інформатика, управління; 101 |
ISSN: | 1607-3274 2313-688X |
Popis: | Context. Informational systems are very common and use databases to store information that users need. Many different data models can be used but the relational model is still relevant. The last decade show tendency of using distributed databases while working with relational data model and this approach requires a specially designed module to synchronize data of all separate databases. Considering optimizing the database structure, researchers didn’t pay much attention to the potential of users’ SQL-queries history. The optimal structure of all the distributed nodes could reduce the necessity of synchronization while the data access speed and its actuality would remain stable. The object of the research is the process of optimizing the structure of the distributed database of corporate information systems, which are based on the relational database’s model. Objective. The research aims at improving the accuracy of the data representation marker’s value on the distributed corporate information system’s (DCIS) node, obtained using the analytic hierarchy process by applying the fuzzy logic elements while processing the alternatives’ global priority vector. Method. The research’s authors in the set of their previous works emphasize the potential of using the collected history of users’ SQL queries. Firstly presented technology of users’ queries parsing. Then, the idea of using the multidimensional database for analyzing users’ queries by slices of workstation type, application, user, and his/her position was considered. Finally, the authors gave the full-scaled mathematical model for formalizing database and query models, and criteria of database structure’s optimality.The current research continues the given sequence and tries to increase the efficiency of the decision support system, by introducing elements of fuzzy logic to the analytic hierarchy process algorithm. The approach’s main idea is in presenting the global priorities vector in the form of a series of fuzzy sets of one variable with subsequent transformation to the exact value. This approach made it possible to maintain the accuracy of the obtained result while decreasing the number of solution alternatives. For new tuples added to the database’s tables after all calculations had been performed, the problem was formalized. After obtaining the probability of a tuple belonging to the class “needed” and performing the normalization of the value, it is taken as the level of the representation marker. Accordingly, the data is loaded onto the node if this value is greater than the optimal level of the representation marker for the DCIS node. Results. After calculating and obtaining the alternatives global priorities’ vector in order to improve the accuracy of the obtained result, the apparatus of fuzzy sets was used. The obtained vector of global priorities was presented as a vector of fuzzy digits for the data representation marker with subsequent transformation to the exact value. This approach made it possible to maintain the accuracy of the obtained result while decreasing the number of solution alternatives. Conclusions. While working on the research, the concept of a data representation marker on the DCIS node for the elements of the SQL query model was introduced. An aggregation function has been developed that allows determining the level of need for attributes and tuples in the database’s relation for the DCIS node based on the statistics of SQL queries. A model of the dependence of the database structure’s optimality criteria on the value of the data representation marker is built. Received further development method of analytic hierarchy process. The initialization of the alternatives’ pairwise comparisons matrix can be performed automatically according to the obtained mathematical models. Representation of the obtained result in the form of the vector of fuzzy numbers with the reduction to the exact value allows increasing the accuracy of the obtained results. Актуальность. Информационные системы широко распространены и используют базы данных для хранения информации. Для использования доступны разные модели данных, но реляционная модель остается популярной. Последнее десятилетие демонстрирует тенденцию использования распределенных баз данных при работе с реляционной моделью, и этот подход требует специально разработанного модуля для синхронизации данных всех отдельных частей БД. Оптимальная структура всех распределенных узлов могла бы снизить необходимость синхронизации, а скорость доступа к данным и ее актуальность оставались бы стабильными. Метод. Авторы исследования в серии своих предыдущих работ акцентируют внимание на возможности использования собранной истории SQL запросов пользователей. Первоначально представлена технология разбора запросов пользователей. Затем была рассмотрена идея использования многомерной базы данных для анализа запросов пользователей по срезам типа рабочей станции, программы, пользователя и его должности. Также авторы предоставили математическую модель формализации модели базы данных и запросов, а также критерии оптимальности структуры базы данных. Исследование продолжает приведенную последовательность и пытается повысить эффективность системы поддержки принятия решений путем введения в метод анализа иерархий элементов нечеткой логики. Основная идея подхода заключается в представлении вектора глобального приоритета в виде серии нечетких множеств одной переменной с последующим превращением в точное значение. Для новых кортежей, добавленных в таблицы базы данных после выполнения всех вычислений, была сформулирована задача классификации. Результаты. После расчета и получения вектора глобального приоритета альтернатив с целью повышения точности полученного результата был использован аппарат нечетких множеств. Полученный вектор глобальных приоритетов был представлен в виде вектора нечетких множеств для представления данных маркера с последующим превращением в точное значение. Такой подход позволил сохранить точность получаемого результата при уменьшении количества альтернатив решения. Выводы. При работе над исследованием было введено понятие маркера представления данных на узле РКИС для элементов модели запроса SQL. Разработана функция агрегации, которая на основе статистики SQL-запросов позволяет определить уровень необходимости атрибутов и кортежей отношения базы данных на узле РКИС. Построена модель зависимости критериев оптимальности структуры базы данных узла РКИС от значения маркера представленности данных. Получил дальнейшее развитие метод анализа иерархий. Инициализация матрицы попарных сравнений альтернатив может выполняться автоматически в соответствии с полученными математическими моделями. Представление полученного результата в виде вектора нечетких чисел с приведением к точному значению позволяет повысить точность полученных результатов. Актуальність. Інформаційні системи дуже поширені і використовують бази даних для зберігання інформації. Для використання доступні різні моделі даних, але реляційна модель залишається популярною. Останнє десятиліття демонструє тенденцію використання розподілених баз даних під час роботи з реляційною моделлю, і цей підхід вимагає спеціально розробленого модуля для синхронізації даних усіх окремих частин БД. Оптимальна структура всіх розподілених вузлів могла б зменшити необхідність синхронізації, а швидкість доступу до даних та її актуальність залишалися б стабільними. Метод. Автори дослідження в серії своїх попередніх робіт акцентують увагу на можливості використання зібраної історії SQLзапитів користувачів. Спочатку представлена технологія розбору запитів користувачів. Потім була розглянута ідея використання багатовимірної бази даних для аналізу запитів користувачів за зрізами типу робочої станції, програми, користувача та його посади. Також автори надали математичну модель формалізації моделі бази даних і запитів, а також критерії оптимальності структури бази даних. Дослідження продовжує наведену послідовність і намагається підвищити ефективність системи підтримки прийняття рішень шляхом введення в метод аналізу ієрархій елементів нечіткої логіки. Основна ідея підходу полягає в представленні вектору глобального пріоритету у вигляді серії нечітких множин однієї змінної з подальшим перетворенням до точного значення. Для нових кортежів, доданих до таблиць бази даних після виконання всіх обчислень, була сформульована задача класифікації. Результати. Після розрахунку та отримання вектору глобального пріоритету альтернатив з метою підвищення точності отриманого результату було використано апарат нечітких множин. Отриманий вектор глобальних пріоритетів був представлений у вигляді вектору нечітких множин для маркера представлення даних з подальшим перетворенням до точного значення. Такий підхід дозволив зберегти точність отриманого результату при зменшенні кількості альтернатив рішення. Висновки. Під час роботи над дослідженням було введено поняття маркера представлення даних на вузлі РКІС для елементів моделі запиту SQL. Розроблено функцію агрегації, яка на основі статистики SQL-запитів дозволяє визначити рівень необхідності атрибутів і кортежів відношення бази даних на вузлі РКІС. Побудовано модель залежності критеріїв оптимальності структури бази даних вузла РКІС від значення маркера представленості даних. Отримав подальший розвиток метод аналізу ієрархій. Ініціалізація матриці попарних порівнянь альтернатив може виконуватися автоматично відповідно до отриманих математичних моделей. Представлення отриманого результату у вигляді вектору нечітких чисел із приведенням до точного значення дозволяє підвищити точність отриманих результатів. |
Databáze: | OpenAIRE |
Externí odkaz: |