Використання стохастичного автомату для консолідації даних

Autor: Koval, Olexandr V., Kuzminykh, Valeriy O., Khaustov, Dmitriy V.
Jazyk: angličtina
Rok vydání: 2017
Předmět:
Information technology
system analysis and guidance

Інформаційні технології
системний аналіз та керування

Open data sources
Data consolidation
Information-analytical systems
Information retrieval systems
Probabilistic models
Relevance
Big data tasks
Відкриті джерела даних
Консолідація даних
Інформаційно-аналітичні системи
Інформаційно-пошукові системи
Ймовірнісні моделі
Релевантні документи
Задачі обробки великих обсягів даних
Открытые источники данных
Консолидация данных
Информационно-аналитические системы
Информационно-поисковые системы
Вероятностные модели
Релевантность
Задачи обработки больших объемов данных
Информационные технологии
системный анализ и управление
Zdroj: Наукові вісті КПІ; № 2 (2017): ; 29-36
Научные вести КПИ; № 2 (2017): ; 29-36
Research Bulletin of the National Technical University of Ukraine "Kyiv Politechnic Institute"; № 2 (2017): Engineering; 29-36
ISSN: 1810-0546
2519-8890
Popis: Background. Development of methods and algorithms for efficient search of relevant information on demand. The article deals with the consolidation of data for subsequent use in the information and analytical systems.Objective. The aim of the paper is to identify capabilities and build relevant information search algorithms from disparate sources by analyzing the probability information identifying the possible presence of relevant documents in these sources.Methods. To find the relevant information for search queries the approach based on the use of probability estimates of relevant documents available in the sources of further increasing the number of selected documents from these sources to analyze their relevance to the query is used.Results. A stochastic programmable automaton structure to ensure selection of the most possible information sources by relevance parameters and information retrieval algorithm based on the use of stochastic automaton were developed.Conclusions. The described algorithm using stochastic automaton for data consolidation allows developing a set of software tools, provides plenty full and holistic data consolidation problem-solving for diverse systems which search for information from information sources different in composition and presentation type.
Проблематика. Разработка методов и алгоритмов эффективного поиска релевантной информации по запросам. В статье рассматриваются вопросы консолидации данных для дальнейшего их использования в информационно-аналитических системах.Цель исследования. Определение возможности и построение алгоритмов поиска релевантной информации из разнородных источников на основе анализа вероятностной информации, которая определяет возможность наличия реле­вантных документов в этих источниках.Методика реализации. Для поиска релевантной информации по поисковым запросам используется подход, который построен на использовании оценок вероятностей наличии релевантных документов в источниках с последующим увеличением числа выбираемых из этих источников документов для анализа их релевантности запросу.Результаты исследований. Разработаны структура программируемого стохастического автомата для обеспечения выбора наиболее вероятных по параметрам релевантности источников информации и алгоритм поиска информации на основе использования стохастического автомата.Выводы. Приведенный алгоритм с использованием стохастического автомата для консолидации данных позволяет разработать комплекс программных средств, обеспечивает достаточно полное и целостное решение задач консолидации данных для различных систем, которые осуществляют поиск информации из различных по составу и виду представления источников информации.
Проблематика. Розробка методів і алгоритмів ефективного пошуку релевантної інформації за запитами. У статті розглядаються питання консолідації даних для подальшого їх використання в інформаційно-аналітичних системах.Мета дослідження. Виявлення можливості та побудова алгоритмів пошуку релевантної інформації з різнорідних джерел на основі аналізу ймовірнісної інформації, що визначає можливість наявності релевантних документів у цих джерелах.Методика реалізації. Для пошуку релевантної інформації за пошуковими запитами використовується підхід, побудований на використанні оцінок ймовірностей наявності релевантних документів у джерелах із подальшим збільшенням кількості вибраних із цих джерел документів для аналізу їх релевантності запиту.Результати досліджень. Розроблено структуру програмованого стохастичного автомату для забезпечення вибору найбільш імовірних за параметрами релевантності джерел інформації та алгоритм пошуку інформації на основі використання стохастичного автомату.Висновки. Наведений алгоритм використання стохастичного автомату для консолідації даних дає змогу розробити комплекс програмних засобів, що забезпечує достатньо повний і цілісний розв’язок задач консолідації даних для різноманітних систем, що здійснюють пошук інформації з різноманітних за складом і видом представлення джерел інформації.
Databáze: OpenAIRE