Восстановление таблиц с частично отсутствующими данными

Autor: Stenin, A., Pasko, V., Melkumian, E., Stenin, S.
Jazyk: angličtina
Rok vydání: 2020
Předmět:
Zdroj: Adaptivni Sistemi Avtomatičnogo Upravlinnâ, Vol 2, Iss 35 (2020)
Адаптивні системи автоматичного управління : міжвідомчий науково-технічний збірник, 2019, № 2 (35)
ISSN: 2522-9575
1560-8956
Popis: Проблема відновлення даних зустрічається в найрізноманітніших додатках статистичного аналізу. Найчастіше це пов'язано з проведенням анкетування в різноманітних сферах народного господарства. При заповненні анкети експертом конкретної предметної області іноді він може не відповісти на всі питання або з технічних причин (збій каналу зв'язку), або з особистих обставин (не може надати переваги одному критерію перед іншим). Дані опитування в багатьох випадках формуються у вигляді прямокутних бінарних таблиць, де стовпці (рядки) являють собою досліджувані змінні, яким відповідають бінарні числа (1,0) або ознаки ( + , -). Ця стаття присвячена аналізу і відновленню бінарних даних в тих випадках, коли в таблиці частина значень змінних за вказаними вище причин відсутня. Рішення даного завдання пропонується здійснювати на основі методу однорідних груп. Суть даного методу полягає в відшуканні в генеральній сукупності бінарних даних однорідних груп суб'єктів опитування і визначенні приналежності суб'єкта опитування, у відповіді якого по одній з вище зазначених причин з'явився пропуск, до однієї з виділених однорідних груп. Даний метод добре працює при великих масивах бінарних даних з відносно невеликою кількістю пропусків, але, як і всі методи заповнення, володіє низкою зазначених вище недоліків і використовується там, де пропуски не мають критичного значення. В іншому випадку використовуються більш суворі методи, наприклад, методи моделювання з використанням функцій максимальної правдоподібності або байєсовських стратегій. The problem of data recovery found in a wide variety of statistical analysis applications. For example, it related to the survey in various sectors of the economy. When filling out a questionnaire specialist specific subject area sometimes there is a situation where he cannot answer all the questions for technical reasons (failure of the communication channel) or for personal reasons (he may not prefer one criterion to another). Survey data in many cases are formed in the form of rectangular binary tables, where columns (rows) are the studied variables that correspond to binary numbers (1, 0) or signs ( + , -). This article is devoted to the analysis and recovery of binary data in cases when the table of values of variables for the above reasons is absent. The solution of this problem proposed to carried out by the method of homogeneous groups. The essence of this method is to find in the General population of binary data of homogeneous groups of subjects of the survey and determine the affiliation of the subject of the survey, in the response of which for one of the above reasons there was a transition to one of the selected homogeneous groups. This method works well for large amounts of binary data with relatively few spaces. Otherwise, stricter methods, such as simulation methods using maximum likelihood functions or Bayesian strategies, are used. Проблема восстановления данных встречается в самых разнообразных приложениях статистического анализа. Зачастую это связано с проведением анкетирования в разнообразных сферах народного хозяйства. При заполнении анкеты экспертом конкретной предметной области иногда он может не ответить на все вопросы либо по техническим причинам (сбой канала связи), либо по личным обстоятельствам (не может оказать предпочтения одному критерию перед другим). Данные опроса во многих случаях формируются в виде прямоугольных бинарных таблиц, где столбцы (строки) представляют собой исследуемые переменные, которым соответствуют бинарные числа (1,0) или признаки (+, -). Настоящая статья посвящена анализу и восстановлению бинарных данных в тех случаях, когда в таблице часть значений переменных по указанным выше причинам отсутствует. Решение данной задачи предлагается осуществлять на основе метода однородных групп. Суть данного метода заключается в отыскании в генеральной совокупности бинарных данных однородных групп субъектов опроса и определении принадлежности субъекта опроса, в ответе которого по одной из выше указанных причин появился пропуск, к одной из выделенных однородных групп. Данный метод хорошо работает при больших массивах бинарных данных с относительно небольшим количеством пропусков, но, как и все методы заполнения, обладает рядом указанных выше недостатков и используется там, где пропуски не имеют критического значения. В противном случае используются более строгие методы, например, методы моделирования с использованием функций максимального правдоподобия или байесовских стратегий.
Databáze: OpenAIRE