Розробка комбінованої моделі розпізнавання зображень

Autor: Voloshyn, Mykola
Jazyk: angličtina
Rok vydání: 2019
Předmět:
Zdroj: Technology audit and production reserves; Том 3, № 2(47) (2019): Information and control systems; 9-14
Technology audit and production reserves; Том 3, № 2(47) (2019): Інформаційно-керуючі системи; 9-14
Technology audit and production reserves; Том 3, № 2(47) (2019): Информационно-управляющие системы; 9-14
ISSN: 2226-3780
2312-8372
Popis: The object of research is the processes of identification and classification of objects in computer vision tasks. Currently, for the recognition of images, the best results are demonstrated by artificial neural networks. However, learning neural networks is a poorly conditioned task. Poor conditioning means that even a large data set can carry a small amount of information about a problem that is being solved. Therefore, a key role in the synthesis of parameters of a specific mathematical model of a neural network belongs to educational data. Selection of a representative training set is one of the most difficult tasks in machine learning and is not always possible in practice.The new combined model of image recognition using the non-force interaction theory proposed in the paper has the following key features:– designed to handle large amounts of data;– selects useful information from an arbitrary stream;– allows to naturally add new objects;– tolerant of errors and allows to quickly reprogram the behavior of the system.Compared to existing analogues, the recognition accuracy of the proposed model in all experimental studies was higher than the known recognition methods. The average recognition accuracy of the proposed model was 71.3 %; using local binary patterns – 59.9 %; the method of analysis of the main components – 65.2 %; by the method of linear discriminant analysis – 65.6 %. Such recognition accuracy in combination with computational complexity makes this method acceptable for use in systems operating in conditions close to real time. Also, this approach allows to manage the recognition accuracy. This is achieved by adjusting the number of sectors of the histograms of local binary patterns that are used in the description of images and the number of image fragments used in the classification stage by the introformation approach. To a large extent, the number of image fragments affects the time of classification, since in this case, it is necessary to calculate the matching of the system actions in each of the possible directions in pairs.
Объектом исследования являются процессы идентификации и классификации объектов в задачах компьютерного зрения. В настоящее время для распознавания изображений лучшие результаты показывают искусственные нейронные сети. Однако, обучение нейронных сетей – это плохо обусловленная задача. Плохая обусловленность означает, что даже большой набор данных может нести в себе малый объем информации о решаемой задаче. Поэтому ключевая роль в процессе синтеза параметров конкретной математической модели нейронной сети принадлежит учебным данным. Подбор репрезентативной обучающей выборки является одной из самых сложных задач в машинном обучении и не всегда возможен на практике.Предложенная в работе новая комбинированная модель распознавания изображений с использованием теории несилового взаимодействия обладает такими ключевыми особенностями:– предназначена для обработки большого количества данных;– выделяет полезную информацию из произвольного потока;– позволяет естественно добавлять новые объекты;– терпимая к ошибкам и позволяет быстро перепрограммировать поведение системы.По сравнению с существующими аналогами, достоверность распознавания предложенной моделью во всех экспериментальных исследованиях была выше известных методов распознавания. Средняя достоверность распознавания предложенной моделью составила 71,3 %; методом локальных бинарных шаблонов – 59,9 %; методом анализа главных компонент – 65,2 %; методом линейного дискриминантного анализа – 65,6 %. Такая достоверность распознавания в сочетании с вычислительной сложностью делает данный метод приемлемым для применения в системах, работающих в условиях приближенных к реальному времени. Также такой подход позволяет управлять достоверностью распознавания. Это достигается благодаря настройке количества секторов гистограмм локальных бинарных шаблонов, которые используются при описании изображений, и количества фрагментов изображения, используемые на этапе классификации интроформационным подходом. В значительной степени на время классификации влияет количество фрагментов изображения, поскольку, в таком случае, нужно высчитывать попарно сопоставление совмещения действий системы в каждом из возможных направлений.
Об’єктом дослідження є процеси ідентифікації та класифікації об’єктів у задачах комп’ютерного зору. В даний час для розпізнавання зображень найкращі результати демонструють штучні нейронні мережі. Однак, навчання нейронних мереж – це погано обумовлена задача. Погана обумовленість означає, що навіть великий набір даних може нести в собі малий обсяг інформації про задачу, що вирішується. Тому ключова роль в процесі синтезу параметрів конкретної математичної моделі нейронної мережі належить навчальним даним. Підбір репрезентативної навчальної вибірки є однією з найскладніших задач в машинному навчанні і не завжди можливий на практиці.Запропонована у роботі нова комбінована модель розпізнавання зображень з використанням теорії несилової взаємодії володіє такими ключовими особливостями:– призначена для обробки великої кількості даних;– виділяє корисну інформацію з довільного потоку;– дозволяє природно додавати нові об’єкти;– терпима до помилок та дозволяє швидко перепрограмувати поведінку системи.В порівнянні з існуючими аналогами, достовірність розпізнавання запропонованою моделлю в усіх експериментальних дослідженнях була вище відомих методів розпізнавання. Середня достовірність розпізнавання запропонованою моделлю склала 71,3 %; методом локальних бінарних шаблонів – 59,9 %; методом аналізу головних компонент – 65,2 %; методом лінійного дискримінантного аналізу – 65,6 %. Така достовірність розпізнавання в поєднанні з обчислювальною складністю робить даний метод прийнятним для застосування в системах, які працюють в умовах наближених до реального часу. Також такий підхід дозволяє керувати достовірністю розпізнавання. Це досягається завдяки налаштуванню кількості секторів гістограм локальних бінарних шаблонів, які використовуються при описі зображень, та кількості фрагментів зображення, які використовуються на етапі класифікації інтроформаційним підходом. Значною мірою на час класифікації впливає кількість фрагментів зображення, оскільки, в такому випадку, потрібно вираховувати попарно співставлення суміщення дій системи в кожному з можливих напрямків.
Databáze: OpenAIRE