Використання нейронної мережі у другій ступені ансамбльового класифікатора для підвищення якості класифікації об'єктів на зображеннях

Jazyk: angličtina
Rok vydání: 2022
Předmět:
Zdroj: Eastern-European Journal of Enterprise Technologies; Vol. 3 No. 9 (117) (2022): Information and controlling system; 15-21
Eastern-European Journal of Enterprise Technologies; Том 3 № 9 (117) (2022): Інформаційно-керуючі системи; 15-21
ISSN: 1729-3774
1729-4061
Popis: Object recognition in images is used in many areas of practical use. Very often, progress in its application largely depends on the ratio of the quality of object recognition and the required amount of calculations. Recent advances in recognition are related to the development of neural network architectures with a very significant amount of computing that are trained on large data sets over a very long time on state-of-the-art computers. For many practical applications, it is not possible to collect such large datasets for training and only computing machines with limited computing power can be used. Therefore, the search for solutions that meet these practical restrictions is relevant. This paper reports an ensemble classifier, which uses stacking in the second stage. The use of significantly different classifiers in the first stage and the multilayer perceptron in the second stage has made it possible to significantly improve the ratio of the quality of classification and the required volume of calculations when training on small data sets. The current study showed that the use of a multilayer perceptron in the second stage makes it possible to reduce the error compared to the use of the second stage of majority voting. On the MNIST dataset, the error reduction was 29‒39 %. On the CIFAR-10 dataset, the error reduction was 13‒17 %. A comparison of the proposed architecture of the ensemble classifier with the architecture of the transformer-type classifier demonstrated a decrease in the volume of calculations while reducing the error. For the CIFAR-10 dataset, an error reduction of 8 % was achieved with a calculation volume of less than 22 times. For the MNIST dataset, the error reduction was 62 % when winning by the volume of calculations by 50 times
Розпізнавання об'єктів на зображеннях використовується у багатьох сферах практичного використання. Дуже часто, прогрес у використанні багато в чому залежить від співвідношення якості розпізнавання об'єктів і необхідного обсягу обчислень. Останні досягнення в галузі розпізнавання пов'язані з розробкою архітектур нейронних мереж з дуже значним обсягом обчислень, які навчаються на великих наборах даних протягом дуже тривалого часу на найсучасніших комп'ютерах. Для багатьох практичних застосувань немає можливості зібрати такі великі набори даних для навчання і можуть бути використані тільки обчислювачі з обмеженими обчислювальними потужностями. Тому пошук рішень, які відповідають цим практичним обмеженням, є актуальним. Представлений ансамблевий класифікатор, який використовує стекінг на другому ступені. Використання класифікаторів, що суттєво відрізняються, на першому ступені і багатошарового персептрона на другому ступені дозволило значно покращити співвідношення якості класифікації та необхідного обсягу обчислень при навчанні на невеликих наборах даних. Проведене дослідження показало, що використання багатошарового персептрона на другому ступені дозволяє зменшити помилку в порівнянні з використанням на другому ступені мажоритарного голосування. На наборі даних MNIST зменшення помилки становило 29–39%. На наборі даних CIFAR-10 зменшення помилки становило 13–17%. Порівняння запропонованої архітектури ансамблевого класифікатора з архітектурою класифікатора типу трансформер показало зменшення обсягу обчислень при одночасному зменшенні помилки. Для набору даних CIFAR-10 вдалося досягти зменшення помилки на 8% при обсязі обчислень менше у 22 рази. Для набору даних MNIST зменшення помилки становило 62% при виграші за обсягом обчислень у 50 разів
Databáze: OpenAIRE