Обробка зображень безпілотних літальних апаратів з використанням модифікованої архітектури детектора YOLO
Autor: | Victor Sineglazov, Vadym Kalmykov |
---|---|
Rok vydání: | 2021 |
Předmět: |
распознавание объектов
classification problem беспилотные летательные аппараты класифікація об’єктів нейронная сеть YOLO розпізнавання об’єктів нейронна мережа YOLO вилучення карт об’єктів гибридные нейронные сети безпілотні літальні апарати unmanned aerial vehicle YOLO классификация объектов hybrid neural networks извлечение карт объектов гібридні нейронні мережі feature maps extraction object detection |
Zdroj: | Electronics and Control Systems; Vol. 3 No. 69 (2021); 37-42 Электроника и системы управления; Том 3 № 69 (2021); 37-42 Електроніка та системи управління; Том 3 № 69 (2021); 37-42 |
ISSN: | 1990-5548 |
DOI: | 10.18372/1990-5548.69.16425 |
Popis: | Identifying objects from drone images is a state-of-the-art task for artificial neural networks. Since drones are always moving at different altitudes, the scale of the object varies greatly, making it difficult to optimize the networks. Moreover, flying at high speeds and low altitudes leads to blurred images of densely populated objects during movement, which is a problem when solving the problem of recognizing and classifying small sized objects. This paper addresses the above problem solutions and solves them by applying an additional prediction model to identify objects of different scales. We also modify the loss function to penalize larger objects more and vice versa to encourage recognition of smaller objects. To achieve improvements, we use advanced techniques such as multiscale testing, image blurring, object rotation, and data distortion. Experiments with a large data set show that our model has good performance in drone images. Compared to the baseline model (YOLOv5), our model shows significant improvements in object recognition and classification. Идентификация объектов по изображениям дронов – одна из самых современных задач для искусственных нейронных сетей. Поскольку дроны всегда перемещаются на разной высоте, масштаб объекта сильно различается, что затрудняет оптимизацию сетей. Более того, полет на больших скоростях и малых высотах приводит к нечеткому изображению густонаселенных объектов во время движения, что является проблемой при решении задачи распознавания и классификации небольших по размеру объектов. В данной статье рассматриваются решения вышеуказанных проблем и они решаются путем применения дополнительной модели прогнозирования для идентификации объектов разного масштаба. Мы также модифицируем функцию потерь, чтобы более крупные объекты ставить в невыгодное положение и наоборот, чтобы стимулировать распознавание более мелких объектов. Чтобы добиться улучшений, используются передовые методы, такие как многомасштабное тестирование, размытие изображения, поворот объекта и искажение данных. Эксперименты с большим набором данных показывают, что рассмотренная модель хорошо работает на изображениях дронов. По сравнению с базовой моделью (YOLOv5) рассмотренная модель демонстрирует значительные улучшения в распознавании и классификации объектов. Ідентифікація об’єктів із зображенням дронів – одне з найсучасніших завдань для штучних нейронних мереж. Оскільки дрони завжди переміщуються на різній висоті, масштаб об’єкта сильно варіюється, що ускладнює оптимізацію мереж. Більше того, політ на великих швидкостях і малих висотах призводить до нечіткого зображення густонаселених об’єктів під час руху, що є проблемою під час вирішення завдання розпізнавання та класифікації невеликих за розміром об’єктів. У статті розглядаються розв’язання вищевказаних проблем і вони вирішуються шляхом застосування додаткової моделі прогнозування для ідентифікації об’єктів різного масштабу. Ми також модифікуємо функцію втрат, щоб більші об'єкти ставити в невигідне становище і навпаки, щоб стимулювати розпізнавання дрібніших об'єктів. Щоб досягти покращень, використовуємо передові методи, такі як багатомасштабне тестування, розмиття зображення, поворот об’єкта та спотворення даних. Експерименти з великим набором даних показують, що розглянута модель добре працює на зображеннях дронів. Порівняно з базовою моделлю (YOLOv5) розглянута модель демонструє значні покращення у розпізнаванні та класифікації об’єктів. |
Databáze: | OpenAIRE |
Externí odkaz: |