Эффективность моделей нейронных сетей для автоматического обнаружения и распознавания наземных объектов на инфракрасных изображениях

A. S. Tverdokhlebov, A. S. Krasnoperova, A. A. Kartashov, V. Y. Kuprits, V. I. Weber

Аннотация


В статье проведено исследование современных моделей нейронных сетей, предназначенных для распознавания объектов на инфракрасных изображениях, полученных с беспилотных летательных аппаратов (БПЛА). Рассмотрены различные архитектуры YOLO (You Only Look Once), включая версии YOLOv5, YOLOv8 и YOLOv9. Оценка моделей выполнена по ключевым метрикам, таким как точность (Precision), полнота (Recall) и средняя точность (mAP), с учетом вычислительных требований. Особое внимание уделено применению моделей в условиях ограниченных ресурсов и повышенной сложности данных, что делает их актуальными для задач мониторинга и анализа в сложных условиях эксплуатации. Также был проведен анализ эффективности моделей нейронных сетей при решении задачи поисково-спасательных операций. Исследование показало, что наилучшие результаты по точности классификации объектов продемонстрировали модели YOLOv8l и YOLOv5mu с соответствующими значениями 0.912 и 0.911. Наибольшую полноту показали модели YOLOv8s и YOLOv9c с результатами 0.836 и 0.827. По метрике mAP50–95 лучшие результаты были достигнуты моделями YOLOv9c и YOLOv8l-worldv2, с показателями 0.591 и 0.566 соответственно. Полученные результаты могут быть полезны для выбора оптимальной модели при решении задач обнаружения и распознавания объектов на инфракрасных изображениях. Модель Yolov8s является наилучшим выбором для поисково-спасательных операций, так как она демонстрирует высокие результаты полноты: 0.836 и mAP50: 0.861.

Ключевые слова


инфракрасные изображения; распознавание объектов; модели нейронных сетей; YOLO; БПЛА машинное обучение; компьютерное зрение

Полный текст:

PDF

Литература


Просвирина Н. В. Анализ и перспективы развития беспилотных летательных аппаратов. Московский экономический журнал. 2021;(10):560–575.

Сферы применения беспилотных летательных аппаратов. Геоскан Пионер

Документация_v 3.2. URL: https://docs.geoscan.ru/pioneer/database/base-module/sphere/sphere.html (дата обращения: 27.09.2024).

Верба В. С., Меркулов В. И., Миляков Д. А., Чернов В. С. Интегрированные многодатчиковые комплексы мониторинга окружающего пространства. Журнал радиоэлектроники. 2015;(4):1–51.

Mueller M., Smith N., Ghanem B. A Benchmark and Simulator for UAV Tracking. In: Leibe B., Matas J., Sebe N., Welling M. (eds.) Computer Vision — ECCV 2016. 14th European Conference. October 11–14, 2016. Amsterdam, The Netherlands. Springer, Cham; 2016. Pp. 445–461.

Тимошкин М. С., Миронов А. Н., Леонтьев А. С. Сравнение YOLO V5 и Faster R-CNN для обнаружения людей на изображении в потоковом режиме. Международный научно-исследовательский журнал. 2022;6(120):137–146.

Zhu P. F., Wen L., Bian X., Ling H., Hu Q. Vision meets drones: A challenge. arXiv preprint arXiv:1804.07437. 2018. 11 p.

Terven J., Córdova-Esparza D. M., Romero-González J. A. A comprehensive review of yolo architectures in computer vision: From yolov1 to yolov8 and yolo-nas. Machine Learning and Knowledge Extraction. 2023;5(4):1680–1716.

Shamsoshoara A., Afghah F., Razi A., Zheng L., Fulé Pe., Blasch E. Aerial imagery pile burn detection using deep learning: The FLAME dataset. Computer Networks. 2021;193:108001.

Peng T., Li Q., Zhu P. RGB-T Crowd Counting from Drone: A Benchmark and MMCCN Network. In: Ishikawa H., Liu C.-L., Pajdla T., Shi J. (eds.) Computer Vision — ACCV 2020. 15th Asian Conference on Computer Vision. November 30 — December 4, 2020. Kyoto, Japan. Springer-Verlag, Berlin, Heidelberg; 2020. Pp. 497–513.

Terven J., Córdova-Esparza D. M., Romero-González J. A. A comprehensive review of yolo architectures in computer vision: From yolov1 to yolov8 and yolo-nas. Machine Learning and Knowledge Extraction. 2023;5(4):1680–1716.

Suo J., Wang T., Zhang X., Chen H., Zhou W., Shi W. HIT-UAV: A high-altitude infrared thermal dataset for Unmanned Aerial Vehicle-based object detection. Scientific Data. 2023;10:227. 11 p. https://doi.org/10.1038/s41597–023–02066–6

YOLO. Показатели производительности. URL: https://docs.ultralytics.com/guides/yolo-performance-metrics/#introduction (дата обращения: 02.10.2024).




DOI: https://doi.org/10.15826/urej.2024.8.4.003