安全帽佩戴检测算法研究

转载

燧机科技 2024-06-28 15:27:31

文章标签 算法目标检测深度学习人工智能搜索 文章分类 Python 后端开发

摘要
安全帽佩戴监控是铁路工程施工人员安全管理中的重点和难点，它对检测算法的准确率与检测速度都有较高的要求。本文提出一种基于神经网络架构搜索的安全帽佩戴检测算法 NAS-YOLO。该神经网络架构由上、下行操作单元组成，采用二进制门策略对网络架构进行更新，通过数据驱动的方式自动确定合适的神经网络体系结构。实验结果表明，NAS-YOLO算法在准确率、召回率及平均检测速度方面均优于实时目标检测算法 YOLOv3，可以在工程施工中对施工人员安全帽佩戴情况进行实时监控。
关键词安全帽佩戴；神经网络架构搜索；自动检测；检测算法；实时监控

引言
施工现场环境复杂多变，人群密集，频繁出现工人不遵守规章所引发的伤亡事故，安全帽作为一种常见的防护用具，能够有效减轻外来危险源对头部的伤害，因此，实时监控施工场所工人安全帽佩戴情况至关重要。然而人工监管费时费力，无法满足安全生产要求。以计算机视觉为技术支撑的智能监控系统有人力成本低、检测效率高等优势，为自动监测施工现场工人佩戴安全帽情况的方案落地提供了技术方向
传统的安全帽检测方法大多数是分析图像统计信息，构建安全帽特征后匹配识别。ＷＥＮＣｈｅｎｙｅｎ等使用霍夫变换，设计了安全帽形状特征，统计其像素值信息而后进行特征匹配；刘晓慧等根据色差分量定位人脸区域，向上扫描捕获区域图像，利用胡氏不变矩描述安全帽形状特征。然而，此类传统方法需手工设计安全帽特征，不但人力成本高，且在复杂施工环境下识别精度低，鲁棒性较差，无法准确监测出工人未佩戴安全帽的情况。近年来，深度学习在目标检测领域下的应用取得了一系列较好的成果。基于深度学习的目标检测又分为基于区域提取的两阶段算法和基于回归的一阶段算法。两阶段算法首先使用区域选择算法生成候选区域，其次通过卷积神经网络提取目标候选区域特征，进而分类回归
利用图像识别、目标检测等计算机视觉技术，实现安全帽自动监控是智能工地发展的主要趋势。传统的基于计算机视觉技术的安全帽佩戴检测方法通常使用人为设定的特征，如梯度直方图、颜色或混合描述符检测等，都受到遮挡、透视失真、小目标检测和尺度变化等因素的影响，存在漏检，即召回率低的问题［5］。随着，深度神经网络在图像识别和目标检测任务中的广泛应用，利用其特征提取自动化的特点，本文提出了基于神经网络架构搜索（Neural Architecture Search，NAS）的安全帽佩戴检测算法，将人工调整神经网络的过程变成自动执行的任务，通过自动搜索确定更符合铁路施工工地安全帽监控任务的深度神经网络架构，完成安全帽佩戴的自动检测与报警任务

1. 安全帽监控系统逻辑架构
安全帽监控系统的逻辑结构主要分为视频采集、智能视频分析和监控中心3个模块，如图1所示。视频采集模块负责通过摄像机进行视频采集；智能视频分析模块是通过算法实现目标检测、分类，并进行行为和事件检测，同时还负责对违规行为发出报警信息，是安全帽监控系统的核心模块；监控中心与监控人员直接交互，起到对整个监控系统进行监视和管理的作用。
安全帽监控系统首先由视频采集模块获取视频数据；再由智能视频分析模块利用目标检测技术提取出视频中的动态目标，同时进行分类；然后，将分类得到的目标信息与预先设定好的报警准则进行逻辑判断，如符合预定准则，则智能视频分析模块向监控中心发送预警或报警信息；如不符合预定准则，则继续进行目标检测［8］。目标检测与分类是通过人工智能技术（即深度神经网络）来完成的。与常用的深度神经网络算法不同，这里介绍通过 NAS算法自动搜索合适的神经网络架构。

2.YOLOv3检测模型
YOLOv3 的主干网络为 Darkent-53，其中，包含53个卷积层和5个残差块，整体网络结构如图 2 所示。每个残差块包含残差单元，而残差单元由DBL组件组成，DBL 组件中包括卷积、批量归一化和 Leaky reiu激活函数。残差单元由DBL通过相加而成，残差块由DBL和残差单元构成，其中，残差块借鉴ResNet的思想，增强了特征融合能力。 YOLOv3 通过改变卷积核的步长来实现张量的尺度变换，输出 3 个不同大小的尺度。

YOLOv3网络结构

3. NAS算法
NAS 算法是自动机器学习领域的热点算法之一，可通过数据特征自动找到合适的神经网络架构［9］。该算法的原理是光定义搜索空间；然后，通过搜索策略找出候选网络架构，对候选网络进行评估；最后，根据评估结果进行下一轮的搜索。由于 NAS 的根本思想是探索各种潜在的解决方案，搜索空间越大，需要训练与评估的架构就越多，消耗的资源与时间就越多。因此，搜索空间的设定将直接影响计算开销。目前 NAS 的主流设计方法为先基于单元（cell）的架构进行设计，再将单元堆叠在主干网络上，构成整体网络架构，并由此限制搜索空间大小。换言之，大型网络是由多个单元组成的，而单元的结构是由整个网络共享的［10］，因此主干网络的选择也十分重要。
目前主流的目标检测算法是 Fast r-cnn［11］系列算法，首先使用神经网络生成待检测预选定位框，再对预选定位框进行调整和分类，属于两阶段算法，虽然精度高，但实时性不强。而YOLO （You Only Look Once）［12］系列的一阶段算法采用了回归的思想，直接在图像上回归出预选定位框，同时预测预选定位框所属类别。YOLO 系列算法的检测精度虽然略低于 Fast r-cnn 系列，但是运行速度快，能够很好地完成实时目标检测任务。另外，还有 SSD （Single Shot MultiBox Detector）［13］算法，结合了回归思想和预选定位框机制，使得检测速度和准确率都得到提升。YOLO 系列算法经过不断更新，其中 YOLOv3［14］结合了多种网络设计技巧，包括了SSD算法中的多尺度特征融合策略［15］，进一步提高了网络的检测性能。因此，本文以 YOLOv3 为基础框架，设计了基于神经网络架构搜索的 YOLO 网络，即 NAS-YOLO。 NASYOLO由2种单元架构组成，分别是下行单元和上行单元，并通过基于单元的搜索方式，确定其最终网络拓扑结构。

3.1 架构搜索方式
对二值化的路径更新使用了 Cai H 等［20］提出的二进制门方法。这是一种数据驱动的方式，具体操作如下。 1）在训练网络权重参数时，先冻结架构参数，并为每批输入的数据随机选取二进制门，根据二进制门得到存活路径。 2）在训练数据集中，通过标准梯度下降，更新存活路径的权值参数。 3）在训练架构参数时，先冻结权重参数，后重置二进制门，更新并验证数据集中的架构参数。这2个更新步骤以替代方式执行，一旦完成架构参数的训练，就可以通过修剪冗余路径来导出紧凑的架构。每次架构参数的更新只涉及2条路径，从而将内存需求降低到训练紧凑模型的相同水平。

3.2 模型训练
使用安全帽佩戴检测数据集对 NAS-YOLO 算法进行训练。该数据集共有 7 581 张图像，包含 9 044 个佩戴了安全帽的人像（正样本），以及 111 514 个普通人像（没有佩戴安全帽，即负样本）。随机选取数据集中一半的图像作为训练集，另一半作为验证集，使用二进制门搜索策略对神经网络架构进行搜索。其中，批量的大小设置为 8，共进行了200期的架构搜索优化。网络权重训练中，选用随机梯度下降（Stochastic Gradient Descent，SGD）优化器，动量设置为 0. 95，余弦学习率从 0. 025 衰减到 0. 01，权重衰减为 0. 0003。架构参数 α 的训练使用 Adam 优化器［21］，学习率设置为 0. 0003，重量衰减设置为 0. 0001。使用 1 块 GeForce RTX 2080ti GPU 对整个架构搜索，大约需要 2 天时间

4. 结果验证与分析
4.1 算法训练
YOLOv3和NAS-YOLO训练过程中的损失函数曲线（Loss Curve）分别见图2和图3。图中，损失值越小，表示训练出的模型与数据集的真实模型越接近；在2次训练过程中，网络损失均保持稳定下降趋势，YOLOv3在迭代 10 000次左右收敛， NAS-YOLO在迭代 40 000次左右收敛，说明训练基本顺利；与图2的曲线相比，图3的曲线收敛于一个更小的值，说明改进后的模型更接近数据集的真实模型。

4.2 算法测试
将完成模型训练NAS-YOLO网络与现有的目标检测网络进行对比，并将几种算法分别应用于安全帽监控系统中，进行安全帽佩戴状态的自动识别。随机选取2名工地管理人员，对视频中施工人员是否佩戴安全帽进行识别与判断。一名管理人员先做出判断，另一名再对其判断结果进行审查与修正。将2名管理人员的识别判断结果作为真值，评估 NAS-YOLO 与 SSD、 Fast r-CNN、 YOLOv3 算法的实际应用准确度和运行速度。与其他方法相比，NASYOLO的平均准确率（mean Average Precision，mAP）最高，达 96. 72%；处理速度也最快，检测速度可达59. 6FPS （Frames Per Second）；但召回率略低于 Fast r-CNN，而 Fast r-CNN 运行速度慢，无法应用于实时的目标检测任务。

4.3 算法应用
将NAS-YOLO算法搭载于智慧工地视频监控系统，用于实时监控工地上的安全帽佩戴状态，实际应用效果见图 6。系统会自动识别并用框线标注出现场人员的头部位置，并将规范佩戴安全帽的对象用实线框出，未规范佩戴安全帽的对象用虚线框框出，同步给出未佩戴安全帽的告警信息。

5. 结论
基于NAS的安全帽佩戴检测算法能够针对特定任务确定对应的网络结构，实现了工地安全帽佩戴的实时监测。试验结果表明，该算法在正确率、召回率及平均检测速度方面均优于实时目标检测算法 YOLOv3，可减少人力成本，提高了建筑工地的安全管理自动化水平。

参考文献
[1] 手把手教你搭建自己的yolov5目标检测平台 https://www.bilibili.com/video/BV1f44y187Xg
[2] 手把手教你使用YOLOV5训练自己的目标检测模型 https://www.bilibili.com/video/BV1YL4y1J7xz/
[3] 杨永波,李栋.改进YOLOv5的轻量级安全帽佩戴检测算法[J/OL].计算机工程与应用:1-8[2022-04-11].http://kns.cnki.net/kcms/detail/11.2127.TP.20220118.1827.006.html
[4] 葛青青,张智杰,袁珑,李秀梅,孙军梅.融合环境特征与改进YOLOv4的安全帽佩戴检测[J].中国图象图形学报,2021,26(12):2904-2917.
[5] 朱晓春,陈子涛.基于改进型YOLO v5算法的安全帽佩戴检测[J].南京工程学院学报(自然科学版),2021,19(04):7-11.DOI:10.13960/j.issn.1672-2558.2021.04.002.
[6] 金雨芳,吴祥,董辉,俞立,张文安.基于改进YOLO v4的安全帽佩戴检测算法[J].计算机科学,2021,48(11):268-275.