摘" 要:对口罩佩戴检测进行了研究,设计实现了基于YOLOv8的口罩规范识别提醒系统。研究报告了口罩佩戴现状与挑战,并进行了目标检测模型的训练与集成工作。首先收集并标注不同口罩佩戴状态的图像数据集,用YOLOv8模型训练,进行目标检测,从而准确地识别口罩及其佩戴状态。该系统实现了对实时视频流的口罩规范识别,检测到未佩戴或不规范佩戴口罩时发出语音提醒,促使个体调整。实验证明该系统准确性与实时性优异,具备在公共场所应用的潜力,可以提升防疫效果,降低疫情传播风险。
关键词:口罩规范;YOLOv8;目标检测
中图分类号:TP391.4" " 文献标识码:A" 文章编号:2096-4706(2024)18-0066-05
Design of Mask Compliance Recognition and Reminder System Based on YOLOv8
JIANG Chen
(The Hi-Tech College of Xian University of Technology, Xian" 713700, China)
Abstract: This paper investigates mask-wearing detection, designs and realizes a mask compliance recognition and reminder system based on YOLOv8. The study reports the current status and challenges of mask-wearing, and conducts training and integration work of the object detection model. Initially, it collects and annotates image datasets depicting different mask-wearing statuses, and uses YOLOv8 model to train for object detection, so as to recognize masks and their wearing states accurately. The system achieves real-time mask compliance recognition on video streams, which issues voice reminders upon detecting improper or absent mask-wearing to prompt individuals to adjust. Experimental results demonstrate the system has outstanding accuracy and real-time performance, and has potential for practical application in public spaces, which could enhance epidemic prevention effectiveness and mitigate transmission risks.
Keywords: mask compliance; YOLOv8; object detection
0" 引" 言
口罩识别技术在近年来得到了广泛的研究和应用,主要集中在两个方面:口罩检测和口罩佩戴检测。口罩检测主要关注的是在图像中准确地定位口罩的位置,而口罩佩戴检测则进一步判断口罩是否被正确佩戴。
在口罩检测方面,研究者采用深度学习算法如Faster R-CNN、YOLO和SSD实现口罩检测。Luo等人提出YOLOv5-MBF算法,通过改进激活函数、主干网络、特征金字塔、数据增强和注意力机制,口罩检测精度达89.5%,推理速度提升43%,参数量减少50%[1]。Wang等人提出轻量化网络算法,增加Max Module结构,采用CIoU边框回归损失函数,mAP提高4.9%和3.3%,检测速率达74和64 frame/s[2]。段必冲等人提出改进的YOLOv5口罩检测算法,mAP达96.2%,参数减至6.6×106,FPS达136,性能优于其他算法,适用于口罩检测[3]。
在口罩佩戴检测方面,研究者们通过分类口罩佩戴状态判断是否正确佩戴。同时,结合人脸检测和姿态估计技术确定口罩与人脸位置和姿态。程浩然等人提出改进的YOLOv4-Tiny口罩佩戴检测方法,mAP提升0.5至94.0%,检测速度提升3.96FPS,适用于大规模口罩佩戴检测[4]。Yang等人提出改进YOLOv5s,融合IAAM和设计CFGM模块提升小目标检测精度,EIoU Loss损失函数改进模型性能[5]。Zhang等人基于YOLOv3,添加4尺度检测结构和多尺度融合结构,CIoU损失函数提高定位精度,mAP达93.66%,比原算法提高5.61%,适用于口罩佩戴检测[6]。
这些研究成果为口罩规范识别提醒系统的设计提供了重要的技术支持和启示,但也存在一些挑战和局限性,如对复杂场景和变化光照的适应能力有待进一步提升,针对这些问题的解决将是未来研究的重点方向[7-11]。
1" YOLOv8算法概述
YOLOv8是目标检测领域中一种先进的实时目标检测算法,它通过一次前向传播实现对图像中多个目标的检测和定位,主要的创新点包括一个新的骨干网络、一个新的Ancher-Free检测头和一个新的损失函数。它可以在从CPU到GPU的各种硬件平台上运行。相较于之前版本,YOLOv8在准确性和速度上都有显著提升,成为了目标检测领域的热门算法之一。
YOLOv8算法的核心思想是将目标检测任务转化为一个回归问题,通过在图像中的预定义网格上进行目标定位和类别预测。与传统的目标检测算法不同,YOLOv8算法采用单个神经网络模型同时完成目标的检测和分类,避免了多次网络前向传播的复杂性。其检测和分割网络结构如图1和图2所示。
2" 模型搭建及训练
2.1" 数据集采集及预处理
本文通过百度、谷歌、Image-net、以及个人拍摄照片获取本文需要的训练图片(正常佩戴口罩、不规范佩戴口罩、未佩戴口罩),每个类别训练数据2 000张左右。同时,本文将数据集分为于训练和测试数据,在总数据量中,测试数据集占据了20%。具体来说,训练数据集包含4 264个样本,而验证数据集则包含1 066个样本。为了确保所有图像在训练前输入方向一致,本文采用自动方向校正对EXIF方向会产生混淆的信息进行剥离。同时,为了保证所有图像的尺寸统一,通过拉伸的方式对其进行了调整。
2.2" 模型搭建及效果评估
本文的YOLOv8模型输入的图像尺寸设置为640×640,以保证对目标的良好检测效果。检测层输出的特征图尺寸为13×13。口罩规范识别模型中,需要预测的类别通常包括“正常佩戴口罩”“未佩戴口罩”和“不规范佩戴口罩”三类,因此输出层的类别数设置为3。部分配置参数如表1所示。
在深度学习中,通常通过损失函数下降的曲线来观察模型训练的情况。图3为本文训练口罩目标检测过程中的损失函数曲线图,展示了模型在训练和验证过程中的性能指标变化。
从图3可以看出,随着训练的进行train/box_loss、train/cls_loss和train/obj_loss的数据都逐渐下降,并且在一定周期后损失值开始趋于稳定,表明模型在目标定位、分类及存在性上都取得了一定的学习效果,其性能稳步提升。但是,在验证集上,损失函数值损失函数值相对较高且波动较大。这可能是由于模型在验证数据上的泛化能力较差,或验证集包含了许多训练集未覆盖的难以识别的样本。验证集上的val/box_loss、val/cls_loss和val/obj_loss随着训练次数的增加呈现下降趋势,但这样的波动恰恰说明模型对未见数据的适应性有待改善。
为了分析数据集类别分布不均的问题,使用Precision-Recall(PR)曲线来评估。模型预测正样本的条件是由PR曲线上的每一个点来决定的,Precision值高代表假阳性较少,Recall值高代表假阴性较少。本文模型的PR曲线如图4所示。
从图4可以看出,“no-mask”类别和“Improper wearing-mask”类别的PR曲线都高于“mask”类别。“no-mask”类别、“Improper wearing-mask”类别和“mask”类别的mAP@0.5值分别为0.948、0.896和0.844,这表明模型在检测未戴口罩的样本时更加精确和可靠。在“no-mask”类别中的Precision值和Recall值高都较高,证明数据集中未戴口罩的比较多,同时该模型也能够识别出大部分实际未戴口罩的样本。相比之下,“mask”类别的Precision-Recall值较低,可能是因为口罩遮挡了部分面部特征,增加了识别的难度。而“Improper wearing-mask”类别的Precision-Recall值介于其他两类之间,可能是因为未规范佩戴的数据较少,或使用P图软件批量添加口罩(露出鼻子),使得这类图像与真实图像存在差异。所有类别合并后的mAP@0.5值为0.898,说明整体模型在IoU阈值为0.5时具有较高的平均检测准确性。总体而言,模型在“no-mask”类别和“Improper wearing-mask”类别上的表现比“mask”类别更优。
2.3" 模型对比
为了体现YOLOv8模型的优势,于是比较它和YOLOv5、YOLOv6、YOLOv7三种模型在口罩目标检测上的性能表现。本文使用相同的数据集对以上四个模型进行了训练和测试,结果如图5和表1所示。
从图5可以看出YOLOv8的表现相较于其他三类模型来说有显著的提升。同时由表1可以看出,YOLOv8的mAP值为0.898,F1-Score值为0.87,这表明YOLOv8在平衡识别准确性和结果的上表现较好,即YOLOv8模型在假阳性和假阴性方面做得相对较好。
3" 系统设计与测试
3.1" 系统设计
本系统功能包括人脸捕捉、口罩佩戴规范类别分类、语音提醒、检测记录存储、异常记录可视化显示分析、管理员登录和注册功能。利用SSD算法进行人脸检测,然后使用YOLOv8模型进行口罩规范类别检测。系统的类别检测有三类:正确佩戴口罩、未佩戴口罩、不规范佩戴。管理员注册登录功能使用腾讯云的短信验证码服务实现,确保系统安全。异常记录可视化统计采用柱状图、饼状图、折线图展示每天口罩佩戴类别数量。系统调用摄像头进行实时画面预处理、人脸区域定位和口罩类别分类检测,同时进行语音播报提醒。检测记录存储采用CSV文件格式,使用Python的CSV库和Pandas库进行数据处理和可视化分析。
3.2" 系统测试
对于正确佩戴口罩的状态下,系统对人脸部分有绿色框标选,并加载有绿色“正常”的字样,对于未戴口罩的状态下,系统对人脸部分使用红色方框进行标注,并加载有红色“未佩戴”字样,同时进行语音提醒。对于佩戴口罩不规范(漏出鼻子或者漏出嘴巴)的状态下,系统对人脸部分使用黄色方框进行标注,并加载有黄色“不规范”字样。本系统还可以进行异常记录统计。运行效果如图6至图9所示。
3.3" 结果分析
系统运行结果表明,在正常外界环境下,口罩佩戴规范检测系统几乎没有显著误差。通过训练模型,实际测试结果与之高度一致(如表2所示)。表2显示,在第10次训练后,训练和测试数据损失率均达到自身最低值,呈现出稳定性。在实际测试中,光照和摄像头模糊等因素可能导致轻微误差,主要集中在正确佩戴和不规范佩戴之间。另一方面,训练数据中不规范佩戴口罩的图像较少,用P图软件批量添加口罩(露出鼻子),使得这类图像与真实图像存在差异。在外界环境干扰较大的情况下,可能出现问题。
4" 结" 论
本论文提出基于YOLOv8的口罩规范识别提醒系统,旨在利用先进的目标检测技术监测和提醒口罩佩戴不规范的情况,以增强公共场所的防疫效果。通过对YOLOv8算法的深入研究和优化,设计了适用于口罩规范识别的模型结构和参数设置,并在实际场景中进行了应用测试。结果显示系统功能检测准确率较高,取得了良好的效果。实验和应用验证了该系统的有效性和实用性。在不同场景和条件下,系统能够准确识别口罩佩戴的规范性,并发出及时的语音提醒,引导个体进行调整。这不仅提高了公共场所的防疫效果,还促进了个人健康意识的提升,为社会公共卫生安全做出了贡献。
未来,将进一步优化系统的性能和功能,包括提高识别准确率、优化实时性能、拓展适用场景等。同时,将继续深入研究口罩规范识别技术,探索更智能化和精准化的解决方案,为防疫工作提供更多支持。随着科技进步和社会需求增长,口罩规范识别提醒系统将发挥更重要的作用,为构建健康安全的社会环境做出更大贡献。
参考文献:
[1] LUO H,WEI J S,WANG Y C,et al. An Improved Lightweight Object Detection Algorithm for YOLOv5 [J/OL].PeerJ Computer Science,2024,10:1830(2024-01-30).https://peerj.com/articles/cs-1830/.
[2] WANG B,LE H X,LI W J,et al. Mask Detection Algorithm Based on Improved YOLO Lightweight Network [J].Computer Engineering and Applications,2021,57(8):62-69.
[3] 段必冲,马明涛.基于改进YOLOv5算法的口罩检测研究 [J].计算机工程与应用,2023,59(16):223-231.
[4] 程浩然,王薪陶,李俊燃,等.改进YOLOv4-tiny的疫情协同口罩佩戴检测方法 [J].计算机工程与应用,2023,59(20):208-218.
[5] YANG G,YU S,YANG H. Multi-Scale Fusion Mask Wearing Detection Method Based on Improved YOLOV5s [J].Computer Engineering and Applications,2023,59(14):184-191.
[6] ZHANG L,DENG C. Multi-scale Fusion of YOLOv3 Crowd Mask Wearing Detection Method [J].Computer Engineering and Applications,2021,57(16):283-290.
[7] 张修宝,林子原,田万鑫,等. 全天候自然场景下的人脸佩戴口罩识别技术 [J].中国科学:信息科学,2020,50(7):1110-1120.
[8] BOCHKOVSKIY A,WANG C Y,LIAO H Y M. YOLOv4: Optimal Speed and Accuracy of Object Detection [J/OL].arXiv:2004.10934 [cs.CV].(2020-04-23)https://arxiv.org/abs/2004.10934.
[9] 李志华,张见雨,魏忠诚.基于MTCNN和Facenet的人脸识别系统设计 [J].现代电子技术,2022,45(4):139-143.
[10] 陈玫玫,杨清清,洪灵,等.基于YOLOv5的公共场所戴口罩的人脸识别系统:CN114783024A [P].2024-02-29.
[11] 金鑫,曾思轲,刘阳,等.基于改进YOLOv4的口罩佩戴检测算法 [J].计算机与现代化,2022(1):85-90.
作者简介:蒋晨(1993.09—),女,汉族,陕西咸阳人,助教,硕士,研究方向:深度学习、图像处理。