项目说明
业务背景
据统计,2021年全国共接报火灾74.8万起,直接财产损失高达67.5亿元。火灾已经成为危害人们生命财产安全的一种多发性灾害。 针对住宅、加油站、公路、森林等火灾高发场景,如果不能在火灾初始阶段就及时发现并扑灭,会导致更高的扑救难度及损失。
业务难度
多数火灾发生在偏远地区,且面积大,预警信息快速反馈尤为重要,仅靠人工巡检,效率慢且容易发现漏识别情况。
解决思路
通过EasyDL物体检测任务最快可在15分钟内训练出一个高精度的烟雾和火灾检测模型,通过AI应用有效地预防此类问题,可以自动检测监控区域内的烟雾和火灾,帮助相关人员及时应对,最大程度降低人员伤亡及财物损失。
数据准备
数据采集与导入
建议采集真实应用场景的数据,如森林火灾现场图片,如无对应丰富样本,也可从历史森林火灾事故视频中抽取森林背景下的火灾烟雾和火种图片。
一般情况下,使用无人机进行巡检是常见的预警手段,数据采集时的图片视角需与无人机摄像头角度保持一致,如下图:
采集完毕的原图图片可以打包上传到平台,使用平台内置的物体检测标注工具进行标注。采集图片时,EasyDL智能数据服务提供数据采集功能,即您下载数据采集软件到本地后,通过使用AK、SK与平台联动,现场采集的图片可以实时回传到平台,用于您下一步的标注与训练。
您可以根据摄像头与时间,定制化选择需要回传的摄像头数据,将会按照您设定的抽帧规则,进行图片截取展示。
除通过摄像头采集本地软件直接将数据发送到平台外,还可通过本地上传或将数据保存至百度bos或网盘后通过分享链接上传。
数据标注
由于需训练一个目标检测模型,检测图片中的烟火,所以标注时需选择目标检测模版进行标注,标注时注意所有图片中出现的烟雾、火种都需要被框出(框可以重叠),检测框应包含整个识别对象,且尽可能不要包含多余的背景。
提示:由于烟火检测干扰样本多,极容易造成误检,生活中有很多物体和烟火是非常接近的,很难区分(比如:云朵、红色的灯光等),容易造成模型误检,所以建议也采集一定数量的数据作为负样本。
模型训练
选择物体检测任务类型,点击创建模型,根据实际业务自定义命名 平台支持选择公有云、本地服务器、边缘小型设备等多种部署方式,详情参见:https://ai.baidu.com/ai-doc/EASYDL/dk38n33k4 在烟雾和火灾检测场景中,我们希望模型能在火情发生的第一时间及时做出响应,对模型推理速度有较高的要求,所以建议将模型部署至离监控地点较近的边缘节点,降低网络带宽的同时也缩短了服务请求延时。选择算法时,可以选择高性能算法,获得更快的推理速度。
模型部署
由于烟火检测场景对实时性要求较高,建议使用边缘小型设备部署方式,可通过离线下载sdk手工部署或使用端云协同功能直接将部署包下发到边缘设备中。
效果优化
训练一次无法得到良好的模型效果是常见业务问题,您可以通过以下方式持续优化您的模型效果: 通过查看模型评估报告,发现识别错例或难例的分布特征,并针对性的扩充对应场景的数据集,如在本案例中发现烟火识别错误的case更多集中在大雾天气,因大雾天气导致烟火无法准确识别或者将大雾错误识别为烟,您可以采集更多此场景的数据扩充数据集 ,通过预测服务回流,采集更多真实场景数据,持续迭代模型效果 。
常见问题
问题1:我该采集多少数据?
在数据采集数量上,一是要保证每个标签的数据量不低于50,理论上标签量越多,模型效果更好;二是尽量保证各个标签的数据量不要差异太大,也就是要具有一定的均衡性。
问题2:真实场景中火灾事件不经常发生,如何采集更多训练数据?
为方便更快获取丰富多样的违规场景数据,可添加开源数据集(需保证开源数据集与真实场景匹配),或通过数据增强技术生成虚拟图片。
问题3:模型部署完成后,需在视频流中检测烟火,需进行视频抽帧后才可调用模型获取预测结果,有没有简单开发量较少的方式?
建议使用IEC智能边缘控制台,通过IEC,可以方便地在本地进行EasyDL SDK的部署,可视化接入本地和远程摄像头,详情参见:https://ai.baidu.com/ai-doc/EASYDL/Gktuwc59w