摘 要:城市轨道交通视频监控系统是一个不可或缺的通信子系统。现如今该系统已被广泛运用于站点客流监测、列车车厢拥挤度监测、区间障碍监测、区间水灾监测等运营场景。经过对某城市某地铁线路近4年内视频监控系统的故障进行统计分析,发现视频监控系统的故障数量在通信系统总故障数量中占比较高,故障处理所花费的时间累计最多。因此科学客观地分析视频监控系统故障原因并总结相应的处理方法,能够有效地帮助运维人员快速修复故障,从而缩短故障处理时间。
关键词:城市轨道交通;视频监控系统;故障原因;故障处理
中图分类号:TP39;U231+.7 文献标识码:A 文章编号:2096-4706(2025)02-0154-05
Fault Analysis and Handling of Urban Rail Transit Video Surveillance System
ZHU Zhiping
(Nanning Rail Transit Operation Co., Ltd., Nanning 530029, China)
Abstract: The video surveillance system of urban rail transit is an indispensable communication subsystem. Nowadays, the system has been widely used in the station passenger flow monitoring, train carriage congestion monitoring, interval obstacle monitoring, interval flood monitoring, and other operational scenarios. After statistical analysis of the faults of the video surveillance system of a subway line in a city in the past 4 years, the number of faults of the video surveillance system accounts for a relatively high proportion of the total number of faults in the communication system, and the accumulated time spent on fault handling is the largest. Therefore, scientifically and objectively analyzing the causes of video surveillance system faults and summarizing the corresponding handling methods can effectively help operation and maintenance personnel quickly repair faults, thereby shortening the fault handling time.
Keywords: urban rail transit; video surveillance system; fault cause; fault handling
DOI:10.19850/j.cnki.2096-4706.2025.02.029
0 引 言
我国城市轨道交通视频监控系统的应用场景十分广泛,系统整体层次结构越来越复杂,设备数量种类繁多[1]。面对结构复杂的城市轨道交通视频监控系统,地铁运维人员在日常的故障处理过程中所需要排查的故障节点较多,大大拉长了故障处理时间。因此,在排查故障原因的过程中,会更加考验地铁运维人员对系统结构的熟悉度。针对地铁运维人员处理视频监控系统故障耗费时间过长的问题,现结合某地铁视频监控系统故障案例进行分析,总结故障处理办法,以此来帮助运维人员快速定位故障原因,缩短故障修复时间,提高故障处置效率。
1 视频监控系统概况
城市轨道交通视频监控系统整体结构可细分为OCC监控子系统、车站监控子系统和车载监控子系统。OCC监控子系统可以监控全线车站、主变电站、场段、列车等区域,车站监控子系统可以监控站内客流实时画面,车载监控子系统可以监控列车客室内乘客乘车画面。该系统可提供24小时无间断实时监控画面和历史录像,以确保乘客乘车安全和地铁运行安全[2]。下面以某城市轨道交通视频监控系统结构设计图为例,如图1所示,为读者详细介绍系统设备组成和设备用途。
1.1 视频监控系统设备组成
视频监控系统主要由服务器设备(视频管理服务器、网管服务器)、供电设备(智能PDU、开关电源模块、电源适配器)、网络存储设备(存储控制器)、网络安全设备(汇聚交换机、接入交换机、防火墙)、接口转换设备(光电转换器、HDMI转VGA、USB转VGA)、显示设备、摄像机(球机、半球、枪机)、解码器等设备组成[3]。
1.2 视频监控系统设备用途介绍
服务器设备包括视频管理服务器、网管服务器。视频管理服务器负责设备管理、用户管理、软件服务,网管服务器用于设备故障统计和上报。
供电设备包括智能PDU、开关电源模块、电源适配器。智能PDU为机柜设备提供电源,开关电源模块为摄像机提供直流12 V电源,电源适配器为摄像机提供直流24 V电源。
网络存储设备又叫存储控制器,为摄像机提供录像存储资源。
交换机设备包含汇聚交换机、接入交换机。汇聚交换机供接入交换机接入,将站内系统数据上传至中央,接入交换机为摄像机设备提供数据接入。
接口转换设备包括光电转换器、HDMI转VGA等设备。光电转换器用于超远距离传输,将网线转为光纤传输,HDMI转VGA设备用于连接解码器与显示器。
显示设备包括液晶显示器和司机监视器。液晶显示器为车站值班员提供监控画面显示,司机监视器为列车司机提供上下行站台监控画面显示。
摄像机包括球机、半球、枪机,功能均为拍摄现场实时画面。
解码设备主要是解码器,将视频格式解码输出至液晶显示器上[4]。
2 视频监控系统故障统计
据不完全统计,某城市地铁4号线自开通运营以来,视频监控系统累计发生故障288起,其中OCC监控子系统发生故障40起,车站(含主变、场段)监控子系统发生故障248起,由于部门维修接口划分关系,这里不统计车载监控子系统的故障情况。视频监控系统故障次数及原因分布情况如表1所示。
通过对上述视频监控系统故障统计情况分析,硬件类型故障和其他类型故障数量占比较高。其中硬件类型故障主要包括摄像机硬件故障、开关电源模块故障、硬盘离线故障等[5]。其他故障主要包括设备空开跳闸故障、通信链路故障、人为操作故障、线缆故障等。
3 视频监控系统故障分析及处理
3.1 某站单个摄像机离线故障
某站单个摄像机离线是日常运维中所遇到的最为典型的故障[6]。大多数情况下都是因通信链路中断或摄像机非正常工作引起。运维人员首先可通过终端电脑常PING摄像机去验证链路是否正常[7]。如果出现断断续续丢包情况,可考虑网线水晶头松动情况,加以紧固即可修复故障。如果常PING丢包率达100%,可考虑使用网络测试仪排查线路状态,同时也要确认摄像机的通电状态。运维人员可在配电箱和综合箱处检查摄像机供电情况和网络情况,若均未排查出异常,可考虑是因为摄像机硬件故障导致离线,更换硬件即可修复。
3.2 某站部分摄像机集中离线故障
某站部分摄像机集中离线故障基本上可以判断是接入交换机至机房汇聚交换机间通信链路中断,抑或是设备集中掉电所致[8]。运维人员首先需要排查配电箱内设备空开、开关电源模块工作状态和综合箱内交换机的工作状态。若空开状态不正常,则可以断定是因为空开跳闸或故障引起摄像机集中掉电离线故障,运维人员需要使用万用表或兆欧表排查供电线路有无异常。若开关电源模块无供电电压输出,则可判定是开关电源模块故障引起摄像机集中掉电离线故障,更换开关电源模块即可修复故障。若接入交换机端口指示灯异常,则可判定是因接入交换机至汇聚交换机通信线路故障或端口故障引起设备集中离线,运维人员可考虑使用酒精擦拭尾纤头并紧固接头的方法修复故障。若未修复可考虑更换光模块或通信端口的方法修复故障。
3.3 车控室液晶显示器黑屏故障
该故障基本判定为液晶显示器故障或解码器工作异常所致[9]。运维人员首先要检查液晶显示器工作状态是否正常,其次再排查解码器通信网络指示灯状态,最后检查解码器与液晶显示器间HDMI连接线缆紧固状态。若液晶显示器带电指示灯不亮,可考虑液晶显示器的电源插头是否松动,电源插头是否故障等情况,通过紧固或更换插头可修复故障。若是解码器通信网络指示灯工作状态不正常,可判断为解码器通信异常导致摄像机视频流无法通过解密码器解码输出至显示器,可考虑排查解码器与交换机间的通信链路状态或更换解码器备件即可修复故障。若排查发现是HDMI线缆松动引起,紧固线缆或更换接口即可修复故障。
3.4 站内所有摄像机离线故障
本故障是由于某站点汇聚交换机断电重启后所造成的故障。经过分析汇聚交换机的配置可知全线站点汇聚交换机均采用OSPF协议发送hello包来相互建立邻居关系[10],进行路由学习,收集链路状态信息,生成网络拓扑结构,再计算路由。由于各站点汇聚交换机未配置独立唯一的Router ID,有两个站的Router ID的配置相同。断电重启后导致该站汇聚交换机断电重启后Router ID漂移到另一个站点从而引发IP地址冲突,导致本站汇聚交换机与控制中心汇聚交换机间网络不通,所以控制中心视频监控平台显示该站所有摄像机离线,无法调阅该站摄像机实况。通过重新规划各站点汇聚交换机的Router ID,防止出现两个一样的Router ID。
3.5 多站视频监控系统软件故障
本故障造成某地铁线路多站点的视频监控系统软件后台服务异常中止故障,平台无法正常登录,OCC监控平台显示故障站点下所有摄像机处于离线状态,影响值班员调阅故障站点的站内实时监控画面,故障情况如图2所示。经查看传输系统设备和汇聚交换机的告警日志分析,是因为其中同集群下某个站点的传输端口(与视频监控系统汇聚交换机互联端口XGE0/0/25)光模块故障,造成汇聚交换机端口XGE0/0/25反复UP、DOWN,如图3所示,端口振荡导致路由邻居失效,网络不通。经对故障站点的视频监控系统视频管理服务器的日志分析,故障期间除集群DC外,其余站点视频管理服务器陆续出现软件服务中止情况(VM Service Is Stopping),如图4所示。
运维人员可考虑先完成汇聚交换XGE0/0/25端口故障光模块的更换,先恢复故障站点视频监控系统与传输系统通信功能,然后逐一重启集群内各个站点的视频管理服务器,开启软件服务。接下来就是考虑解决各站点汇聚交换机邻居路由失效问题。经运维人员排查发现传输系统与视频监控系统汇聚交换机互联端口配置了链路聚合,采用静态LACP模式。这两种设备为不同厂家生产,采用静态LACP模式会存在协议不匹配问题。后续运维人员对全线汇聚交换机修改了链路聚合模式,输入交换机配置命令interface Bridge-Aggregation1和link-aggregation mode dynamic可完成交换机聚合模式的修改。通过传输网管平台将聚合端口模式由“静态”修改为“手工”完成聚合模式的修改,如图5所示。
3.6 视频监控系统无法调阅录像故障
运维人员检索某站摄像机录像时发现录像检索失败,系统弹出“访问逻辑资源失败”告警提示。经登录存储控制器软件后发现存储阵列RAID组1中某块硬盘(1:0:1:4)离线,如图6所示;且另一块硬盘(1:0:2:3)出现missing告警提示图标,如图7所示。导致阵列一直无法完成重建,因此同属于该阵列下的摄像机录像资源将无法被检索到。因为现场磁盘阵列配置 RAID 5模式,所以两块硬盘故障将会影响整个阵列工作。运维人员通过分析存储控制器的诊断日志得出结论,硬盘(1:0:1:4)的SMART值范围超出正常值,属于故障盘,需立即更换。硬盘(1:0:2:3)在重建过程中反复离线出现missing告警,存在读写错误告警,判断为该硬盘部分扇区异常。
运维人员需立即完成离线硬盘(1:0:1:4)的更换,阵列后续开始进入重建状态,但是重建过程十分缓慢。经深度分析日志判断应该是硬盘(1:0:2:3)存在读写错误告警导致的问题。通过SSH登录存储控制器的后台,输入命令打开硬盘不记读写错误开关后,再清除硬盘读写错误告警,待阵列完成重建后再关闭硬盘读写错误开关,最后再更换掉该块硬盘。
4 结 论
城市轨道交通视频监控系统由许多网络设备组成,整体架构比较复杂。它包含了许多技术如:视频压缩解码技术、视频传输存储技术。在每天的管理维护过程中,运维人员也许会遇到复杂程度不一的故障。其在处理故障时,尤其是在涉及复杂系统的故障排查与解决过程中,应该从系统组成及设备连接链路中寻找故障处置思路。这不仅有助于速定位故障节点,还能够帮助运维人员进一步了解系统架构,从而提高对系统的认知度。
参考文献:
[1] 侯丽波.视频监控系统故障检测方法及优化策略 [J].网络安全技术与应用,2024(4):29-30.
[2] 李影,张震强,刘镇涛.石家庄地铁3号线高清CCTV系统设计与实现 [J].智能建筑与智慧城市,2017(11):37-39.
[3] 郑代洲.安徽高速公路视频监控系统故障与诊断方法研究 [J].低碳世界,2021,11(3):201-202.
[4] 周星宇.面向视频监控系统的IoT IDS设计与实现 [D].上海:华东师范大学,2023.
[5] 杨咪,任青青.地铁专用通信系统设备故障分析研究 [J].现代信息科技,2022,6(11):54-56.
[6] 杨栩.铁路综合视频监控系统故障定位研究 [J].现代信息科技,2020,4(7):42-43+46.
[7] 叶海波.铁路站段综合视频监控系统设计与关键技术 [D].长沙:中南大学,2022.
[8] 徐健.上海轨道交通“新三线”综合监控系统电力数据传输方案优化 [J].城市轨道交通研究,2024,27(S1):152-156.
[9] 王赐航.城市轨道交通视频监控系统数字硬盘录像机故障诊断及修复方案 [J].城市轨道交通研究,2021,24(S1):80-84.
[10] 杨跃平,向海洲.5G高清摄像机在SA组网下业务异常中断机理研究 [J].现代城市轨道交通,2022(1):51-57.
作者简介:朱志平(1996—),男,汉族,江西宜春人,工程师,本科,研究方向:地铁通信系统设备运营维护、通信智能运维技术应用。
收稿日期:2024-05-16