宋建国
(吉林工程技术师范学院, 吉林 长春 130062)
0 引言车联网大数据是车辆电气化与互联网联合发展的新型工业领域[1]。随着车联网的不断发展,数据越来越庞杂,由此带来了传输数据速度、数据信息不透明、数据泄露和数据安全等问题[2]。针对上述问题,本文提出了基于关联规则的车联网信息数据加密技术,用于提高数据加密效果、提高数据传输速度。
1 基于关联规则的车联网大数据车联网作为一种新型通信技术,为车载设备提供多种服务,包括车辆保养、金融服务和车载娱乐等。为了保证车联网大数据的信息安全,无权限的第三方不会被泄露信息,需要建立基于关联规则的车联网大数据,以实现多用户多节点传输数据。
假设Q为车联网数据集,W为各项事务,每个事务ri都各自具有唯一独立的标识,Y={y1,y2,…,yn}为不同事务的组合。若A为一个项目集合,项目属于事务,则事务包含于项目集合。对于A的支持度sup(A),通常用车联网数据中A所占车联网数据集Q的占比来表示。如果A是一个频繁项集,则项目集合A的支持度应大于任意项集中的最小数值。而对于A的置信度,通常用车联网数据中心项目集A和项目集B的支持度与项目集A比值来表示,即:
车联网数据挖掘相关规则包含公用联网和车联网两部分。以此为基础,车联网可进一步细分为车载节点、通信基站和其他车辆网络节点,这些节点分别具有自身独立的关联规则。关联规则中,为了提升车联网大数据的精准度,需要提高关联规则的提升度。提升度为:
式中:P(A)和P(B)为项目集A和项目集B被挖掘的概率。在关联规则中,提升度在[-1,1]之间变化。
根据式(2)可以得知,若计算结果为0,此时关联规则中的提升度并未在项目集A和项目集B的数据挖掘中起作用。若计算结果在[-1,0)之间,此时关联规则中的提升度在项目集A和项目集B的数据挖掘中起到反作用。若计算结果在(0,1]之间,此时关联规则中的提升度在项目集A和项目集B的数据挖掘中起到正作用。从以上分析可以看出,为了使关联规则在数据挖掘中起到正作用,在计算过程中,若结果计算出为0,则这部分数据将马上被剔除。此外,将提升度>0 的路侧车联网设备和通信基站等边缘节点进行统一标识,以实现数据安全。
2 车联网信息数据加密传输模型由于车联网信息传输环境复杂多变,传输数据的加密算法与车联网关联规则相互结合,将更有利于大量车联网数据的安全传输。基于关联规则的车联网信息数据加密传输模型示意图,如图1 所示。车联网大数据在传输过程中,发送方和接收方之间存在一条虚拟通道,需要确认ID 和交换密钥。其中,密钥的交换对车联网大数据的安全传输起着至关重要的作用。
图1 基于关联规则的车联网信息数据加密传输模型
车联网大数据信息加密分为以下4 个步骤:
1)数据分割,利用协议标头进行包装。数据传输过程中,为了实现数据的保护,需要结合关联规则对安全协议数据安全进行设计。安全协议数据单元主要包括协议明文头、协议保护头、协议用户数据和协议完整性校验阈值。协议明文头由初始化向量和Internet 协议编号构成。协议保护头的作用为信息鉴别,方式为对通信系统源目标地址进行封装。协议完整性校验阈值通过哈希函数将有效数据进行包装,即报文汇总。
2)接收方接收来自发送方的数据。数据经过DES密钥加密,接收方接收后进行分组处理并获得信息。通过对车联网大数据信息进行统计,甄别需要加密的数据,并对其进行数字签名,数据处理后发送至网关进行身份验证,通过查验车联网发送的签名和密文确认身份。若查验正确,接收方可以接收车联网传输的大数据信心,否则,拒绝接收。
3)车联网大数据信息交换,实现车辆与车辆之间的通信。为了实现上述功能,需要对车联网大数据进行加密并传输。通常情况下,通信系统会将车联网大数据信息传输给通信区域内的车辆,边界节点会将信息直接传输给相邻节点,并将相关传输信息上传到服务器。通过对车联网大数据的协同传输和配合,可以查询其他相关的关联节点,以应对突发情况。
4)接收来自发送方的车联网大数据信息。重复步骤1)—3),最终实现车联网大数据的全部数据传输。车联网大数据信息在传输过程中,不可避免会出现数据传输错误等问题。因此,传输协议要包含容错性。
3 实际应用车联网信息数据加密技术3.1 应用效果分析基于关联规则的车联网信息加密具有传输速度快、信息安全性高的特点。为了验证上述优点,以某市实际公共交通GPS 资料为基础,对比基于区块链保护的车联网大数据传输模型、基于云边融合的车联网大数据传输模型和本文提出的基于关联规则的车联网信息加密传输模型。以上3 个模型的最高吞吐量分别为400 kb/s、260 kb/s 和480 kb/s,可以看出,基于关联规则的车联网信息加密传输模型吞吐量明显高于其他模型,加密传输更安全、更稳定。
3.2 经济性分析车联网大数据信息传输速率和信息安全性对车联燃油经济性也有一定影响。通过车载终端定期采集、实时传输获得大量数据,运用统计学的方法分析其燃油经济性。传输延时是影响燃油经济性的关键因素,大数据的精准传输可以避免计算误差,对提高驾驶员操作判断精确性、降低车内仪表故障发生率以及优化车载运行工况具有积极作用。基于区块链保护的车联网大数据传输模型、基于云边融合的车联网大数据传输模型和本文所提的基于关联规则的车联网信息机密传输模型的传输延时对比图,如图2 所示。可以看出,基于区块链保护的车联网大数据传输模型和基于云边融合的车联网大数据传输模型延迟高于5 s 的节点数,明显多于本文所提出的基于关联规则的车联网信息加密传输模型。
图2 传输延时对比
传输延迟对燃油经济性存在影响。3 种传输模型的燃油经济性对比,如表1 所示。可以看出,基于区块链保护的车联网大数据传输模型、基于云边融合的车联网大数据传输模型和本文所提出的基于关联规则的车联网信息加密传输模型的平均百公里耗油量分别为6.69 L、10.40 L 和6.54 L。基于关联规则的车联网信息加密传输模型的燃油经济性,相较于基于区块链保护的车联网大数据传输模型,提高2.24%。相较于基于云边融合的车联网大数据传输模型的燃油经济性,提高37.1%。
表1 燃油经济性对比
4 结论1)本文提出了一种基于关联规则的车联网信息数据加密模型,可以实现车联网大数据加密传输,同时,提高传输效率。
2)对比3 种传输模型,基于关联规则的车联网信息加密传输模型吞吐量最高为400 kb/s,在车联网大数据信息传输过程中具有更强的稳定性,加密传输安全性效果良好。
3)本文所提的数据加密传输模型相较于基于区块链保护传输模型和基于云边融合传输模型,燃油耗能显着降低。