基于CNN-LSTM-CBAM模型的地震前兆重力异常检测研究

known 发布于 2025-08-25 阅读(238)

中图分类号:TP183;TP39;P315. 7 2 + 6 文献标识码:A

文章编号:2096-4706(2025)08-0041-05

Abstract: This research proposes an anomaly detection method in earthquake precursor gravity data based on the CNNLSTM-CBAMmodel.The anomalydetection inearthquake precursor gravitydata is crucial for improving the timelinessof earthquakepredictions.Itextracts spatial features ofthegravitydata using CNN,anduses theLSTMtocapture long-term dependencyrelationships inthe time series.The CBAMisintroduced toenhance the models abilityto focusonimportant features,thereby improving anomaly detection performance.Experimental comparisons with the anomaly detection methods suchas AutoEncoder,CNN,LST,andCNN-LSTmethodsshowthattheproposedmodelinthispaperoutperformsotrsin metrics such as MAE,MSE,RMSE,and .This model effectively identifies potential and abnormal dataand providesa reliable foundation forearthquakeriskmanagementandearly waming.Thisresearchofersnewinsights into theanalysisofearthquake precursor data.

Keywords: earthquake precursor anomaly; gravity data; time series; LSTM; Atention Mechanism

0 引言

在印度板块与欧亚板块相互作用及太平洋板块影响下,中国是板块内地震活动最强烈、频率最高的地区之一{I]。随着对地震预报理解的深入,地震前兆被认为是地震发生的直接标志,因此寻找前兆异常在预报研究中具有重要意义[。大规模数字地震台网平台能够收集形变、流体、地磁等海量前兆观测资料,为相关研究提供关键数据。

目前的数据检查主要依赖人工方法,存在烦琐和低效的问题,不同台站的异常判定标准不一,导致结果中存在主观因素[3]。因此,结合现有异常检测算法,提出针对前兆数据的自动异常检测方法,可以显著提高工作效率,减轻工作强度,减少人为主观影响,确保数据客观性。

现有大多数前兆异常检测方法主要基于统计方法,例如通过计算正常数据的基线和变化率,判定超出范围的观测为异常[4]。此外,还有小波变换[5]和经验模态分解[等数字信号分析技术,这些方法通过时域到频域的转换进行异常分析。然而,这些技术仅适用于特定类型的时间序列异常,且不同类型的重力异常常常重叠,使得高精度检测所有异常的推广具有挑战性。因此,需要一种能够统一识别大多数异常的新方法。

深度学习技术已成为流行的机器学习方法,通过自学习提取深度特征,在有监督和无监督学习中表现优异[7-8]。地震前兆重力数据是典型的时间序列,LSTM网络能够处理长期依赖关系,捕获深层特征,从而提高地震异常自动识别的准确性。然而,LSTM在处理长序列时可能面临梯度消失或爆炸的问题,影响其学习效果,仍需改进以适应地震异常检测的需求。

由于前兆数据特殊的观测目标和自身独有的特点,目前基于深度学习的异常检测算法在前兆数据中的应用仍较少,本文尝试引入基于CNN-LSTM-CBAM的异常检测模型,对前兆重力数据进行检测,以解决台网海量数据人工检测效率低下和人为主观影响的问题,探索地震前兆数据分析与异常检测的新方法。

1前兆重力数据预处理

1.1 数据介绍

本文研究所用的连续观测重力数据由江苏省地震局提供,主要围绕重力仪的秒采样数据展开,时间范围为2022年1月1日至2022年1月31日。

在对前兆数据进行分析之前,必须进行科学有效的数据存储。由于前兆数据包含多种观测指标且数据量日益增长,规范的数据编制对于保证科学存储至关重要。规范的要点包括数据类型、台站、测点、测项和采样率等指标。在文件命名时,各项要点应以下划线形式隔开,例如:DYU32011_F_21210_02.txt,其中:DYU表示预处理前兆数据;32011表示具体台站;F表示台站的某个具体测点(每套仪器对应一个测点);21210表示具体的测项,2xx指代地形变观测,即对由地壳运动引起的垂直形变、水平形变、断裂错动、重力及应力应变等变化量的观测;21210特指重力潮汐变化测项,表示测量台站重力数据;02表示采样率为秒。

此外需要特别注意的是,当仪器无法采集数据或数据上传过程中出现问题时,检测仪会自动填补缺失数据,但这些填补的数据可能显著高于或低于正常数据的数倍甚至百倍,缺失数据的标志值默认为999999。测项对应的编号及说明如表1所示。

表1表地震前兆重力数据测项与说明表

1.2 重采样

前兆重力数据作为一组秒采样的时间序列数据,一天的数据量为86400条数据,数据量较大。为方便后续分析与可视化,对预处理后的前兆重力数据进行重采样,重采样为每30分钟1个数据点,这意味着每个重采样后的数据将包含1800条秒级数据。重采样后数据的平滑程度和整体趋势更为明显,有助于我们更好地识别潜在的异常变化和趋势,为异常识别提供可靠的基础。重采样前后的数据如图1和图2所示。

图1原始数据图

1.3 数据标注

在对重采样后的数据进行异常检测前,采用人工标注的方法来识别异常数据。基于原始数据,新增了label列,其中正常数据被标注为0,而异常数据则被标注为1。经过标注处理后的数据如图3所示,其中虚线代表被标记为异常的数据点。

2 CNN-LSTM-CBAM网络模型结构

本文提出的CNN-LSTM-CBAM异常检测模型结合了卷积神经网络(CNN)、长短期记忆网络(LSTM)和通道-空间注意力模块(CBAM),旨在有效检测地震前兆重力数据中的异常。这一模型不仅能够捕捉时间序列数据中的时序特征,还能增强对数据内部结构的解释能力,从而提高异常检测的精度。

CNN作为深度学习的一个重要组成部分,广泛应用于时间序列预测等领域。其结构包括卷积层、池化层和全连接层[9。在卷积层中,模型通过对一维矩阵提取最佳特征,生成卷积输出,如式(1)所示:

其中 表示卷积输出,tanh表示激活函数, 表示输入值, 表示权重, 表示偏置。

从而为后续处理提供有效信息。池化层则通过最大池化等方式,减少特征维度并保留重要信息。最终,全连接层对经过处理的数据进行分类或回归任务。

在地震前兆重力数据的应用中,CNN通过自动提取重力数据中的关键特征,帮助识别可能的异常模式。

LSTM是一种改进的循环神经网络(RNN),专门设计用于处理长期依赖问题和梯度消失问题[10]。它通过输入门、遗忘门和输出门的门控机制,有效地管理信息流,决定在每个时间步应保留多少信息,如图4所示。

图4LSTM结构图

LSTM的设计使其在处理时间序列数据时具有显著优势,能够捕捉数据的动态变化和非线性关系。

一个标准的LSTM单元包括三个门:遗忘门 决定要遗忘多少先前的数据;输入门 ,用于计算要写入单元存储器的信息;输出门 ,决定如何计算当前信息的输出,如式(2)~式(4)所示:

其中, W, R 和 变量表示可训练的矩阵和向量参数。

LSTM单元定义,如式(5)~式(8)所示:

候选细胞状态 是使用输入数据 和前一个隐藏状态 计算的。细胞记忆或当前细胞状态 是使用遗忘门 前一个细胞状态 、输入门 和候选细胞状态 计算的。Hadamard积 ⨀ 表示所涉及矩阵的元素积。输出 是通过将相应的权重( )应用于隐藏状态 来计算的。

在地震前兆重力数据的分析中,LSTM能够对通过CNN提取的特征进行时间序列建模,学习数据中的时间依赖性,从而更准确地预测异常事件的发生。

CBAM是一种有效的注意力机制,旨在通过选择性地聚焦于重要特征,增强模型的表达能力[]。在CBAM中,通道注意力模块和空间注意力模块相辅相成,分别对特征的通道和空间维度进行加权处理,从而提高网络的利用率和异常检测能力,其结构如图5所示。

图5CBAM结构图

通道注意力和空间注意力的计算如式(9)~式(10)所示:

其中, 表示通道注意力模块计算因子, 表示空间注意力模块计算因子, ε 表示Sigmoid激活函数,MLP表示多层感知器, F 表示特征向量,unit表示通道组合,conv表示卷积操作。

在地震前兆重力数据中,CBAM通过增强重要特征的权重,减少低效信息的影响,从而提升模型对异常情况的敏感性和识别能力。

结合以上三个模块,CNN-LSTM-CBAM模型能够在时间序列数据处理上实现更高的效果。CNN层提取输入重力数据的高维卷积特征,LSTM层对这些特征进行序列建模,学习其内部的时间依赖性,而CBAM模块则动态调整每个通道和空间位置的加权系数,进一步提升模型的拟合精度和适应性。

通过这种组合,模型能够有效捕捉地震前兆重力数据中的时序特征和动态变化,显著提高异常检测的准确性。模型的整体结构如图6所示。

图6CNN-LSTM-CBAM模型结构图

3 实验结果及分析

3.1 实验流程

基于CNN-LSTM-CBAM模型的地震重力前兆重力异常检测算法的整体流程如图7所示。

图7实验流程图

在本研究中,首先对地震前兆重力数据进行标注,将数据划分为正常数据和异常数据。正常数据不包含异常情况,用于训练模型以学习正常模式;异常数据则包含异常样本,用于测试模型性能。此外, 1 5 % 的数据被划分为验证集,以平衡模型训练和验证的需求。

接下来,构建CNN-LSTM-CBAM模型,并使用训练数据进行训练。训练完成后,模型将对测试数据进行预测,通过输入前一段时间的重力数据,预测接下来的重力变化。模型的性能通过均方误差(MSE)[12]、平均绝对误差(MAE)[13]、均方根误差(RMSE)[14]和决定系数 )等指标进行评估[15]。

异常分数的计算基于模型预测值与实际重力数据之间的差异,常用的距离度量包括均方误差和绝对误差。计算后的异常分数经过标准化处理,范围调整为0到1,便于比较。异常分数越接近1,表示数据越可能是异常值。

设定合理的阈值以标记异常数据。例如,若阈值设为0.5,则所有异常分数高于该值的数据将被标记为异常。最终,通过检测到的异常分数绘制异常检测图示,以便于分析人员快速识别和响应异常现象。

3.2 实验分析

为了更好地评估CNN-LSTM-CBAM模型的前兆重力数据异常检测算法的有效性,本文选择了经典的异常检测算法作为对比模型,具体包括AutoEncoder(自编码器)、CNN、LSTM和CNN-LSTM。

本文提出的CNN-LSTM-CBAM模型在CNN-LSTM的基础上引入了通道和空间注意力机制,进一步增强了模型对重要特征的关注能力。通过这种方式,模型能够更精准地捕捉异常数据,提高检测效果。

各模型的异常检测的实验结果如表2所示。

表2实验结果表

从实验结果来看,AutoEncoder的重建误差相对较高,显示其对数据特征的学习能力有限。尽管能够检测到一些异常,但整体效果较差,特别是在复杂数据场景中。相比之下,CNN显著提升了检测性能,其强大的局部特征提取能力使得异常识别更加准确,但仍缺乏处理时间序列信息的能力。

LSTM在处理时间序列数据方面表现出色,能够有效捕捉数据中的时序特征。尽管在误差指标上与CNN相似,但在动态数据分析中,LSTM更能识别潜在的异常模式。结合CNN和LSTM优势的CNN-LSTM模型在空间特征提取和时间序列处理上都有所增强,其 值的提升表明该模型能够更准确地识别异常情况,显著降低了重建误差。

引入CBAM后,CNN-LSTM-CBAM模型表现出色,所有性能指标均达到了最佳水平。该模型在特征选择上更为精细,能够更有效地关注关键特征,进一步提升了异常检测的准确性。

综上所述,CNN-LSTM-CBAM模型在异常检测任务中展现了最高的性能,尤其是在 值上达到了0.887,表明其对数据异常的捕捉能力极强。相比于其他模型,该算法在处理复杂数据时能够更精准地识别潜在异常。实验结果清楚地表明,结合空间和通道注意力机制的CNN-LSTM-CBAM模型显著优于传统的单一模型,为异常检测提供了更为有效的解决方案。

为了进一步优化异常检测过程,本文设置了一个合理的阈值,用于将异常分数与该阈值进行比较。当样本的异常分数高于这一阈值时,对应的重力数据将被标记为异常。例如,将阈值设为0.5,所有异常得分高于0.5的样本将被视为异常。这种方法使得异常检测过程更加系统化,并有效减少了误报。得到的异常分数如图8所示。

根据异常检测分数的结果,将高于设定阈值的点标记为异常。基于重采样数据,标记检测到的异常并绘制了异常检测图示,如图9所示,其中虚线代表被检测为异常的数据。这种可视化方式便于分析人员快速识别异常,提升了对重力数据异常的响应效率,同时也有助于进一步追踪和研究这些异常现象的潜在原因及后果。

图8异常分数图

4结论

本研究提出的CNN-LSTM-CBAM模型在地震前兆重力数据的异常检测中表现出色。该模型通过结合CNN和LSTM,有效捕捉多维时序数据中的潜在非线性关系和长期特征。CNN负责提取重力数据的空间特征,而LSTM则专注于学习时间序列的动态变化。引入的CBAM注意力机制进一步增强了特征提取能力,使模型能够更精准地关注重要特征。这种综合方法不仅提高了异常检测的准确性,还能有效识别潜在的异常数据,为地震前兆信号的监测提供了可靠依据。

模型通过其高效的特征学习和异常检测能力,为地震前兆的研究提供了一种科学、系统的方法,增强了对地震风险的管理能力,助力于提升地震预测的准确性和及时性,研究人员和决策者可以更有效地利用这些数据进行前期预警和防灾减灾工作。

参考文献:

[1]李艳娥.基于孕震过程追踪的强震预测方法研究[D].北京:中国地震局地球物理研究所,2023.

[2]徐锡统.地震扰动下地球多圈层异常分析及其演化模式研究[D].长春:吉林大学,2024.

[3]池成全.钻孔应变前兆观测数据分析与异常提取研究[D].长春:吉林大学,2020.

[4]辛建村,方炜,杨宜海,等.2021年酒泉阿克塞县MS(S下标)5.5地震前地电场变化分析[J].地震,2023,43(4):153-168.

[5]刘杰.基于循环神经网络的汶川地震地下流体前兆识别方法研究[D].成都:成都理工大学,2021.

[6]孙一书.城市拖电瞬变电磁数据降噪与反演方法研究[D].长春:吉林大学,2023.

[7]王洪洲.基于深度学习的地震勘探数据去噪及速度模型反演技术研究[D].长春:吉林大学,2024.

[8] KAVIANPOUR P,KAVIANPOUR M,JAHANI E,etal.ACNN-BiLSTMModelwithAttentionMechanism forEarthquake Prediction [J].Journal of Supercomputing,2023,79(17):19194-19226.

[9] ZHANG H,ZHAI H,LIU T T,et al. Short-termComprehensive Prediction Method for Regional EarthquakesBased on Multi-source Information Fusion [J].Proceedings of theIndian National Science Academy,2024 (prepublish):1-11.

[10]BUDAKC,GIDERV.LSTMBasedForecastingof theNext Days Values of Ionospheric Total Electron Content (TEC)as an Earthquake Precursor Signal [J].Earth Science Informatics,2023,16(3):2323-2337.

[11] LIHY,LIJH,LIXG,et al. Seismic PickingAttention Module[J].IEEE TransactionsonGeoscienceandRemote Sensing,2024,62:1-6.

[12] MOUDDEN TEL,AMNAI M,CHOUKRIA,etal. Artificial Intelligence for Assessing the Planets Positions asa Precursor to Earthquake Events [J].Journal of Geodynamics,2024,162:102057.

[13]罗旭辰.基于多源深度学习的地震预测模型研究[D].成都:电子科技大学,2023.

[14] ZHANGJY,SUNK,ZHUJQ,et al.ApplicationofModel-based Time Series Prediction of Infrared Long-waveRadiation Data for Exploring the Precursory Patterns Associatedwith the 2021 Madoi Earthquake[J].Remote Sensing,2023,15(19):1-22.

[15]史翔宇.基于机器学习回归算法的地震预测研究及其在中国地震科学实验场的应用[D].北京:中国地震局地震预测研究所,2021.

作者简介:邢干龙(1999一),男,汉族,河南商丘人,硕士在读,研究方向:地震前兆异常、大数据处理、深度学习;通信作者:刘庆杰(1978一),男,汉族,河南洛阳人,教授,硕士,研究方向:大数据处理。

标签:  数据 

免责声明

本文来自网络,不代表本站立场。如有不愿意被转载的情况,请联系我们。

iidomino cuppor