基于最优频段选择的运动想象研究

known 发布于 2025-08-25 阅读(423)

摘" 要:脑电图(EEG)信号包含多个波段,其中运动想象主要涉及mu和beta波段。在明确所需频率的情况下,分类任务通常能够顺利执行。然而,频段选择并未成为主要研究焦点。因此,开发一种能够筛选出最优频段以参与分类任务的应用显得尤为重要。本研究基于BCI竞赛Ⅳ数据集2b,分析了视觉诱发的左右手运动想象脑电数据的分类效果。实验采用10折交叉验证方法对模型进行评估,旨在降低随机性并提供稳定性能指标。本研究应用了BP-CNN和AR-CNN两种模型,并与在已知频率范围内扩展频段的CNN模型进行了比较。即便在未知频率范围内,通过精确的频带选择和模型优化,仍能实现有效的运动想象识别,为脑机接口技术提供了理论基础,并对相关领域的未来研究具有重要的参考意义。

关键词:运动想象;脑机接口;频段选择;卷积神经网络

中图分类号:TP18" " 文献标识码:A" 文章编号:2096-4706(2024)21-0096-06

Research on Motor Imagery Based on Optimal Frequency Band Selection

ZHANG Guangxu, ZHANG Xiaodan

(School of Electronics and Information, Xian Polytechnic University, Xian" 710048, China)

Abstract: Electroencephalogram (EEG) signals consist of multiple frequency bands, with motor imagery primarily involving the mu and beta bands. When the required frequency bands are clearly defined, classification tasks can generally be performed smoothly. However, frequency band selection has not been a major focus of research. Thus, developing an application capable of screening the optimal frequency bands for classification tasks is particularly important. This research analyzes the classification performance of EEG data related to visual cue-based left-hand and right-hand motor imagery based on the BCI Competition IV dataset 2b. The experiments utilize a 10-fold cross-validation approach to evaluate the models, aiming to reduce randomness and provide stable performance metrics. This research applies two models of BP-CNN and AR-CNN, and compares them with a CNN model that extends the frequency bands within known ranges. Even within unknown frequency ranges, effective motor imagery recognition is achieved through precise frequency band selection and model optimization. It provides a theoretical foundation for brain-computer interface technology and offers significant reference value for future research in related fields.

Keywords: motor imagery; brain-computer interface; frequency band selection; Convolutional Neural Networks

0" 引" 言

脑机接口(Brain-computer Interface, BCI)是通过测量和解读大脑活动实现与外部设备的直接交互的技术系统[1]。它基于脑-机器接口的原理,为人类提供了一种非侵入性或部分侵入性的方式,通过将人的意图直接转换成计算机指令或控制信号,实现与外部世界的交互。通过脑机接口,人们可以通过大脑表达想法来操控设备,而不需要语言或动作。近年来,随着人工智能的发展,越来越多的研究人员致力于研发一种高效的脑机交互方式,即基于运动想象(Motor Imagery, MI)的BCI技术[2]。该技术从记录大脑活动开始,通过信号处理来检测用户的意图,然后向外部设备发送相应的信号,实现对外部机械设备的控制。

脑电信号可以根据频率范围划分为几个波段,包括δ波、θ波、α波、β波和γ波。δ波频率范围为0.5~4 Hz,通常出现在成人的深度睡眠时期。θ波频率范围在4~8 Hz之间,与人的情绪变化相关。α波包含8~12 Hz的频率范围,通常与紧张的精神活动、压力和紧张有关。β波的频率范围是12~30 Hz,通常出现在注意力集中的状态。γ波的频率范围是30~100 Hz,通常出现在人体十分亢奋的状态。

运动想象EEG信号是指受试者在模拟想象肢体的某一动作时所产生的大脑运动感知节律,主要由mu节律(8~12 Hz)和beta节律(14~30 Hz)组成[3]。研究表明,在运动想象过程中,大脑皮层的不同区域会产生特定频带(mu和beta节律)的能量变化。这种脑电功率谱的增强或减弱现象使得脑电功率在大脑皮层上呈现出不均匀的分布。运动想象信号产生的理论基础是事件相关去同步(Event Related Desynchronization, ERD)和事件相关同步(Event Related Synchronization, ERS)[4]。当人在头脑中想象某肢体运动时,运动皮质的相应区域处于活跃状态,对侧区域产生的脑电信号中的μ波和β波幅值会衰减,这被称为事件相关去同步。相反,同侧脑电μ波和β波频谱幅度会增强,即事件相关同步。目前脑机接口广泛应用于想象左手运动、右手运动、腿部运动和舌部运动。左手MI的信号变化来自C4区域,右手MI的信号来自大脑的C3区域,而足部运动的信号则来自CZ区域[5]。

当前,国际对运动想象的特征提取算法进行了广泛研究,涵盖了功率谱分析[6]、小波变换[7]、自回归(AR)模型[8]、以及共空间模式(CSP)[9]等多种方法。尽管这些技术在一定程度上实现了较高的分类准确率,但它们同样存在若干缺陷。传统算法往往依赖大量的先验知识,并且需要不断调整分类器参数,这使得处理过程变得复杂,从而降低了最终的分类精度和效率。另外,脑电信号作为一种复杂的非线性、非平稳随机信号,其信噪比较低,通过传统特征提取方法处理时,可能会丢失一些有价值的信息。尤为关键的是,在缺乏频带信息的情况下,往往无法对脑电信号进行准确识别。为此,提出一种能够自动选择最优频带的算法显得尤为重要,这对于提高脑电信号识别的准确性和效率具有深远的意义。因此,开发一种更高效且精确的脑电信号识别方法,依旧是研究者们亟待解决的挑战。

卷积神经网络[10]作为包含卷积运算和深层架构的前馈神经网络,是深度学习领域的一个标志性算法,在运动想象领域中也得到了广泛的应用。为了提高性能,我们使用一种结合时间、频率和位置信息的短时傅里叶变换(STFT)[11]输入形式来研究CNN。分别采用基于带通(BP)特征和功率谱密度(PSD)特征的Fisher判别分析型F评分来选择被试者最优频段。在实验中,分别采用与运动意象脑电信号相关的典型频段、被试者最优频段和扩展频段作为CNN输入图像的频率范围。

1" BP频率选择

BP(带通)滤波器的工作原理是筛选出特定频段内的频率成分,同时抑制那些低于和高于该频段的成分[12]。通常BP滤波器由两个关键的截止频率界定:下截止频率和上截止频率。这种类型的滤波器广泛应用于提取特定频段的信号,同时排除那些不相关的频率信息。

在本研究中,我们首先对输入数据应用BP滤波器,以提取特定频率范围内的信号成分。随后,我们计算滤波后信号的方差,并对不同类别的信号进行统计分析。最终,我们利用F-score来评估不同频率带对信号处理效果的影响,以确定最优化的频率带选择。

1.1" 方差的计算

衡量数据点相对于平均值的离散程度,它用于比较不同频带对信号的影响,以便挑选出最佳频带。

(1)

其中,X表示信号数据,xi表示信号中的每个数据点,表示信号的均值,N表示信号数据点的总数。

1.2" F-统计量

F-统计量(F-score)是一个用于衡量两个(或多个)类别之间差异的指标。Between-class variance衡量了不同类别均值之间的差异,Within-class variance则度量了同一类别内样本的分散程度[13]。F-score的值越大,意味着类别间的差异越显著,同时类别内部的分散性相对较低。这表明特定频段在区分类别方面具有较高的有效性。

(2)

具体计算方式:

(3)

其中,C表示类别的数量,Nj表示第j类的样本数量,表示第j类的样本均值,表示所有样本的总体均值,表示第j类中的第i个样本。

在本研究中,我们采纳了上述的F-score公式,并利用方差来评估各个频带的有效性。通过对每个频带进行细致的评估,我们确定了具有最高F-score的频带,将其认定为最优频带。

(4)

2" AR-PSD频率选择

在本研究中,功率谱密度的计算采用了AR模型,并结合了Burg方法。通过应用PSD的方差以及对数变换,我们提取了频带特征,并生成了相应的特征值。随后,使用F-score方法对频段的分类效果进行了评估。这些步骤共同助力于分析信号的频域特性,并对特征选择过程进行了优化。

2.1" 自回归模型的功率谱密度

AR模型假设当前值是过去值的线性组合,加上一个白噪声项。其数学表达式为:

(5)

其中,表示AR模型的系数,p表示模型的阶数, 表示白噪声。

在自回归模型下,功率谱密度表示信号在不同频率上的功率分布。对于阶数为p的AR模型,PSD计算式为:

(6)

其中,表示白噪声的方差,表示AR模型的参数,f表示频率。

2.2" Burg方法

Burg方法是一种用于估计自回归模型参数的技术,它通过最小化前向和反向预测误差来实现参数的优化[14]。这种方法的核心思想是找到一组参数,使得在给定当前观测值的情况下,预测未来值和过去值的误差之和最小。具体来说,Burg方法的主要步骤包括以下几个方面。

前向预测误差:

(7)

反向预测误差:

(8)

2.3" F-score公式

F-score用于衡量两个类别的分离度。它通过计算类别均值之间的差异与类别内方差之和的比值来评估分类效果。F-score较高表示两个类别在该频带上的区分度较高,即该频带对分类更有用。

(9)

其中,和分别表示类别1和类别2在第i个频带的均值。和分别表示类别1和类别2在第i个频带的方差。

3" CNN卷积神经网络

卷积神经网络,是一种多层结构的神经网络,它包含多个卷积层和池化层,以及一个全连接的输出层[15]。标准的CNN设计用于在图像识别中保持关键特征的位置不变性。在卷积层中,输入图像与多个二维滤波器进行卷积操作;而在池化层中,输入图像则经过下采样处理。通过反向传播算法,网络能够学习到卷积层的权重和滤波器参数,以最小化分类误差。

卷积神经网络在脑电信号分析和运动想象识别中广泛应用。在时域特征提取方面,CNN能从时间维度上提取特征。卷积核在不同时间窗口上滑动,学习局部时间相关性。在空间信息建模方面,CNN通过滑动卷积核学习空间位置之间的相关性和模式,提取通道间空间特征。为增强模型鲁棒性,常使用数据增强技术重构脑电信号,增加训练样本多样性。迁移学习技术利用预训练CNN模型,通过微调或特征提取方式提升分类性能。

首先,定义了一个卷积神经网络的结构,其中包括一个输入层、一个卷积层和一个池化层。卷积层通过指定的卷积核从输入数据中提取特征图,并使用激活函数增强非线性特征,池化层则进行下采样,减少数据的空间维度,同时保留关键特征,降低计算复杂度。接下来,数据经过预处理,包括标签转换和交叉验证的实施,交叉验证将数据集分成训练集和测试集,以评估模型的性能。训练阶段使用反向传播算法来优化卷积层的权重和偏置,目标是最小化预测误差。训练过程中,通过调整学习率、批量大小和训练轮数来优化模型的训练效果。最后,模型在测试集上进行评估,计算分类错误率以验证其性能。这一系列步骤确保了模型能够在不同数据折叠上表现稳定,并具备良好的泛化能力,从而提升了分类任务的整体效果。本文主要通过卷积神经网络进行训练,整体算法过程如图1所示。

4" 实验及实验结果

4.1" 实验设计

本文选用数据集由格拉茨理工大学神经工程研究所提供的BCI竞赛Ⅳ的数据集2b[16],该数据集是基于视觉诱发的左右手运动想象的脑电数据集,包含了9名被试者,均为右撇子,且视力正常或矫正到正常,坐于离电脑显示屏幕大概1米的扶手座椅上,每个被试者采集两组(用于训练和测试),每组5次数据,前2次为无反馈(筛选)的训练数据,后3次为有反馈的记录。该实验采用3个双极性脑电通道(0.5~100 Hz陷波滤波)、3个EOG通道、250 Hz采样率进行数据采集,竞赛数据集Ⅳ 2b的单次采集实验过程图如图2所示。本文通过从C3、CZ和CZ电极中选择最佳频带,软件平台是MATLAB 2023b,CPU为AMD Ryzen 7-5800H,GPU为RTX 3060,内存为16 GB。

4.2" 评估方法

4.2.1" 数据准备和交叉验证

10折交叉验证[17]是一种评估机器学习模型的可靠方法。它将数据集划分为10个等量的子集,然后依次使用其中9个子集进行模型训练,而将剩余的1个子集用作测试。这一过程重复10次,确保每个子集都恰好被用作一次测试集。通过计算这10次测试结果的平均指标,我们可以得到模型的最终性能评估。这种方法有助于降低模型评估过程中的随机性,从而提供一个更为稳定和全面的性能评价。其计算式如下:

(10)

(11)

4.2.2" 模型训练

为了评估模型的性能,我们必须对模型进行训练,计算每个测试样本的预测错误率,进行预测调整,并计算总的错误率。

1)错误率计算。对于每个测试样本i,计算预测错误率traERi的公式如下:

(12)

其中,numel(wrongi)表示预测结果与真实标签不一致的样本数,Ni表示测试样本i中的样本总数。

2)预测调整。在执行预测调整之前,我们必须对原始数据进行预测,以确定结果的正确率区间。这一过程确保了我们的预测更加精确和可信。

(13)

3)总错误率,在评估模型性能时,总错误率是一个重要的指标。它反映了模型在预测过程中出错的频率。

(14)

其中,R表示预测正确的样本数,M表示样本总数。

前向传播是卷积神经网络中的一个关键步骤,它决定了网络输出中最大值对应的类别即为模型的预测结果。为了评估模型的性能,我们需要计算错误分类的比例,即错误计算。此外,分类调整也是提高模型准确性的一个重要手段,通过简单的规则来修正模型的预测结果。而总体错误率则是通过计算预测正确的比例得出的,它为我们提供了一个全面的视角来评估模型的分类效果。这些公式和原理共同构成了评估卷积神经网络性能的基石,使我们能够通过定量的方式测量模型在测试数据集上的表现。

4.3" 模型性能

在进行BCI Competition IV 2b数据集的深入分析过程中,我们针对每一位参与者分别采用了BP-CNN和AR-CNN两种不同的模型来进行训练和测试,如图3和图4所示。

具体来说,图5详细展示了BP-CNN模型在对9名被试者进行分类时,采用10折交叉验证方法所得到的分类结果。与此同时,图6展示了在相同条件下,即对同样的9名被试者进行分类时,AR-CNN模型的表现。通过比较图5与图6,我们可以直观地看出两种模型在分类性能上的差异,从而评估哪一种模型更适合处理此类数据集。此外,图7呈现了经过拓展频带优化的CNN模型在10折交叉验证法下的分类性能。这一过程旨在通过CNN模型对比频率选择模型的分类精度,验证在未知频率的情况下,频率选择模型的分类结果是否与已知拓展频带分类结果相似,以确保模型性能的可靠性。

为了从C3、C4和CZ电极中提取出最佳的μ波段(8~12 Hz)和β波段(14~30 Hz),在缺乏具体频率范围信息的情况下,我们采用了BP-CNN和AR-CNN这两种方法来确定最优频带。这一过程涉及对不同频带进行细致的筛选和评估,以期找到能够实现最佳分类性能的频带组合。图8表示三类算法经过多次的批次训练,损益值结果相近,符合实验预期。

根据表1中运动想象识别的平均错误率结果,我们可以发现,BP-CNN和AR-CNN模型的分类结果相近,并且都接近于CNN(拓展频带)的结果。这表明,在没有给定频率范围的情况下,我们也能准确地进行运动想象识别。通过这种方法,即便在未知频率波段的情况下,我们也能够良好地理解脑电波在不同频段上的活动模式,保证一定的分类识别率,从而为后续的研究和应用提供更为坚实的理论基础。

5" 结" 论

在本次研究中,我们针对BCI Competition IV 2b数据集,通过采用BP-CNN和AR-CNN两种模型,以及频率选择和拓展频带优化技术,对运动想象任务的分类进行了深入探讨。通过10折交叉验证方法,我们不仅验证了模型在多种数据子集上的有效性,还确保了研究结果的稳定性和可靠性,对脑电信号的运动想象发展具有一定理论指导意义。

参考文献:

[1] NICOLAS-ALONSO L F,GOMEZ-GIL J. Brain Computer Interfaces, a Review [J].Sensors,2012,12(2):1211-1279.

[2] ALTAHERI H,MUHAMMAD G,ALSULAIMAN M,et al. Deep Learning Techniques for Classification of Electroencephalogram (EEG) Motor Imagery (MI) Signals: A Review [J].Neural Computing and Applications,2023,35(20):14681-14722.

[3] HU J F,MU Z D,XIAO D. Classification of Motor Imagery EEG Signals Based on Energy Entropy [J].Computer Engineering and Applications,2008,44(33):235-238.

[4] PFURTSCHELLER G. Event-related Synchronization (ERS): an Electrophysiological Correlate of Cortical Areas at Rest [J].Electroencephalography and Clinical Neurophysiology,1992,83(1):62-69.

[5] FUMANAL-IDOCIN J,WANG Y-K,LIN C-T,et al. Motor-imagery-based Brain-computer Interface Using Signal Derivation and Aggregation Functions [J].IEEE Transactions on Cybernetics,2021,52(8):7944-7955.

[6] ALAM M N,IBRAHIMY M I,MOTAKABBER S M A. Feature Extraction of EEG Signal by Power Spectral Density for Motor Imagery Based BCI [C]//2021 8th International Conference on Computer and Communication Engineering (ICCCE).Kuala Lumpur:IEEE,2021:234-237.

[7] LI M-A,ZHU W,LIU H-N,et al. Adaptive Feature Extraction of Motor Imagery EEG with Optimal Wavelet Packets and SE-isomap [J/OL].Applied Sciences,2017,7(4):390[2024-08-05]. https://doi.org/10.3390/app7040390.

[8] LI D,ZHANG H X,KHAN M S,et al. A Self-adaptive Frequency Selection Common Spatial Pattern and Least Squares Twin Support Vector Machine for Motor Imagery Electroencephalography Recognition [J]. Biomedical Signal Processing and Control,2018,41:222-232.

[9] HUANG W C,ZHAO J C,FU W L. A Deep Learning Approach Based on CSP for EEG Analysis [C]//10th IFIP TC 12 International Conference.IIP:Nanning,2018,62-70.

[10] ALOYSIUS N,GEETHA M. A Review on Deep Convolutional Neural Networks [C]//2017 International Conference on Communication and Signal Processing (ICCSP).Chennai:IEEE,2017:588-592.

[11] NAWAB S,QUATIERI T,LIM J. Signal Recon-struction from Short-Time Fourier Transform Magnitude [J].IEEE Transactions on Acoustics, Speech, and Signal Processing,1983,31(4):986-998.

[12] ZAHOOR S,NASEEM S. Design and Implementation of an efficient FIR Digital Filter [J].Cogent Engineering,2017,4(1):1-12.

[13] MURPHY K P. Machine Learning-A Probabilistic Perspective [M].Cambridge:The MIT Press,2012.

[14] ÜBEYLI E D. Least Squares Support Vector Machine Employing Model-based Methods Coefficients for Analysis of EEG Signals [J].Expert Systems with Applications,2010,37(1):233-239.

[15] TABAR Y R,HALICI U. A Novel Deep Learning Approach for Classification of EEG Motor Imagery Signals [J].Journal of neural engineering,2016,14(1):016003.

[16] TANGERMANN M,MüLLER K-R,AERTSEN A,et al. Review of the BCI Competition IV [J].Frontiers in Neuroscience,2012,6:1-31.

[17] GANIE S M,MALIK M B. Comparative Analysis of Various Supervised Machine Learning Algorithms for the Early Prediction of Type-II Diabetes Mellitus [J].International Journal of Medical Engineering and Informatics,2022,14(6):473-483.

作者简介:张光旭(2003.07—),男,汉族,福建三明人,本科在读,研究方向:运动想象、脑机接口。

标签:  模型 

免责声明

本文来自网络,不代表本站立场。如有不愿意被转载的情况,请联系我们。

iidomino cuppor