摘" 要:在多样的社会环境下,由于心理、生理、环境、学业、社会等多方面因素,导致学生压力剧增。为了找到影响学生压力的主要原因并解决学生压力过大问题,文章选用了多方面因素影响学生压力的数据集,利用Apriori算法研究了与学生压力相关的多方面因素的影响情况,分析了不同因素与压力的频繁项集和关联规则,发现了焦虑问题、睡眠问题、环境安全、霸凌等问题对学生压力影响较大。研究结果显示,减轻学业压力、抵制霸凌和改善学生生活环境有助于降低学生的压力。
关键词:学生压力;Apriori算法;多元因素;关联规则
中图分类号:TP391" 文献标识码:A" 文章编号:2096-4706(2024)23-0048-06
Mining and Analysis of Multiple Factors of Student Stress Based on Apriori Algorithm
SHEN Yue1, ZHANG Yihan1, WANG Wanwan2
(1.School of Artificial Intelligence and Big Data, Henan University of Technology, Zhengzhou" 450001, China;
2.iFLYTEK Co., Ltd., Hefei" 230088, China)
Abstract: In a variety of social environments, due to psychological, physiological, environmental, academic, social and other factors, the student stress has increased dramatically. In order to find the main causes of student stress and solve the problem of excessive student stress, this paper selects the dataset of multiple factors affecting student stress, uses the Apriori algorithm to research the influence situation of multiple factors related to student stress, and analyzes the frequent item sets and association rules of different factors and stress, then finds that anxiety problems, sleep problems, environmental safety, bullying and other problems have a great impact on student stress. Research results show that reducing academic stress, resisting bullying and improving the living environment of students can help reduce student stress.
Keywords: student stress; Apriori algorithm; multiple factors; association rule
0" 引" 言
在当今复杂多变的社会环境中,学生面临着日益增长的压力,这些压力不仅来源于学业上的高要求和激烈的教育竞争,还包括来自家庭、同伴以及社会环境等多方面的挑战。研究显示,长期的心理压力会影响睡眠、饮食等,极大降低学生对生活的积极性;同时,在高压力状态下,学生容易感到疲惫和焦虑,注意力和专注力会下降,影响学习效果[1]。因此,如何有效缓解学生群体中普遍存在的压力问题,已经成为当前教育科学研究及心理健康领域亟待解决的关键议题之一,探讨影响学生压力的多元因素已成为教育科学与心理健康领域的重要课题。
近年来,数据挖掘技术的发展为我们提供了强有力的工具,可用于深入分析和理解学生压力的原因。Apriori算法作为一种广泛应用于关联规则学习领域的经典方法,在探索不同变量间潜在联系方面展现出了巨大优势。吴萌[2]利用Apriori算法进行监狱警察心理健康调查得出:受工作内容和工作环境影响,监狱警察普遍存在“内向、抑郁、焦虑、坚强”的心理特征;刘统青等人[3]利用Apriori算法挖掘出中小学生心理健康中隐藏的信息,对引导中小学生心理健康有着重要的警示与教育意义。实验分析睡眠质量、欺凌行为、社会环境等关键变量,能够揭示这些因素如何相互作用,便于全面理解影响学生压力的内在机制。实验的研究成果将为教育工作者、心理健康专家和政策制定者提供有价值的参考,帮助他们采取更加有效的措施,为学生的心理健康和学业发展提供支持。
1" Apriori算法
关联规则挖掘旨在发现海量数据集中项目之间的强有趣模式[4-5]。Apriori算法是一种迭代的逐层搜索方法,用于在数据库中识别频繁项集并生成关联规则。首先,对数据库进行一次扫描,通过设定的支持度阈值,筛选出支持度超过该阈值的单个项,形成频繁1-项集L1。在第k次扫描(k>1)中,利用上一次得到的频繁项集Lk-1生成候选k-项集Ck。然后,再次扫描数据库计算候选项集Ck中每个项集的支持度,并筛选出满足最低支持度阈值的项集,从而得到频繁k-项集Lk。这个过程会重复进行,直到生成的候选项集Ck为空。最后,对于每一个频繁项集,生成可能的规则形式,计算每个规则的置信度,并过滤出置信度大于或等于设定阈值的规则,最终得出强关联规则。算法流程如图1所示。
相关参数的支持度计算公式为:
(1)
其中,count(x)表示包含项集x的交易数量,n表示总交易数量。
置信度是指在包含项集A的交易中,同时也包含项集B的交易比例,计算公式为:
(2)
2" Apriori算法在学生压力多元因素中的应用
2.1" 数据来源
本研究采用了1 000名学生的心理压力数据,数据主要分为五大类:心理因素、生理因素、环境因素、学术因素、社会因素。心理因素包括焦虑水平(AL)、自尊水平(SE)、心理健康病史(MH)、抑郁情况(DP);生理因素包括:头痛问题(HA)、血压问题(XY)、睡眠质量(SM)、呼吸问题(HX);环境因素包括:环境噪音情况(ZY)、居住条件(LC)、环境安全情况(SF)、基本需求满足情况(BN);学术因素:学业表现(AP)、学业负担(SL)、师生关系(TSR)、未来职业担忧(FC);社会因素:社会支持(SS)、同辈压力(PP)、课外活动(EA)、霸凌问题(BL),以及压力水平(ST)属性在内的共21个属性。图2中展示了五种不同因素所包含的属性及压力水平的分布情况。
箱线图是对数据进行“压缩”以后得到的,可以看到数据分布的大致形状,也可以收集一组数据的四分位数、范围和异常值等信息。箱线图除了可以看到数据分布的大致形状,还可以收集一组数据的四分位数、范围和异常值等信息。从图2不同因素所含属性的箱线图中可以看出,各属性的数据大致集中在中间区域,极少出现极端数据,这体现了数据的合理性和可靠性。此外,通过对1 000名学生的压力水平分布地剖析,可以发现这些数据呈现均匀分布的特征,表明了数据调查的广泛性和普及性,反映了研究样本的多样性和全面性。抽取原始数据主要指标如表1所示。
2.2" 数据清洗与预处理
首先进行数据规范化处理依据症状自评量表SCL9[6]对心理测试的标准,本研究将部分属性值按照区间划分成五个类别,包括睡眠质量(SM)、呼吸问题(HX)、环境噪音情况(ZY)、居住条件(LC)、环境安全情况(SF)、基本需求满足情况(BN)、学业表现(AP)、学业负担(SL)、师生关系(TSR)、未来职业担忧(FC)、社会支持(SS)、同辈压力(PP)、课外活动(EA)、霸凌问题(BL)这14个属性依照“0=从无”“1=很轻”“2=中等”“3和4=偏重”“5=严重”进行分类;焦虑水平(AL)依照“0~4=轻度”“5~10=中轻度”“11~15=中度”“16~20=中高度”“21=严重”进行分类;自尊水平(SE)依照“0~6=较低”“7~12=中低”“13~18=中等”“19~24=中高”“25~30=较高”进行划分;心理健康病史(MH)依照“0=无”“1=有”进行划分;抑郁情况(DP)依照“0~6=轻度”“7~12=中度”“13~18=中重度”“19~24=重度”“25~27=极重度”进行划分;头痛问题(HA)依照“0=从无”“1=轻微”“2和3=中度”“4=较频繁”“5=严重”进行划分;血压问题(XY)依照“1=正常血压”“2=轻度高血压”“3=严重高血压”进行划分;压力水平(ST)依照“0=低压力”“1=中度压力”“2=严重压力”进行划分。学生心理健康压力调查表主要因素的描述如表2所示。
2.3" 数据的相关性
热力图是一种非常直观且高效的可视化工具,用于展示相关系数矩阵中各变量之间的相关性强弱,它通过颜色的深浅变化来形象地表示相关性。具体来说,当相关系数大于0时,意味着两个变量之间存在正相关关系,即一个变量的增加往往伴随着另一个变量的增加;相反,如果相关系数小于0,则表明两者之间存在负相关关系,即一个变量的增加通常会导致另一个变量的减少;而当相关系数等于0时,则说明这两个变量之间没有明显的线性关系或者这种关系非常微弱。通过利用图3相关性热力分布图,可以帮助我们理解和解释复杂数据集中的多变量关系,而不局限于某些特定的变量组合。
从图3中可以看出,压力水平与焦虑水平、心理健康病史、抑郁情况、头痛问题、环境噪音情况、未来职业担忧、同辈压力、课外活动、霸凌问题之间呈现正相关,且两者之间的相关性高达0.65以上;压力水平与自尊水平、睡眠质量、环境安全情况、基本需求满足情况、居住条件、学业表现、师生关系呈现负相关,且负相关达到0.67以上。
通过对数据的分析,可以更好地理解心理健康问题的复杂性和多因素性质,有助于识别出那些可能面临较高压力水平的学生,而且还可以为制定针对性的干预措施提供依据。例如,通过改善居住条件、减轻学习负担、提供社交支持等方式,可能有助于降低个体的压力水平,进而改善其整体心理健康状况[8]。
2.4" 挖掘频繁项集
在测试的学生中,约34%为低压力状态,32.5%为中度压力状态,33.5%为严重压力状态。频繁项集是指支持度大于等于最小支持度(min_sup)的集合。其中支持度是指某个集合在所有事务中出现的频率。为更好地反映影响学生压力的因素,利用Apriori算法找出和学生压力水平有关的频繁项集。利用Apriori算法找出频繁项集,如表4所示。
从表4的频繁项集中可以看出:
在心理因素方面,严重焦虑、有过心理健康病史和严重压力同时出现的概率高达19.2%,有极高自尊水平、没有过心理健康病史和低压力水平往往同时出现;在生理因素方面,轻微睡眠问题、轻度高血压以及轻度高血压、中度的呼吸问题和严重压力往往同时出现;在环境因素方面,中度的环境安全问题、较差的居住条件以及较低的基本需求满足情况往往会出现严重压力,良好的居住条件和低压力往往同时出现;在学业因素方面,学业负担较重往往与严重压力同时出现的概率高达28.5%,对未来不存在担忧与无压力往往同时出现;在社会因素方面,社会支持较低、适度的课外活动与严重的压力常常同时出现,经历过偏重霸凌、社会支持度低与严重压力往往同时出现,轻度的霸凌问题与低心理压力同时出现的概率较大。
通过频繁项集,可以看出学生的心理压力往往与心理焦虑、有过心理健康病史、睡眠问题、环境安全问题、基本需求满足情况、对未来的担忧、社会支持、霸凌问题等因素息息相关。
2.5" 挖掘关联规则
关联规则用来描述两个或多个事物之间的关联性,通过一件或多件事物来预测其他事物,可以从大量数据中获取有价值的信息。一般地,给定一个数据库,挖掘关联规则的问题可以转换为寻找满足最小支持度和最小置信度阈值的强关联规则过程[9]。利用频繁项集得出主要关联规则如表5所示。
表5中列举了心理、生理、社会、环境和学术五个不同方面与学生压力之间的关联规则,通过上表分析可知,MH1(有心理健康病史)和AL3(重度焦虑)、XY2(严重高血压)和 SM1(差的睡眠)、AP1(学业表现低)、BL3(较大霸凌)和SS1(社会支持轻微),以上各情形均会有90%以上的可能导致严重压力,是造成学生压力主要影响因素;XY2(严重高血压)和HX3(严重呼吸问题)、BN1(基本需求满足低)、LC1(差的居住条件)、SF1(不安全)、 EA3(课外活动较大)和SS1(社会支持轻微)等都有85%以上的可能导致ST2(严重压力)。同时,XY0(正常血压)和HA2(中度头痛)、FC2(未来职业适度担忧)分别有100%和约84%可能会引起ST1(中等压力);此外,SE4(较高自尊水平)和MH0(无心理健康病史)、BL1(轻度的霸凌问题)与ST0(轻微压力)具有强关联性,且置信度高达90%以上。
3" 结果分析
通过上述研究结果可以得出:
1)有心理健康病史的学生往往存在较高的焦虑水平,这种焦虑反过来可能导致更大的压力;具有较高自尊水平的人往往会在面对压力时表现出更好的应对能力,而且这些个体通常没有心理健康病史。为此,自尊心的提升可能是降低压力和心理问题的重要方式;针对有心理健康病史和高焦虑水平的学生,可以设计心理干预治疗方案,例如表扬、保证、鼓励、合理化和重构[10],降低焦虑和压力水平。
2)严重高血压往往伴随严重的健康问题,如呼吸困难和睡眠质量差,这种生理上的不适可能加剧个体的压力感,形成恶性循环,高血压本身就可能导致身体机能的下降,进而影响心理状态。建议提供心理健康教育和干预,以帮助学生应对压力,尤其是在经历生理健康问题时。
3)居住环境的恶劣直接影响个体的心理状态:狭小、卫生条件差或缺乏必要设施的居住环境,容易导致学生感到压抑和不安,这会增加学生心理负担;学生生活在高犯罪率或不安全的环境中,会造成持续的恐惧感和焦虑,这种不安全感会导致学生处于高压状态。相反,在良好的居住条件下,个体更容易感受到满足和幸福,心理上更为稳定,良好的环境能够促进个体的健康心理状态,表现为无压力的状态。
4)当学生的成绩低于预期时,可能会面临来自家庭、学校和自身的巨大压力;对未来职业的担忧往往会使学生感受到压力。相反,学生在学业上相对稳定,并且对未来有一定的信心,极大地缓解了学生压力,从而促进学习和发展。
5)课外活动虽然可以提升技能和自信,但过多的课外负担或者缺少足够的支持,反而会导致焦虑和压力增加;霸凌使学生感到孤立无援,加上缺乏社会支持使得他们在面对这些困扰时更加无力,加重心理负担。当在无霸凌和经历霸凌较轻的情况下,学生处于无压力状态。这表明在某些情况下,学生能够较好地应对相对轻度的霸凌行为。由此,学校和家庭应该加强对学生的支持,提供情感上的关怀和实际的帮助,以应对课外活动和霸凌问题带来的压力。
4" 结" 论
降低学生压力有利于维护学生的心理健康,提高学生对生活和学习的热情,促进学生个性发展、全面发展。本文基于Apriori算法探究了包括学生压力在内的与学生压力相关的多方面因素之间的关联性,通过研究结果可以挖掘出导致学生沉重压力的重要原因,对研究学生压力的心理健康教育部门提供了有效的参考。
参考文献:
[1] 徐晨欣.创造性应对方式对学业情绪和学业压力的影响:机制探讨与干预研究 [D].上海:华东师范大学,2023.
[2] 吴萌.一种Apriori算法在监狱警察心理健康调查中的应用 [J].兵工自动化,2024,43(9):24-27.
[3] 刘统青.基于Apriori算法的中小学生心理问题数据挖掘研究 [D].济南:齐鲁工业大学,2023.
[4] WANG Z C ,XUE L X. A Fast Algorithm for Mining Association Rules in Image [C]//2014 IEEE 5th International Conference on Software Engineering and Service Science.Beijing:IEEE,2014:513-516.
[5] 付春璐.职高生负性生活事件与自我效能感的关系研究:数据挖掘技术的应用 [D].贵阳:贵州师范大学,2024.
[6] 孙洪涛,张明元.症状自评量表(SCL—90)测评结果的研究报告——黑河市第一人民医院部分在职职工心理测评结果研究 [J].黑河学刊,2014(6):141-144.
[7] 孙伟平.决策树技术在大学生心理健康测评中的应用研究 [D].郑州:郑州大学,2020.
[8] 荣利,刘彬,高发亮.新时代高校学生心理健康教育的难点与对策 [J].科教导刊,2024(10):140-142.
[9] 崔妍,包志强.关联规则挖掘综述 [J].计算机应用研究,2016,33(2):330-334.
[10] 张波,季鑫.基于支持性心理治疗理论的学生疫情心理干预 [J].中学政治教学参考,2020(12):29-30.
作者简介:申悦(2004—),女,汉族,河南南阳人,本科在读,研究方向:数据科学与大数据技术;张一涵(2004—),女,汉族,河南周口人,本科在读,研究方向:数据科学与大数据技术;王弯弯(1992—),女,汉族,河南郑州人,高级工程师,讲师,硕士,研究方向:数据挖掘、计算机视觉。