基于学科知识图谱的个性化学习路径推荐策略

known 发布于 2025-08-25 阅读(232)

摘 要:为解决海量学习资源所带来的“认知过载”和“学习迷航”等问题,针对学习者的个体特征和学习需求,同时考虑知识点之间的逻辑关系,文章将学科知识图谱融入学习路径推荐模型。首先构建了学科知识图谱,然后结合学习者认知特征进行知识点路径规划,最后基于知识点序列和学习者模型对关联资源进行排序过滤,得到学习资源的序列集合。实验结果表明,相对于现有经典模型,所提出的方法具有良好的推荐效用。文章的研究成果为学科教育领域个性化学习路径推荐的理论研究和技术实现提供了重要参考。

关键词:学科知识图谱;资源推荐;学习路径;个性化推荐

中图分类号:TP391 文献标识码:A 文章编号:2096-4706(2024)20-0117-06

Personalized Learning Path Recommendation Strategy Based on Subject Knowledge Graph

DONG Miao

(Shanghai Xingjian College, Shanghai 200072, China)

Abstract: In order to solve the problems of “cognitive overload” and “learning trek” brought by mass learning resources, aiming at the learners personalized features and learning needs and considering the logical relationship between knowledge points, this paper integrates the subject knowledge graph into the learning path recommendation model. Firstly, a subject knowledge graph is constructed, followed by knowledge point path planning based on learner cognitive characteristics. Finally, the related resources are sorted and filtered based on knowledge point sequences and learner models to obtain a sequence set of learning resources. The experimental results show that the proposed method has good recommendation effectiveness compared to existing classical models. The research results of this paper provide important references for the theoretical research and technical implementation of personalized learning path recommendation in the field of subject education.

Keywords: subject knowledge graph; resource recommendation; learning path; personalized recommendation

0 引 言

近年来随着大数据、人工智能等技术的迅速发展,知识图谱作为热点技术逐渐被应用到智能检索、资源推荐、知识问答系统等各个领域。国务院在《新一代人工智能发展规划》中明确指出:“要重点突破知识图谱构建与学习、知识演化与推理等技术,要实现智能教育,建立以学习者为中心的教育环境”[1-2]。以学习者为中心的个性化教育模式需要根据学习者的认知状态、学习目标以及个体特征等提供最适合的学习资源和学习路径,学科知识图谱作为融合全面的知识技能点与教学资源的知识库,可以根据学科知识体系和技能培养目标对知识技能点进行细化并建立之间的关联关系,从而应用于学科资源的智能组织、个性化教学的实施、教学设计与评价等,推动个性化教育环境的创新发展[3]。目前有研究注重于利用本体技术和知识图谱来建模领域知识[4],有学者利用深度学习检索学科知识库,构建交互式智能问答模块,精准回答用户问题[5]。本文在此基础上研究将学科知识图谱的构建和路径生成算法的设计结合起来,为学习者的在线学习提供指导。

1 学科知识图谱的构建

1.1 构建思路

知识图谱的构建过程,可以理解为以资源描述框架(Resource Description Framework, RDF)三元组表征的关系数据的抽取和完善过程[6]。本文学科知识图谱的构建融合了人工与自动的方法,同时结合了自顶而下和自底而上的方式。如图1所示,首先依据教育部设立的学科专业目录、各教指委发布的专业教学标准等,针对不同的学科专业培养规格,提炼其核心工作领域对应典型工作任务与职业能力要求,构建基于工作过程的课程系统,明确专业核心课程主要教学内容与要求,形成学科知识体系逻辑框架。在此基础上定义专业核心课程知识图谱的实体类、属性类和关系类,自顶而下的完成本体结构的构建,这个过程需要学科领域专家参与。其次,运用知识抽取、知识融合等技术,采用自底而上的方式将多源异构数据变为结构化的知识三元组[7],形成具体实例数据层。最后,将知识存储在图数据库中实现学科知识图谱的构建。在后续使用过程中对知识图谱的更新方面多为对数据层的更新,而本体结构相对稳定不会频繁更新。

1.2 学科本体构建

本体的主要作用是使用形式化的描述语言提供一个共享的、一致的语义模型用于定义和组织领域内的概念、属性和关系,作为后续知识抽取的指导[8]。构建高质量的学科知识本体是构建完备、准确的学科知识图谱的先决条件,学科知识图谱对数据质量的要求极为严格,在构建过程中注重一致性和标准化、可扩展性和可更新性、知识质量和可验证性[9]。本文采用手动构建的方式,在学科领域专家的指导下定义实体类型、属性和实体间关系的类型,其中部分实体类型如图2所示。

1.3 学科知识抽取

知识图谱数据来源包括教学文本、视频、音频等半结构化与非结构化数据,分为实体抽取和关系抽取两个环节。实体抽取是从学科数据中将与主题相关的知识点、技能点提取出来,然后对实体之间的关系进行挖掘,形成“实体-关系-实体”的三元组表示形式的过程[10]。

专业教学计划中包含若干课程,课程之间存在先修后继的关系,课程中存在若干不同类型的教学资源,而教学资源是为了讲解知识技能点,知识点之间存在包含、并列、同义、前驱后继等关系,本文中根据实际需要定义了实体之间的关系类型,部分关系定义如表1所示。

1.4 学科知识融合与存储

知识融合的总体任务是计算实体间的相似度,把相似度在一定阈值内的实体划定为同一实体。通过BERT模型进行数据分类和清洗过滤,使用Word2Vec通过词之间的距离来判断它们之间的语义相似度,完成实体的对齐。最后使用Cypher语言将经过信息抽取和知识融合获得的三元组知识持久化存储在非关系型图数据库Neo4j中,生成结构化知识语义网络,有助于后续各项功能的实现和性能的优化。

本文以软件工程专业培养方案、核心工作领域、专业课程标准为主要数据来源,网络学习平台资源作为补充辅助数据来源构建学科知识图谱。经过本体构建、知识抽取、知识融合后存储在Neo4j图数据库中,如图3所示。

2 个性化学习路径推荐方法设计

学习路径是学习者在学习过程中选择或被选择的一系列学习资源的序列集合[11-12]。学习路径推荐的过程就是将学习者的认知水平等特征映射到知识图谱中作为路径规划的起点,将学习目标作为路径规划的终点,结合知识图谱中知识点之间的关系生成所有待排序的知识点集合;再通过路径规划得到最优的知识点学习路径;最后基于学习者模型对关联资源进行排序过滤,最终得到学习资源的序列集合,如图4所示。

具体内容如下:

1)学习者模型构建阶段。抽取系统中学习者的基本信息和学习行为数据,基于学习者的认知水平构建三维度的学习者模型。

2)生成待学习知识点集合。依据学习者的基本信息获取所在专业的核心工作领域知识、技能要求,以及专业人才培养知识、技能目标。基于学习者的目标/需求和认知水平得到待排序的知识技能点集合。

3)知识点路径规划阶段。知识点学习路径规划问题可以看作是一个有向图的遍历问题,约束条件为学习路径上各知识点次序的合理性,最终找到最优路径使学习者完成学习路径上所有知识点的学习。

4)学习资源推荐阶段。学习资源由一个或多个知识点组合而成,并且具有不同的表达方式属性特征。基于生成的知识点学习序列,按照重要度由高到低、难易度由易到难、学习者兴趣度由大到小的原则进行学习资源推荐。

3 学习者模型的构建

学习者模型可以通过多种方式构建,其目的在于真实的反映学习者特征,如知识与技能目标、偏好与认知水平等,并将其转换为可以被计算机所理解的数据,以此为基础服务于上层应用实践。本文从学习者的基本属性、学习风格和认知水平三方面构建学习者模型,如图5所示。

定义学习者S,将学习者模型表示为:S =(B(S),P(S),C(S)),其中B(S)表示学习者的基本属性,基本属性是对于学习者姓名、所在专业、年级等一些基本性质的描述,考虑学习者在学习过程中所带有的群体倾向性,对这一阶段的学习者进行共性分析,用于形成基本学习路径框架;提炼学习者学习过程大数据,分析学习者学习方式偏好和认知特点等学习风格特征。根据Kolb的学习风格理论,学习风格可以分为具体经验型、反思观察型、抽象概念型和积极实验型四种类型,同一个个体可能有多种学习风格的倾向[13]。将学习者S的学习风格表示为P(S)={CE,RO,AC,AE},CE、RO、AC、AE分别表示学习者S属于四种学习风格的倾向程度;提取学习者学习结果大数据,精确分析学习者基础知识的掌握程度,用于形成个性化的学习资源推荐。使用C(S)={cii∈[1,N]}对学习者S在学科领域内N个知识技能点上的认知水平进行定量表示,其值在学习过程中依据学习者前测、学习行为数据等方面计算获得,使用0到1的连续值区分不同水平的认知。

4 知识点路径的生成

本阶段的目标是对待排序知识点进行序化,以确保学习者在学习某一知识点前以掌握其全部先验知识点,并将知识点按照重要度由高到低的原则排列,使整体学习成本最低。

4.1 知识点学习路径规划数学模型

将本问题的目标函数定义为知识点路径连接度(Knowledge Path Connectivity,KPC)。

(1)

其中,X表示知识点学习路径选择矩阵,并设 ;DK表示知识点关系矩阵,矩阵元素dij表示知识点ki和kj之间的连接度,其值定义为:

(2)

知识点ki到kj的最短路径距离ShortestPath(ki,kj),距离越短两个知识点的连接越紧密。如果两个知识点从属于同一知识面,则认为两个知识点之间不存在先后顺序[14],将它们的最短路径距离设置1;如果两个知识点之间不存在路径或两个知识点是同义关系,则将其最短路径赋值为惩罚参数。公式定义如下:

(3)

知识点的度Degreeki=inki+outki,其中inki表示知识点ki的入度,outki表示知识点ki的出度,度越高表示该知识点在图谱中越重要。

4.2 知识点学习路径规划数学模型求解

知识点学习路径的求解步骤如下:首先根据学习者模型中的认知水平,在学科知识图谱中标记已掌握的知识点集合作为路径起点,将目标知识点作为路径终点,将起点和终点集合间存在联通路径的知识点加入解空间,算法在解空间中搜索最优路径。

本文采用粒子群优化算法(PSO)进行最优路径的求解,微粒群的每个粒子代表一个n维的学习路径。算法流程如下:

1)初始化种群中各微粒的速度和位置。

2)将知识点学习路径规划问题的目标函数作为适应度函数,根据当前位置计算适应度值fitness(各路径的长度)。记录每个微粒的最佳位置pbest和fitness,并从种群中选择fitness最佳粒子位置作为种群的位置gbest。

3)更新微粒的速度和位置。

4)计算位置更新后每个微粒的fitness,更新个体极值位置pbest。

5)根据各个粒子的fitness与之前gbest所对应的fitness比较,找出全局极值位置gbest。

6)若达到迭代次数或出现退化行为,则停止迭代;否则返回3)。

7)输出目前最优解作为知识点学习序列pathk={kp1,kp2,…,kpm}。

5 学习资源的推荐

5.1 学习资源的序化

本阶段的目标是对学习资源进行序化,利用已产生的知识点学习路径、学习资源与知识点的包含关系、学习资源的属性特征等,使学习资源以知识点序列为基础,按照重要度由高到低、难易度由易到难、学习者兴趣度由大到小的原则排列,使整体学习成本最低。

1)学习资源涵盖知识点与学习者学习路径上待学习知识点的差异:

(4)

其中,Ckq表示第k个学习者对第q个知识点的掌握度,此指标由前测确定;RCnq表示第n个学习资源对第q个知识点的涵盖度;IDq表示第q个知识点在知识点学习路径序列中的位序,Xnk为决策变量。

2)学习者的学习风格与学习资源类型的差异:

(5)

其中,STp表示第k个学习者与第p个学习风格类型的匹配度,;RSnp表示第n个学习资源与第p个呈现方式类型的匹配度, 。

3)学习者能力水平与学习资源难度水平的差异:

(6)

其中,Tk表示第k个学习者的认知水平,Dn表示第n个学习资源的难度水平。

5.2 推荐流程

对RKF、RTP、RDP进行加权融合得到学习者与学习资源的连接度Conn(S,R)=wRKF·RKF+wRTP·RTP+wRDP·RDP,其中wRKF、wRTP、wRDP为权重指标,wRKF+wRTP+wRDP=1。取连接度最高的N个学习资源推荐给用户。

6 实验与分析

6.1 实验环境与数据集

本文实验环境为64位Windows11操作系统,使用Python实现所述算法。由于目前自建学科知识图谱中未有学习者交互数据,为了观测算法的有效性和可行性,本文选取与学科知识图谱存在一致数据结构的2021年发布的信息技术类专业大规模在线实践教学平台EduCoder的公开数据集MOOPer进行实验,该数据集分为知识图谱和交互数据两部分,知识图谱包含课程、知识点、实训等11类实体以及14类实体间关系;交互数据包含2 532 524条实践练习数据、21 606 390条系统反馈数据及15 054条用户讨论数据。其知识图谱结构如图6所示。

6.2 推荐效用的评价指标

本文采用五折交叉验证,将五次实验结果的平均值作为推荐效用的评价指标。针对Top-N推荐任务,为测试集中的学习者推荐前N个学习资源,选取查准率(Precision)和召回率(Recall)作为评价指标。计算公式如下:

(7)

其中,TP表示真正例,FN表示假反例,FP表示假正例,TN表示真反例。

6.3 实验过程与分析

为验证算法的有效性,对比协同过滤推荐算法(CFR)、RippleNet模型[15]与本文提出的基于知识图谱的个性化学习路径推荐算法(KGPR),在Top-N任务中从查准率和召回率指标角度衡量算法的有效性,实验结果如图7所示。

通过对比分析实验数据可知,KGPR在查准率和召回率评估指标上均取得最好的性能。CFR利用学习者-资源交互信息学习不同学习者之间的相似性,并向目标学习者推荐与其相似的学习者所喜欢的资源,但无法解决交互信息数据稀疏的问题;RippleNet模型从用户端出发,在知识图谱上使用嵌入传播机制,通过传播用户的潜在偏好来增强用户的表示,但RippleNet模型未考虑知识图谱中实体权重,从而未将推荐重点放在重要程度较高的实体上;KGPR在生成知识点序列时考虑了其重要度,突出了推荐的重点,增加了推荐的准确性,从而使得推荐系统的性能得到了提升。

7 结 论

学科知识图谱是将大数据、人工智能等技术应用于教学活动的重要体现,以学科知识为核心建立语义网络,利用用户画像等技术实现对用户精准的学情研判,进而进行个性化、精准化的学习路径规划和学习资源推荐。本文梳理了学科知识图谱的构建流程,包括学科本体构建、学科知识抽取、学科知识融合与存储,并提出了基于知识图谱的个性化学习路径推荐算法(KGPR),将学习者的认知水平等特征映射到知识图谱中作为路径规划的起点,将学习目标作为路径规划的终点,通过路径规划得到最优的知识点学习路径;然后基于学习者模型对关联资源进行排序过滤,最终得到学习资源的序列集合。采用五折交叉验证,使用查准率、召回率验证了算法的推荐效用。但是学科知识图谱存在构建的复杂性、知识的专业性和数据量的依赖性等问题,提供个性化服务时需要捕捉学习者自身知识体系的动态演进并优化大数据量处理效率。在后续工作中将进一步完善学科知识图谱的构建,融入学习者行为等数据,优化推荐算法以提升学习资源推荐性能。

参考文献:

[1] 国务院.国务院关于印发新一代人工智能发展规划的通知 [J].中华人民共和国国务院公报,2017(22):7-21.

[2] 董晓晓,顾恒年,周东岱.知识图谱新近研究进展及其在教育领域的应用挑战 [J].数字教育,2022,8(5):10-17.

[3] 赵宇博,张丽萍,闫盛,等.个性化学习中学科知识图谱构建与应用综述 [J].计算机工程与应用,2023,59(10):1-21.

[4] 王志立,李鑫路,梅林常,等.基于NLP技术的知识图谱关系型数据AI抽取方法 [J].信息技术,2023(11):132-137.

[5] 曹莉,赵营颖,朱红磊.基于深度学习的交互式在线教学资源管理平台 [J].信息技术,2023,47(2):24-29.

[6] 林健,柯清超,黄正华,等.学科知识图谱的动态生成及其在资源智能组织中的应用 [J].远程教育杂志,2022,40(4):23-34.

[7] 穆肃,谭梓淇,骆珏秀,等.面向精准教研的立体知识图谱构建方法研究 [J].电化教育研究,2023,44(5):74-81.

[8] 张栩翔,汤玉祺,赵文,等.基于知识图谱和图嵌入的个性化学习资源推荐 [J].计算机系统应用,2023,32(5):180-187.

[9] 孙雨生,彭梦媛,刘涛.学科知识图谱及其构建机理 [J].科技管理研究,2022,42(20):157-162.

[10] 李春英,武毓琦,汤志康,等.融合知识图谱的学习者个性化学习资源推荐 [J].小型微型计算机系统,2024,45(2):285-292.

[11] 高嘉骐,刘千慧,黄文彬.基于知识图谱的学习路径自动生成研究 [J].现代教育技术,2021,31(7):88-96.

[12] 钟卓.人工智能支持下的智慧学习模型构建及应用研究 [D].长春:东北师范大学,2023.

[13] 李浩君,杨琳,张鹏威.基于多目标优化策略的在线学习资源推荐方法 [J].模式识别与人工智能,2019,32(4):306-316.

[14] 张迪.基于知识图谱的教学资源推荐方法研究 [D].武汉:华中师范大学,2019.

[15] WANG H W,ZHANG F Z,WANG J L,et al. RippleNet: Propagating User Preferences on the Knowledge Graph for Recommender Systems [C]//Proceedings of the 27th ACM International Conference on Information and Knowledge Management.New York:ACM,2018:417-426.

作者简介:东苗(1985—),女,汉族,河南平顶山人,副教授,硕士,研究方向:模式识别、智能系统。

标签:  学习者 

免责声明

本文来自网络,不代表本站立场。如有不愿意被转载的情况,请联系我们。

iidomino cuppor