摘 要:以构建《建设工程质量检测员国家职业技能标准》的知识图谱为主要研究内容,文章介绍了《建设工程质量检测员国家职业技能标准》对于教育和检测行业发展的重要性,讨论了在当前数字化转型过程中底层知识的必要性,说明知识图谱在实际工作中的作用。在此基础上,采用专家自顶向下的方法构建了知识图谱,并根据标准内容确定了概念之间的关系和属性类型。以“建设工程质量检测员”为核心概念,扩展了标准中的相关概念。最后,将知识图谱载入第三方平台进行测试,通过SPARQL查询获得了相应的结果,同时也验证了不同领域知识图谱的关联性。
关键词:国家标准;知识图谱;资源描述框架;三元组
中图分类号:TP391.1 文献标识码:A 文章编号:2096-4706(2025)02-0079-05
Construction and Application of Knowledge Graph of National Vocational Skill Standard for Construction Engineering Quality Inspectors
WANG Haiyuan1,2, LI Jianmin1,2, ZHANG Feng1,2, FENG Zelong1,2, ZHANG Shen1,2
(1.China Academy of Building Research Co., Ltd., Beijing 100013, China;
2.CABR Testing Center Co., Ltd., Beijing 100013, China)
Abstract: Taking the construction of the Knowledge Graph of National Vocational Skill Standard for Construction Engineering Quality Inspectors as the main research content, this paper introduces the importance of National Vocational Skill Standard for Construction Engineering Quality Inspectors for the development of the education and inspection industries, discusses the importance of underlying knowledge in the current digital transformation process, and illustrates the role of the Knowledge Graph in practical work. On this basis, the Knowledge Graph is constructed using the expert top-down method, and the relationship between concepts and attribute types are determined according to the standard content. With “construction engineering quality inspector” as the core concept, it expands the related concepts in the standard. Finally, the Knowledge Graph is loaded into the third-party platform for testing, and corresponding results are obtained through SPARQL queries. Meanwhile, the relevance of Knowledge Graphs in different fields is also verified.
Keywords: national standard; Knowledge Graph; resource description framework; triple
DOI:10.19850/j.cnki.2096-4706.2025.02.014
0 引 言
建设工程质量检测员是建设工程检测的执行者,是确保建筑工程质量的关键一环,人员素质的提高对于促进行业的发展至关重要。2023年3月31日,住房和城乡建设部发布了《建设工程质量检测机构资质标准》中,对建设工程检测机构中的主要人员提出了明确技术要求[1]。为贯彻落实《国务院关于推行终身职业技能培训制度的意见》提出的“紧跟新技术、新职业发展变化,建立职业分类动态调整机制,加快职业标准开发工作”要求,人力资源社会保障部于2022年7月11日向社会发布《中华人民共和国职业分类大典》公示稿,其中,新增“建设工程质量检测员”新职业,明确了行业中从业人员定位[2]。2023年9月1日,人力资源社会保障部面向社会公开征求66个国家职业标准意见,其中包括《建设工程质量检测员国家职业标准》(征求意见稿)(以下简称:《标准》)[3]。该职业标准规定了建设工程质量检测员应具备的基本职业技能要求、基础理论知识、专业知识、安全环保知识、质量管理知识和法律法规知识等,并对相关的从业人员制定了4级的技能等级,建议了相应的学习时长和学习内容。然而作为指导专业技术人员的水平鉴定标准,《标准》涉及建设工程相关行业基础知识、检测行业相关规范、仪器仪表使用以及现场规定,等等。而且《标准》中涉及的概念相互引用形式多样,对于参考《标准》的人员来说难以理解其中的关系。同时,随着各行业的数字化转型,各行业都在建设相应的数字化平台和开发应用程序,领域知识间的互相交叉应用成为一种新的趋势。不同领域的知识在数字化平台上得以汇聚和融合,为各行业带来了更广阔的创新空间。各种数字化应用底层的知识共享也成为一个难题。由于各领域的知识体系和结构不尽相同,如何有效地整合和共享这些知识成为一个挑战。知识图谱(Knowledge Graph)技术是解决知识共享的技术手段之一。本研究针对《标准》涉及内容庞杂、覆盖范围等特点,提出《建设工程质量检测员国家职业技能标准》知识图谱(简称:检测员知识图谱)的构建方法,将标准文件转换化为以资源描述框架(Resource Description Framework, RDF)为表达形式的知识图谱,实现《标准》中涉及相关领域知识的相互关联,帮助用户更全面的理解该职业标准,使得对人员的培训更全面、考核更加规范[4],也为行业应用程序的开发提供知识支撑,提高行业数字化、智能化水平。
1 标准数字化与知识图谱
当前各种数据和知识爆炸式增长,各行各业源源不断地产生各种场景、应用以及由此产生的数据。标准作为国家、行业或区域内针对特定领域的指导性文件,在对数据的分析、归类、优化方面起到关键作用,也在不同应用系统中起到底层知识逻辑和认知基础的作用。加快推动标准的数字化、网络化、智能化和知识化转型已逐渐成为标准领域的共识[5]。然而国家标准覆盖内容广泛、涉及环节多样,并且会与其他标准相互引用,普通人难以理清其中的关系,阅读起来非常困难[6]。在对标准进行应用过程中,开发人员往往需要额外的工作对标准进行数字化,形成结构化的文档。大数据背景下,越来越多的具体场景要求将应用涉及的多专业知识标准进行融合,融合成人类可理解、机器可表征与可推理的知识库[7]。知识图谱技术就是采用语义技术形式化表达的系统化、结构化、集成化的特定领域知识[8],是当前人工智能领域研究的热点,其核心包括实体、关系、属性等。实体是知识图谱中的基本单元,表示现实世界中的事物或概念;关系描述了实体之间的联系;属性则是对关系的进一步描述和补充。知识图谱在知识组织方面具有极大优势,主要用于从类型不同的庞杂数据中抽取实体、实体间的关系以及实体的属性,然后将三者通过图结构的数据模型或拓扑进行整合,从而将抽象零散的知识进行清晰的可视化展示[9]。采用知识图谱技术对标准构建领域知识图谱,可以整合多源标准知识,对于指定的信息给予精确查询和关联标准的链接呈现,提高检索的准确性和效率。同时,知识图谱将文档层次的粗粒度知识拆分为细粒度的切片化知识,更有益于针对行业标准体系的构建与完善[10]。
标准文件作为针对特定内容进行标准化说明的文字,内容涉及的知识领域性强,专业术语多,而且行文结构较规范、标题层级清晰[11]。《标准》为指导建设工程质量检测员业务能力考核认定的技能标准,涉及多个关联领域知识,具体领域知识如表1所示。《标准》中仅对职业和技能相关的专业术语进行了定义或说明,应用过程中涉及的大量的建设工程检测术语就需要人工解读。而进行数字化的过程中,就可以通过知识图谱中实体链接扩展其他领域知识图谱,实现跨行业的知识融合。
2 知识图谱构建
知识图谱的构建目前主要有自动化、专家构建和半自动化三种方法。自动化的方法是指采用基于机器学习和自然语言处理等人工智能的方法,在提供的语料数据中进行实体(概念)识别、属性识别和关系抽取等操作,将非结构化的数据转换为结构化的数据,形成三元组的表达形式,多用于海量数据、内容繁杂且架构不清晰的公共领域通用知识图谱,一般表现为自底向上的构建方法。专家构建主要是依托领域专家人工构建知识体系,逐步补充概念、属性,建立实体间的联系,多用于数据相对集中、知识结构相对确定的垂直领域行业知识图谱,一般表现为自顶向下的构建方法。半自动化的方法介于以上二者之间,前期专家人工搭建概念框架,建立基本关系链接,之后在利用人工智能的方法进行实体识别、关系抽取和属性提取,自动化填充知识图谱内容。本文中,由于《标准》文本相较于其他文本有较为规范的文本格式,且文本量相对较少,同时也需要对《标准》条款有专业、准确的理解,因此采用领域专家构建的方法[12]。
2.1 《标准》的内容结构
《标准》作为建设工程质量检测领域中第一部评价相关从业人员的技能等级标准,其内容涵盖了职业概况、基本要求、工作要求、鉴定要求等多个领域知识,内容结构如图1所示。
从图1中可以看出,《标准》作为指导专业领域内从业人员的技能评定的标准,其具有领域范围广、专业术语多、内容关联复杂等特点。而知识图谱作为多领域知识进行融合的技术手段,在实现该技能标准的数字化过程中具有得天独厚的优势,可以有效地将标准中分散的知识点进行整合和关联,使标准更易于被机器理解和嵌入到各种应用程序、平台的场景当中。
2.2 知识图谱的构建方法
本研究中检测员知识图谱构建方法采用专家自顶向下的方法构建,如图2所示,主要步骤如下:
1)首先是要确定知识图谱的领域范围,限定概念、属性涉及的知识范围。
2)专家罗列出《标准》中涉及的主要专业术语以及含义。
3)组织概念形成层级结构,建立分类体系。
4)为每个类别建立描述概念特征的属性。
5)通过属性关联各个不同的概念,建立实体间相互链接的关系。
6)专家对知识图谱进行评价,不满足要求回到步骤1)进行迭代、更新。
7)在应用中对知识图谱进行更新。
2.3 知识图谱结构
本研究构建的知识图谱结构中的部分概念和关系如图3所示,图中用椭圆表示知识图谱中的一个实体,有向箭头表示属性,方框表示数值或文本型的属性值,采用vs来表示当前知识图谱的命名空间。由于目前各知识图谱工具对于中文支持会出现各种问题,如乱码和无法正常简析等,在RDF中实体和属性的url仍然采用英文,实体通过属性rdfs:label表明具体的中文含义。图3中,以“建设工程质量检测员”为核心概念定义了知识图谱的主要实体,依据《标准》的章节内容,扩展了名称、定义、鉴定要求等多个实体[13]。《标准》作为《国家职业技能标准》中的一个职业标准,属于《国家职业技能标准》的一个子类,采用属性rdfs:subClassof关联两个概念。实体与实体间通过对象属性(object property)关联,实体与数值或文本通过数据属性(data property)关联。如用对象属性vs:hasRequirement建立实体“建设工程质量检测员”和“鉴定要求”两者间的关系,实体“建设工程质量检测员”又通过数据属性vs:hasCode和rdfs:label明确了职业代码和中文名称。
《标准》中有不少概念和关系都是前后相互引用或者与其他标准相互引用,这就需要将来自不同知识图谱中不同表达形式的概念进行对齐、消歧,保证相同的概念指向的是同一实体。其中有一些外延概念,如学科、专业、仪器设备等,在《标准》中没有明确的定义或解释,在本研究中,将这些概念与其他知识图谱中的概念进行关联[14],起到概念解释和说明的作用。当前版本中,检测员知识图谱关联有三类外部知识图谱,分别为:仪器设备知识图谱、检测技术规范知识图谱和学科专业知识图谱。例如:通过vs:hasRelatedMajor属性将学科专业本体中“土建工程”专业的概念链接到本检测员知识图谱中,这样就建立了专业与其外部扩展解释间的链接关系[15]。
3 测试及结果
构建完成的知识图谱结构化三元组RDF采用N-Triples的形式进行存储,数据片段如图4所示。在将知识图谱应用于到具体项目前,可以将其载入到GraphDb中进行测试,一方面可以检测知识图谱的语法、格式是否有错误;另一方面也可以在脱离应用场景下测试,做到数据和应用逻辑的分离。GraphDB是一个开源的企业图形数据存储引擎,对于非商业目的可以免费下载,但如果用于商业目的则需要购买商业许可。
数据载入GraphDb后,既可以通过数据端口进行数据管理和查询操作,也可以利用GraphDb自带的图形化界面进行操作。GraphDb启动后,在默写设置下使用浏览器输入http://localhost:7200就可以进入GraphDb的图形化操作界面。
为了测试知识图谱是否构建完整、准确,需要对相应的知识内容进行测试。
应用举例:成为鉴定场所至少需要几台低应变动测仪?
这个问题涉及《标准》1.9.5鉴定场所设备章节,内容涉及仪器和模型的5个分类。将该问句转换为Sparql语义查询语句及查询结果如图5所示。查询结果显示至少需要5台低应变动测仪,而且这些设备属于岩土类检测仪器设备。
由于在构建《标准》的知识图谱时,本检测员知识图谱中“低应变动测仪”通过owl:equivalentClass与仪器设备知识图谱中“低应变基桩动测仪”建立了等价类的关联。“低应变基桩动测仪”在仪器设备本体是“岩土类检测仪器设备”的一个子类,而“岩土类检测仪器设备”是“检测仪器设备”的一个子类,所以通过逻辑推理就可以从关联的知识模型中获取相关的知识。
在这样的多学科交叉应用的项目中,各个领域的知识图谱往往都有相应的专业团队负责。各个领域知识的更新和维护都不会同步,因此,采用知识图谱进行领域间知识的融合就提供了相对方便的数据维护方法。仪器设备本体进行相应的更新,在“岩土类检测仪器设备”和“低应变基桩动测仪”中新加一级“基桩动测仪”,检测员知识图谱中只需重新进行一次数字载入和推理操作即可,相应程序代码及检测员标准本体不需要进行改变。检测员知识图谱在应用中也并非一成不变。随着时间的推移,新的知识和信息不断涌现、职业标准版本的更新,而旧的知识可能会过时或被修正。为了保持应用的有效性和用户满意度,就必须不断地对知识图谱进行迭代更新。这需要定期检查和更新图谱中的数据、信息和链接,以确保其准确性和完整性。通过持续的迭代更新,确保知识图谱始终与现实世界保持同步,为用户提供最新、最准确的信息和服务。
国务院印发的《新一代人工智能发展规划》中指出“形成涵盖数十亿实体规模的多源、多学科和多数据类型的跨媒体知识图谱”[16],从而实现对知识持续增量的自动获取。知识图谱作为融合各学科、各行业知识的技术手段之一,在越来越多的行业数字化转型的底层起到支持作用。《标准》作为跨越教育和建设工程检测行业的人员业务水平认定标准,存在多学科、多行业相互融合的问题,本研究构建的检测员知识图谱,可以作为职业教育、人员考核以及技术培训等应用的基础知识模型,为职业教育数字化转型及应用平台的智能化提供支撑[17]。未来将实现更多元化的数据,实现多领域数据融合,推动行业从业人员的教育、培训和考核等相关应用和平台的数字化和智能化发展[18]。
4 结 论
本文深入探讨了《建设工程质量检测员国家职业技能标准》知识图谱的构建及其应用,强调了其在教育和检测行业中的核心地位。在数字化转型的背景下,本文采用专家自顶向下的方法,成功构建了以“建设工程质量检测员”为核心的知识图谱,精确定义了概念间的关系和属性,实现了这些概念与其他领域知识图谱中概念的关联,并通过第三方平台测试验证了其有效性和跨领域关联性,能够为专业应用平台和软件提供有力支持。本研究不仅促进了相关领域的知识整合与共享,也为相关行业的知识管理与应用提供了新的思路与工具。
参考文献:
[1] 住房和城乡建设部.住房和城乡建设部关于印发《建设工程质量检测机构资质标准》的通知 [EB/OL].[2024-06-09].https://www.gov.cn/zhengce/zhengceku/2023-04/20/content_5752347.htm?ivk_sa=1023197a.
[2] 人力资源社会保障部,市场监管总局,统计局.人力资源社会保障部 市场监管总局 统计局关于颁布《中华人民共和国职业分类大典(2022年版)》的通知 [EB/OL].[2024-06-09].http://www.mohrss.gov.cn/SYrlzyhshbzb/rencairenshi/zcwj/RCDWJSzonghe/202211/t20221103_489285.html?eqid=ab8e1c280003b4a000000006642bd965amp;wd=amp;eqid=d6b0803800034a4b00000004645b564c.
[3] 人力资源社会保障部.人力资源社会保障部面向社会公开征求66个国家职业标准意见 [EB/OL].[2024-06-09].http://www.mohrss.gov.cn/wap/xw/rsxw/202309/t20230901_505566.html.
[4] 李东海,刘星,王鹏.人工智能赋能职业教育高质量发展的价值、挑战与创新路径[J].教育与职业,2023(4):13-20.
[5] 方思怡.标准知识图谱的技术路径与应用场景探讨 [J].中国标准化,2023(11):49-55.
[6] 秦丽,郝志刚,李国亮.国家食品安全标准图谱的构建及关联性分析 [J].计算机应用,2021,41(4):1005-1011.
[7] 郑庆华,刘欢,龚铁梁,等.大数据知识工程发展现状及展望 [J].中国工程科学,2023,25(2):208-220.
[8] 黄智生,缪崇,胡青,等.川崎病知识图谱构建研究 [J].中国数字医学,2018,13(9):28-31.
[9] 赵宇博,张丽萍,闫盛,等.个性化学习中学科知识图谱构建与应用综述 [J].计算机工程与应用,2023,59(10):1-21.
[10] 杨德相,李剑锋.基于知识图谱的标准知识管理研究 [J].标准科学,2023(4):39-45.
[11] 刘慧琳,牛力.标准文件的知识图谱组织模式探究 [J].档案学通讯,2021(5):58-65.
[12] 刘明鹏,王忠明,马文君.基于本体的造林树种知识图谱构建与应用 [J].北京林业大学学报,2023,45(8):109-122.
[13] 刘广宇,安芃,伍震,等.基于本体的公路工程安全领域知识建模和应用 [J].清华大学学报:自然科学版,2024,64(2):224-234.
[14] 李薇,肖仰华,汪卫.基于中文知识图谱的人物实体识别 [J].计算机工程,2017,43(3):225-231+240.
[15] 刘俊楠,刘海砚,陈晓慧,等.面向多源地理空间数据的知识图谱构建 [J].地球信息科学学报,2020,22(7):1476-1486.
[16] 国务院.国务院关于印发新一代人工智能发展规划的通知 [EB/OL].[2024-06-09].https://www.gov.cn/zhengce/content/2017-07/20/content_5211996.htm
[17] 金波,郑永进.高质量发展背景下职业教育数字化转型实现路径研究 [J].中国高教研究,2023(7):97-102.
[18] 廖帅,邓茜,黄海聪.我国教育信息化的研究热点与前沿趋势——基于CiteSpace的可视化知识图谱分析 [J].现代信息科技,2023,7(18):142-149.
作者简介:王海渊(1981—),男,汉族,山西朔州人,副研究员,博士,研究方向:人工智能、知识图谱、智能检测技术。
收稿日期:2024-06-08