摘" 要:以郁病辨证为例,开展动态不确定因果图在中医智能辅助辨证中的应用研究,提高中医智能辅助辨证模型中辨证知识的可视化程度和辨证推理过程的可解释性。对郁病权威文档进行整理分析、获取郁病辨证知识,采集郁病医案并进行筛选和数据预处理,构建郁病智能辅助辨证DUCG知识库,在知识库中表示症状知识和证型知识以及二者之间的关系,结合DUCG推理机进行辨证推理测试和分析。构建了包含19个子图的郁病智能辅助辨证DUCG知识库和包含6个子图的郁病智能辅助辨证DUCG核心知识库,辨证推理测试获得的初步准确率可达72.92%、按证型分组统计的准确率最高可达100%,可根据DUCG化简图对辨证结果进行详细解释。将动态不确定因果图理论应用于中医智能辅助辨证研究,有助于提高辨证模型中辨证知识的可视化程度和辨证推理过程的可解释性。
关键词:动态不确定因果图;郁病;智能辅助辨证;知识表示;辨证推理
中图分类号:TP391" 文献标识码:A" 文章编号:2096-4706(2024)09-0120-06
Research on the Application of Dynamical Uncertainty Causality Graph in Intelligent Assisted Syndrome Differentiation of Traditional Chinese Medicine
WEI Changfa1, LIU Dongbo1, LIU Huina2, WANG Linfeng1
(1.School of informatics, Hunan University of Chinese Medicine, Changsha" 410208, China;
2.Medical School, Hunan University of Chinese Medicine, Changshanbsp; 410208, China)
Abstract: Taking the syndrome differentiation of depression as an example, this paper carries out research on the application of DUCG in intelligent assisted syndrome differentiation of TCM, and improves the visualization degree of syndrome differentiation knowledge in the syndrome differentiation model and the interpretability of syndrome differentiation reasoning process in the intelligent assisted syndrome differentiation model of TCM. It organizes and analyzes authoritative documents on depression, acquires knowledge on syndrome differentiation of depression, and collects, screens and preprocesses medical records of depression. A DUCG knowledge base for depression intelligent assisted syndrome differentiation is constructed, in which the symptom knowledge, syndrome type knowledge and the relationship between them are expressed, and it combines DUCG inference machine to conduct testing and analysis of syndrome differentiation reasoning. It constructs a DUCG knowledge base for depression intelligent assisted syndrome differentiation containing 19 subgraphs and a DUCG core knowledge base for depression intelligent assisted syndrome differentiation containing 6 subgraphs. The preliminary accuracy obtained through testing of syndrome differentiation reasoning can reach 72.92%, and the highest accuracy achieved by grouping statistics according to syndrome types can reach 100%. The syndrome differentiation results can be explained in detail according to the DUCG diagram. Applying DUCG theory to the research of intelligent assisted syndrome differentiation of TCM can help improve the visualization of syndrome differentiation knowledge and the interpretability of syndrome differentiation reasoning process in syndrome differentiation models.
Keywords: Dynamical Uncertainty Causality Graph; depression; intelligent assisted syndrome differentiation; knowledge representation; syndrome differentiation reasoning
0" 引" 言
从1956年人工智能的概念被提出以来,其发展一直在不断地改变着人类社会生活、改变着世界。医学领域一直是人工智能研究应用的热点领域。我国的研究人员从20世纪70年代中后期就开展了中医专家系统的研发,核心内容之一是中医智能辅助辨证。中医智能辅助辨证,指的是在研究中医辨证论治规律的基础上,建立辨证过程的数字模型,通过计算机程序对患者病情资料进行分析判断,最终得出辨证结果[1]。
40多年来,以中医专家系统为代表的中医智能辅助诊疗相关系统虽然取得了很大发展,但是在临床上的应用还十分有限,主要的原因是中医学是复杂的系统科学,要合理、充分地模拟中医医生的诊疗过程并作出准确的诊疗决策是相当困难的,还有许多研究工作要深入开展。在中医智能辅助辨证研究过程中,许多知识表示与推理方法都曾经被采用,它们在辨证模型的准确率、辨证知识的可视化程度和辨证推理过程的可解释性等方面都存在各自的不足之处。因此,有必要探索新方法来开展中医智能辅助辨证研究。
1" 动态不确定因果图(DUCG)简介
动态不确定因果图(Dynamical Uncertainty Causality Graph, DUCG)理论是由张勤教授提出的一种用于处理不确定因果关系的理论模型,它以图形方式简洁表达任意情况下的不确定因果关系,并基于证据化简图形和展开事件,从而获得所关注假设事件及其状态概率表达式;DUCG具有允许知识表达不完备等优点,使其超越了贝叶斯网络理论框架[2]。由于DUCG能够处理不完备知识和不确定的证据信息,并能根据证据信息降低复杂度,因此对于规模庞大的复杂系统的诊断有着独特的优势[3]。
中医辨证论治是一个非常复杂而严密的系统工程,基于DUCG理论开展中医智能辅助辨证相关研究,对中医辨证过程中各种确定和不确定的知识进行表示,并以中医临床病例作为测试用例来进行辨证推理和分析,有助于提高模型中辨证知识的可视化程度和辨证推理过程的可解释性,对促进中医智能辅助诊断的发展具有重要的意义。
2" 基于DUCG的中医智能辅助辨证研究方案
目前,DUCG已经在核电、化工、航天、医疗等领域引起了广泛关注,相应的研究也取得了很多成果[4-7]。笔者所属的研究团队前期已经开展了一些将DUCG应用于中医药领域的探索工作[8-10],利用DUCG来开展中医智能辅助辨证值得深入研究。然而,要开展中医智能辅助辨证研究,首先需要获取辨证知识,并准备大量的配套医案以便建立智能辅助辨证模型并验证其准确率。鉴于中医学的复杂性,全面获取整个中医理论体系中的辨证知识是一项庞大的系统工程,因此我们从小处着手,以郁病辨证为例开展DUCG在中医智能辅助辨证中的应用研究。
我们以《中医内科常见病诊疗指南中医病证部分·郁病》(中华中医药学会2008年发布)等6份权威文档做为郁病辨证知识权威来源,对它们进行整理和分析,获取了19种郁病证型的分布数据,计算获得包含147个症状的郁病证型规范化症状集、19种郁病证型对应的症状子集、郁病辨证之症状知识(以“症状关注度”进行表示)、郁病辨证之证型知识(以辨证为某证型的概率进行表示)和证型症状关系知识(以“证型-症状”概率值进行表示)。从医案集、期刊论文数据库和医案数据库平台中采集郁病医案,筛选出了169例医案作为郁病智能辅助辨证配套医案,并完成医案数据预处理工作,为开展基于DUCG的郁病智能辅助辨证研究奠定了知识和数据基础。
根据DUCG理论和中医诊断学理论,我们确定了将DUCG应用到中医智能辅助辨证领域时各种DUCG变量的中医学意义,表1对这些变量的中医学意义进行了说明。
根据郁病辨证知识,确定了郁病DUCG辨证模型中的B变量(根原因事件变量)和X变量(结果事件变量),将郁病证型设置为B变量,将郁病症状设置为X变量。
本研究根据前期获取到的郁病辨证知识,设定各个B变量的异常状态概率参数;设定各个X变量的属性值和状态列表;将每个B变量和与其相关的各个X变量联系起来,设定它们之间的链接事件和条件链接事件的事件矩阵,构成DUCG子模块;最后,将所有的DUCG子模块合并成为完整的郁病智能辅助辨证DUCG知识库。
将前期进行郁病智能辅助辨证推理测试医案数据预处理时得到的医案症状作为证据提供给基于DUCG的郁病智能辅助辨证模型,该模型由DUCG推理机和郁病智能辅助辨证DUCG知识库组成。
DUCG推理机将根据证据和化简规则对郁病智能辅助辨证DUCG知识库进行化简。在化简过程中,与证据和待求变量无关的部分将被删除,从而缩小求解范围、减小推理计算量。根据化简结果求解B变量(郁病证型)的发生概率并进行排序,概率最大的B变量(郁病证型)即为郁病智能辅助辨证推理过程给出的最有可能的辨证结果,即根据输入的郁病症状,最有可能辨证为该郁病证型。根据该郁病证型的DUCG化简图,可以对基于DUCG的郁病智能辅助辨证模型生成的辨证推理结果进行解释。
最后,将基于DUCG的郁病智能辅助辨证模型生成的辨证推理结果与郁病智能辅助辨证配套医案的原始辨证结果进行对比分析,依据郁病辨证知识来调整DUCG模型相应的参数、修正优化郁病智能辅助辨证DUCG知识库,以进一步提高辨证准确率。
3" 构建中医智能辅助辨证DUCG知识库
根据上述基于DUCG理论开展中医智能辅助辨证研究的方案,我们开展了郁病辨证知识在DUCG知识库中的表示工作,最终构建了郁病智能辅助辨证DUCG知识库。
3.1" 症状知识在DUCG知识库中的表示
郁病症状在DUCG知识库中被设置为X变量,依据前期获取到的郁病辨证之症状知识来设置该变量的属性值和状态列表。根据郁病症状名称设置X变量的“变量描述”和“关键词”属性,将前期获取的症状关注度设置为X变量的“默认关注度”。状态列表中包含阳性和阴性两种状态,分别表示患者出现或不出现该症状。图1显示了郁病智能辅助辨证DUCG知识库中X变量“头痛”的信息编辑界面,其“默认关注度”属性的值为73。郁病智能辅助辨证DUCG知识库中一共创建了147个X变量,分别对应147个郁病症状。
3.2" 证型知识和证型症状关系知识的表示
3.2.1" 为证型设置B变量
郁病证型在DUCG知识库中被设置为B变量,依据前期获取到的郁病辨证之证型知识来设置该变量的异常状态概率参数。图2显示了郁病智能辅助辨证DUCG知识库中B变量“肝气郁结证”的信息编辑界面。从图中可以看出,状态列表中包含阳性和阴性两种状态,它们的概率值相加之和为1,其中的阳性概率值表示郁病病例辨证为当前证型的概率。
3.2.2" 为证型构建DUCG知识子图
根据前期获取到的郁病辨证知识,本研究一共创建了19个B变量(分别对应19种郁病证型),并为每个郁病证型分别构建DUCG知识子图,在该子图中设置每个B变量和与其相关的各个X变量之间的联系,这些联系体现为链接事件(如图3中的有向单实线)和条件链接事件(如图3中的有向单虚线);并设定了这些链接事件和条件链接事件的事件矩阵。
图3显示了郁病智能辅助辨证DUCG知识库中“肝气郁结证”子图,从该图中可以看出“肝气郁结证”被设置为B变量,而它的规范化症状子集中所包含的36个症状都被设置为X变量。单击选中“肝气郁结证”对应的BX变量(图中用◎画出的变量)与“胸闷”X变量之间的有向单实线之后,线条颜色会由红色变为蓝色,进而可以在如图4所示的“肝气郁结证”与“胸闷”之关系的参数设置界面中将值0.8填入事件矩阵单元格中,该值是前期获取的“证型-症状”概率值,表示当某个病例的辨证结果为“肝气郁结证”时,患者出现“胸闷”症状的概率。
3.2.3" 合并各证型知识子图为DUCG知识库总图
为19种郁病证型分别构建如图3所示的DUCG知识子图之后,即可在DUCG知识库编辑平台中将这19张子图编译合并为如图5所示的郁病智能辅助辨证DUCG知识库总图。
4" 辨证推理测试和结果分析
建立好郁病智能辅助辨证DUCG知识库之后,即可根据前期获得的可用于郁病智能辅助辨证推理测试的医案集来开展辨证推理测试。
4.1" 对单个医案进行智能辅助辨证推理测试
在DUCG知识库测试平台中逐一录入每个郁病医案的信息后,即可查看基于DUCG的郁病智能辅助辨证模型生成的辨证推理结果。图6展示了模型为第31号医案生成的辨证推理结果,从图中可以看出排序居第1位的是肝气郁结证,其概率为100%(辨证为其他证型的概率几乎为0),该辨证结果与第31号医案的原始辨证结果完全一致。
第31号医案共有15个郁病症状,即胸闷、心神不宁、胁胀、胁痛、肋痛、脘闷、脘腹不适、嗳气、纳呆、大便不调、舌质淡红、舌质淡、苔薄、苔腻和脉弦。将这些症状作为证据提供给基于DUCG的郁病智能辅助辨证模型,该模型由DUCG推理机和郁病智能辅助辨证DUCG知识库组成,DUCG推理机将根据证据和化简规则来对郁病智能辅助辨证DUCG知识库进行化简。
从图7所示的第31号医案对应的肝气郁结证DUCG化简图中可以看出,上述15个症状都以淡红色(浅色)框标示,除了舌质淡和脘腹不适这两个症状之外,另外13个症状都与“肝气郁结证”有关联,说明它们都包含在肝气郁结证的规范化症状子集中,它们是DUCG推理机接收到的阳性证据,为该医案被辨证为肝气郁结证作出了积极贡献。从图7中还可以看出,头痛、胸痛、痛无定处、易怒、嘈杂、吞酸、耳鸣、口苦、口干、大便溏、大便干结、大便时溏时干、大便秘结、闭经、精神抑郁、郁闷、烦躁、急躁、目赤、舌质红、苔黄、太息和脉数这23个症状都以绿色(深色)框标示,它们同样也与“肝气郁结证”有关联,说明它们都包含在肝气郁结证的规范化症状子集中,但是它们并没有出现在第31号医案的15个郁病症状之中,所以它们是DUCG推理机接收到的阴性证据,为该医案被辨证为肝气郁结证作出了消极贡献。
DUCG推理机会根据每一个阳性证据反向计算出对应证型的一个概率,根据图7中与“肝气郁结证”关联的13个用淡红色(浅色)框标示的症状,可以计算出13个概率,将这些概率相加以计算出肝气郁结证出现的总概率,再根据阴性证据(图7中用绿色(深色)框标示的症状)的连线值进行进一步计算。阴性证据在计算“肝气郁结证”的出现概率时具有消极意义,它们出现于肝气郁结证的DUCG子图中,故它们本来是可以导致肝气郁结证出现的,但是因为第31号医案中没有包含这些症状,所以就会在一定程度上降低该医案被辨证为肝气郁结证的可能性,图7中“肝气郁结证”到阴性证据的连线值越高,该医案被辨证为肝气郁结证的可能性就会降低得越多。
上述计算全部完成之后,DUCG推理机就可以给出第31号医案被辨证为肝气郁结证的一个概率值。因为郁病智能辅助辨证DUCG知识库中有19种郁病证型,所以DUCG推理机会根据第31号医案的症状数据为19种郁病证型分别计算出各自的概率值,概率值最高的证型即为最有可能的辨证结果。图6给出了第31号医案的DUCG辨证推理结果,图中仅显示了概率排序居前5位的证型,肝郁气滞证、肝郁脾虚证、肝郁痰阻证和心神失养证这4个证型对应的概率都小于0.001%,故该医案被辨证为肝气郁结证的概率就近似于100%了。
4.2" 快速构建基于DUCG的智能辅助辨证新模型
在前期构建的基于DUCG的郁病智能辅助辨证模型中,其郁病智能辅助辨证DUCG知识库包含了为19种郁病证型创建的19张郁病智能辅助辨证DUCG知识子图,还包含了为147个郁病症状创建的147个X变量,DUCG知识库中存储了这些证型和症状的知识以及它们之间的关系知识。但是,上述19种郁病证型中有13种证型只出现在了某一个郁病辨证知识权威来源中,难免会造成辨证模型对这些证型的辨证知识认识得不够深刻,利用该辨证模型对来自各个医案集、各位医生的郁病医案进行辨证推理,不可避免地会出现辨证结果不够准确的情况。然而,肝气郁结证、肝郁脾虚证、肝胆湿热证、肾虚肝郁证、心脾两虚证和肝郁化火证这6种证型都出现于多个郁病辨证知识权威来源中,使得辨证模型可以更深刻地认识它们。因此,我们利用本论文第2节、第3节所述的方案重新构建了一个包含上述6种郁病核心证型的DUCG郁病智能辅助辨证核心知识库,与DUCG推理机一起组成新的郁病智能辅助辨证模型。图8展示了新建的包含6种郁病核心证型的DUCG郁病智能辅助辨证核心知识库。
4.3" 对医案集进行智能辅助辨证推理测试
基于上述的郁病智能辅助辨证新模型,我们开展了对郁病医案集进行智能辅助辨证推理测试的工作。在前期采集筛选的169例可供辨证推理测试使用的医案中有48例医案的辨证结果在肝气郁结证、肝郁脾虚证、肝胆湿热证、肾虚肝郁证、心脾两虚证和肝郁化火证这6种证型之中,即这48例医案是一批对应于“6种郁病核心证型”的医案,对它们批量进行智能辅助辨证推理测试。在DUCG知识库测试平台中逐一录入每个郁病医案的信息后,即可查看基于DUCG的郁病智能辅助辨证模型生成的辨证推理结果,结果展示界面与图6相似。对上述医案集的辨证推理测试结果进行统计,统计结果表2所示。
从表2中可以看出,基于DUCG的郁病智能辅助辨证模型对这48例医案的初步辨证准确率为72.92%,对原始辨证结果为肝胆湿热证和心脾两虚证的两类医案的辨证准确率分别为100%和92.31%。其中,原始辨证结果为肝胆湿热证的医案只有2例,其辨证准确率达100%不具代表性;而原始辨证结果为心脾两虚证的医案有13例,其辨证准确率达92.31%,由于心脾两虚证在6个郁病辨证知识权威来源中的出现率最高(一共出现了5次),在一定程度上可以反映出:构建辨证模型时获得的辨证知识越多,模型的质量往往会越高。
5" 结" 论
本文提出了基于DUCG开展中医智能辅助辨证研究的方案,详细论述了基于DUCG的中医智能辅助辨证知识表示与辨证推理方法。以郁病辨证为例开展实验,构建了包含19个子图的郁病智能辅助辨证DUCG知识库和包含6个子图的郁病智能辅助辨证DUCG核心知识库,辨证推理测试获得的初步准确率可达72.92%、按证型分组统计的准确率最高可达100%,可根据DUCG化简图对辨证结果进行详细解释。实验结果表明:将DUCG应用于中医智能辅助辨证研究,有助于提高辨证模型中辨证知识的可视化程度和辨证推理过程的可解释性,可促使中医智能辅助辨证模型在推动名老中医诊疗经验的传承和推广、帮助中医学生学习中医诊断知识、辅助广大群众开展个人健康状态自检等方面发挥更大作用。
参考文献:
[1] 韦昌法,晏峻峰.从知识表示与推理方法探讨中医数字辨证发展 [J].中华中医药杂志,2019,34(10):4471-4473.
[2] 张勤.基于因果关系的人工智能 [J].军事运筹与评估,2022,37(3):5-9.
[3] 董春玲,赵越,张勤.动态故障诊断中的立体因果建模与不确定性推理方法 [J].清华大学学报:自然科学版,2018,58(7):614-622.
[4] 张婧,王梦月,宋磊,等.DUCG智能诊断技术在核电领域的应用分析 [J].产业与科技论坛,2021,20(3):33-34.
[5] 张勤.用原创的DUCG人工智能技术提高核电站的安全性和可用度 [J].中国核电,2018,11(1):59-68.
[6] 张勤.智慧医疗促进分级诊疗——DUCG的初步实践 [J].智能系统学报,2020,15(5):1028-1031.
[7] 包新杰,范阳华,张湛,等.动态不确定因果图(DUCG)在鞍区疾病中的诊断价值 [J].中国微侵袭神经外科杂志,2018,23(6):249-253.
[8] 邓晴.基于DUCG的《伤寒论》六经辨证知识表达与应用研究 [D].长沙:湖南中医药大学,2018.
[9] 陈陵芳.《黄帝内经》病机十九条知识表示研究 [D].长沙:湖南中医药大学,2018.
[10] 吕胤,刘志君,晏峻峰.动态不确定因果图用于中医诊断的思考 [J].湖南中医杂志,2017,33(9):133-135.
作者简介:韦昌法(1982—),男,壮族,广西巴马人,教授,硕士研究生导师,博士,研究方向:中医智能辅助诊疗。