CDSS医疗决策支持系统全套.docx
《CDSS医疗决策支持系统全套.docx》由会员分享,可在线阅读,更多相关《CDSS医疗决策支持系统全套.docx(35页珍藏版)》请在课桌文档上搜索。
1、CDSS医疗决策支持系统一、临床决策管理系统简介医疗决策支持系统(CDSS)自诞生以来已经经历了60余年,早期经典的应用就是专家系统,利用计算机程序和医学知识来模拟专家的思维。由此发展而来的CDSS大多数基于临床指南、药品说明书等的医学知识,知识库中的知识大多由可编译的规则构成。推理引擎作为CDSS的大脑,需要将患者实际信息与知识库中的规则进行匹配,以达到模拟专家思维,提供决策支持服务的目的。研究表明,这种基于规则的CDSS以简单的警告和提醒方式就可以对临床活动产生有益的影响。随着计算机技术的发展,现代临床决策支持系统(CDSS)将计算机科学与AI技术和医疗领域知识相结合,利用类分析以及算法模
2、型对医疗信息进行处理,形成结构化的医学知识,再结合web开发技术,通过简单直观的人机交互页面来为医护人员提供决策支持功能,经验证能够为医疗救治率带来显著的提高。近年来,在相关政策的支持下,智能医疗蓬勃发展,在流行病预测、医患身份核验、医疗辅助诊断、精准外科手术、医药研发、智能健康管理等多个领域飞速发展。其中,流行病预测与医疗辅助诊断是重要的落地场景。智能医疗离不开医疗健康数据,其具有体量大、多态性、不完整性、冗余性等特点,从中挖掘出的有用信息可以用作疾病诊断和决策支持。医疗健康数据的挖掘与应用已经成为智能医疗的重要步骤。随着电子信息化在医疗领域的普及,海量电子医疗数据沉淀,数据类型和数据量持续
3、增加。医疗健康数据可以在海量数据与医疗问题”之间架起一条通道,提供健康管理、辅助诊疗等解决方案。现如今,医疗数据的来源多种多样,众多医疗知识库可以向大众提供丰富的医疗知识,如百度百科、人卫网知识库等。止匕外,随着HIS系统及EHR系统的广泛使用,医院内沉淀了大量的临床数据,充分利用这些数据,可以发掘巨大的实用价值。本文第二、三、四部分分别介绍了临床决策系统的三个功能模块,分别是知识图谱可视化展示模块,基于电子病历的疾病诊断及相似病历推荐模块,以及医学知识库模块。第五部分对剩余工作及未来计划做了一个简单说明。二、知识图谱可视化展示模块2.1 知识图谱相关理论从实际应用的角度出发,可以把知识图谱简
4、单地理解为多关系图(Mu1.ti-re1.ationGr叩h),其包含多种类型的节点和多种类型的边。定义一个有向图来描述知识,其中是一组引用不同实体的顶点,是一组引用不同类型边的实体间关系。知识图谱中,图的节点表示实体(Entity)、图的边表示关系(Re1.ation)。实体指现实世界中的事物比如人、地点、药品、公司等,关系指不同实体间的某种联系。止匕外,实体和关系也会拥有各自的属性,例如,定义疾病和药品两个实体,实体间的关系可表示为适用于0同时,可在“疾病”这一实体中定义并发症、是否流行病”等属性。2.1.1 知识图谱构建知识图谱构建通常有两种思路,自底向上和自顶向下。前者的思路是先进行数
5、据采集,再完善模式层体系架构;而后者的思路是先进行模式层设计,根据领域知识特点,预先定义实体及关系,形成一个知识图谱框架,通过这个框架来规范后续知识收集和存储工作。在构建通用领域知识图谱时,由于通用领域知识范围较大,知识类型庞杂,因此适合采用自底向上的方式构建,先抽取三元组,再根据三元组内容来逐渐完善知识图谱的体系架构。而在构建行业知识图谱时,由于行业领域对知识专业性和精度有较高要求,适合采用自顶向下的方式构建,先对模式层进行设计,再据此进行后续的知识导入。知识图谱的数据来源主要分为两类,一类是结构化数据,如行业数据库当前已有的表型数据,可直接应用于知识图谱构建;第二类是半结构化数据或非结构化
6、数据,非结构化数据包括各种文档、资料中的自然语言文本,从该类数据中获取实体和关系主要通过自然语言处理和神经网络等技术来实现。知识融合是对获取到的实体进行实体对齐、实体消歧等操作,因为多个数据源中可能对于同一个实体有不同描述方式,而同一个实体也可能代表不同的含义,比如苹果可以是一种水果,也可以是指苹果手机。知识加工是指将知识以本体的形式进行存储,再使用规则描述语言配合规则推理引擎对现有实体和关系进行归纳好挖掘的过程,能够发现其中新的、隐含的实体关系,以丰富知识图谱的广度和深度。知识图谱的构建工作是一个持续性的过程,实体和关系越丰富,就越能发挥出知识图谱的优势,因此需要通过后期不断增加新的知识和内
7、容,来完善知识图谱,才能在后续应用中活的更好的效果。2.1.2 知识图谱存储知识图谱是对众多客观存在的信息之间进行关系创建进而形成的一个关系网络,为了能够高效利用知识图谱中丰富的语义关系,需要选择适合的存储方式,目前适用于知识图谱存储的数据库主要有三类,包括RDF三元组数据库、关系型数据库以及图数据库。使用上述三类数据库存储知识图谱的优缺点如表2-1所示。其中RDF类的库是早期设计用于语义知识存取的数据库,通过SPARQ1.查询语言对三元组进行查询,但是这类数据库存在可扩展性差,查询效率低的问题,不符合本文知识图谱应用需求。关系型数据库操作具有复杂关系的数据时需要进行繁琐的外键查询,注定不适合
8、大规模知识图谱的存储,如何从关系型数据库中对语义知识进行抽取也是一个难点。而图数据库是近两年数据库发展的热点,它的基本存储结构包括节点和节点之间的有向边,这种特殊的数据结构与知识图谱非常契合,并且图数据库非常适合应用于多对多关系的处理,借助于图搜索算法,能够以稳定的速度便利图中的节点和关系边,图的量级增加不会对查询速度造成太大影响,因此本系统选用Neo4j图数据库来进行知识图谱存储。Neo4j作为图数据库中的佼佼者,近年来发展迅速,在实际业务中已经具备匕匕较成熟的使用环境,满足一个数据库的所有特性,比如事物的ACID原则,并且自带一个友好的web前端样式的图形操作贞面,自带的图结构查询语言Cy
9、pher能够便捷地进行数据查询,并且它是由Java语言开发实现的,能够很好地融入本系统的开发工作。表2-1知识图谱存储方案比较数据库类型优势缺点RDF数据结构清晰明了共享发布缺乏成熟的杳询搜索引擎数据结构不灵活关系型数据库应用成熟,存储方便小型知识图谱查询效率高复杂关系查询效率低数据更新维护效率低图数据库丰富的查询算法多级深度搜索效率高内存空间消耗大2.2 可视化展示知识图谱构建2.2.1 数据库设计该模块所用到的数据均是从寻医网爬取下来的,因为是采用先收集数据,再构建图谱的方式进行,因此该图谱采用自底向上的方式搭建。该知识图谱的模式层构建包括7个实体表、11个实体关系表,并导入Neo4j图数
10、据库中,完成知识图谱存储。1.定义实体为了保证知识图谱实体及实体关系定义的权威性与合理性,本模块所定义的领域本体专业术语根据寻医网爬取知识定义,最终确定为药品、食物、检直、科室、“生产商、疾病、症状共计7种实体。1.定义实体关系实体关系表明了不同种类实体之间的联系,根据对爬取数据的归类总结,共定义了11种实体关系,分别是:科室-科室关系、疾病-忌吃食物关系、疾病-宜吃食物关系、疾病-推荐吃食物关系、疾病-通用药品关系、疾病-热门药品关系、疾病-检查关系、厂商-药物关系、疾病症状关系、疾病-并发症关系、疾病科室关系。图2-2实体关系分类2.2.2界面设计本系统前端采用vue框架进行开发,用到了E
11、Iement-UI组件及d3.js或Eharts插件进行动态效果展示。当用户在搜索框中输入疾病、症状、药品等关键字后,系统后台会自动到图数据库中进行搜索,找出所有满足条件的节点及其内容,逐条展示到界面上。与此同时,每条显示后面都跟随一个“关系图按钮,当用户点击该按钮时,会弹出一个面板,在该面板上展示出该节点以及与该节点有关的所有关系与节点,当用户单击其中某一个节点时,又会以该节点为中心进行新的展示。该界面原型图如图2-3,及2-4所示。图2-3知识图谱查询界面图2-4知识图谱展示弹框三、基于电子病历的疾病诊断及相似病历推荐模块由于学习疾病的种类多种多样,因此想通过一套模型准确定位出疾病种类,其
12、数据量及复杂程度很大,因此可以将疾病进行简单分类,如肿瘤诊断、慢性病杳询诊断等,再分别设计对应的疾病诊断算法,提高模型查询的准确度。本模块以肿瘤诊断为例,设计了一套肿瘤领域疾病诊断的模型,今后是否补充其他模块可以与专业临床医生咨询,同时与领导沟通工作量,讨论是否需要展开工作。3.1 基于电子病历的肿瘤诊断模块该模块数据来源为某肿瘤医院中的中文电子病历,根据业务需求和肿瘤电子病历文本数据的特点,结合领域知识图谱构建的T殳性流程,设计了如图3-1所示的肿瘤知识图谱构建流程,包括模式层构建、知因由取、知识存储与加工、知识图谱应用四个步骤。1 .模式层构建由于肿瘤领域知识图谱具有较强的专业性要求,因此
13、采用自顶向下的方式进行。首先根据病历文本特征和业务需求完成知识图谱的模式层构建,由于决策支持系统是为肿瘤疾病诊疗工作服务,因此知识图谱构建的目标主要是围绕肿瘤疾病来进行,并且一份电子病历所记录的诊疗记录等信息均为同一个病人的实际问诊过程,可以据此定义实体之间的语义关系,最后再根据医院方面医生的评估意见,对模式层进行修改完善,形成一个肿瘤知识图谱框架。1.知识抽取知识抽取是知识图谱构建的关键步骤,抽取出的肿瘤知识需要能够支撑系统来为用户提供肿瘤诊疗业务。首先要对原始的电子病历数据进行处理,主要工作包括数据清洗、规约变化以及新的数据特征获取;接着根据实际需要指定了实体标注规则,标注获取到了结构化的
14、实体数据,再通过代码对实体数据进行BiO序列化标注,之后构建了实验数据对Bi1.STM-CRF模型进行i川练,最终抽取出知识图谱构建需要的实体数据。图3-1肿瘤知识图谱构建流程i.知识加工与存储在领域知识图谱构建的一般性流程中,知识加工包括实体消歧、实体对齐、知识推理等工作。考虑到肿瘤知识的准确性要求,并且知识图谱的语义关系已经足够丰富,因此无需进行知识推理。同时文本构建的知识图谱时基于单一的数据来源构建的,不存在一词多义的情况,因此只需要考虑实体对齐的工作,该项彳王务通过构建词典来实现。因此可以用9个实体表和12个实体关系表表示并导入Neo4j图数据库中,完成知识图谱存储。知识图谱应用构建的
15、知识图谱将作为决策支持系统的底层支撑,为医护人员提供应用服务。其中知识图谱管理模块通过引入neo4j配置依赖并封装Cypher语句来实现知识图谱的可视化服务和语义搜索服务;医疗辅助决策模块通过知识图谱的关系边来存储疾病各症状出现的频次,进而计算症状之于疾病的权重,并将权重作为知识图谱的症状-疾病关系边的属性进行存储,最终实现疾病诊断功能;临床治疗路径模块通过为知识图谱的辅助检查、药物、手术等节点创建倒排索引来为用户提供迅速的诊疗项目添加功能。3.1.1知识图谓模式层构建肿瘤知识图谱的模式层构建包括定义肿瘤领域实体类、定义实体的数据属性以及定义实体的对象属性三部分。定义肿瘤领域实体通过查阅大量资
16、料,本模块定义出9种实体:患者、疾病、科室、临床症状、辅助检查、治疗方式、手术、药物、护理曲T。1 .患者(patient):患有肿瘤疾病的人。2 .疾病(disease):疾病的名称,图谱的关键实体。下位类包括肿瘤疾病和肿瘤疾病在治疗过程中引起的并发症(非肿瘤疾病),并发症同样能带来巨大的威胁,有的甚至更早的夺走了患者的生命。3 .科室(department):以患者最终进行治疗的科室作为患者所患疾病的对应科室,后续将以科室为单位进行肿瘤疾病诊断,并且系统多个功能都会把科室作为筛选项。4 .临床症状(symptom):患有该肿瘤疾病患者的临床表现。下位类包括症状和体征。症状是患者的主观体验,
17、如眩晕、腹痛、恶心等;体征是患者经过医学手段检杳后所发现的身体指标及异常结果。5 .辅助检直(examination):针对该肿瘤疾病所需要采取的检查措施,用于肿瘤疾病的诊断。包括常规的体格检有和实验室检直以及进一步的影像学检查和肿瘤标志物检查等。6 .治疗方式(treatment):针对该肿瘤疾病的医学处理方式。包括抑酸,雾化,保胃,抗凝等。7 .药物(medicine):在治疗过程中使用的药物。&手术(OPeration):在治疗过程中进行过的手术。9.护理方式(nursing):在患者康复住院阶段进行过的护理工作。1.定义数据属性数据属性是类的内部属性,是类固有的性质,用于准确描述领域实
18、体。根据肿瘤疾病特点和知识源,定义患者的数据属性包括患者编号、性别、年龄、入院时间、出院时间、住院天数,为了保证患者的隐私安全,采用数据脱敏技术隐去了患者的身份信息;疾病的数据属性包括名称、ICD-IO编码、治疗周期、治疗费用;“临床症状的属性包括名称、状态;由于数据中缺乏其他类的数据属性,如药物的用法、用量、价格,并且本文的主要目标是对于肿瘤实体之间关系的探索,因此对于其他类并未添加数据属性。实体数据属性具体情况如表3-1所示。表3-1肿瘤实体数据属性类(实数据属性体)患者患者编号(string)、性别(int)、年龄(Boo1.ean)入院时间Cdatatime)、出院时间(datatim
19、e)、住院天数(int)疾病名称(string)XICD-IO(string)治疗周期(int)、治疗费用(int)临床名称(string)、状态(string)症状科室名称(string)药物名称(string)手术名称(string)治疗名称(String)方式辅助名称(string)检查护理名称(string)方式1.定义对象属性对象属性是类的外部属性,也就是肿瘤知识之间的语义关系,语义关系可以是双边的,也可以是单边的,还可以是同类实体之间的。语义关系分为基本语义关系和领域语义关系,基本语义关系包括四类:部分与整体关系,上下位类间的从属关系,实体类和实例间的从属关系,实例和数据属性关系;
20、根据查阅大量资料,最终定义了总共12条肿瘤医学实体之间的语义关系,具体情况如表3-2所示。表3-2肿瘤实体对象属性实体1语义关系实体2患者患有(PHD)疾病疾病引起(DCD)疾病疾病属于(DBD)科室疾病接受(DRC)辅助检查疾病表现出(DSS)临床症状疾病需要(DNT)治疗方式疾病服用(DTM)药物疾病接受(DRO)手术疾病采取(DAN)护理方式临床症状表明(SID)疾病临床症状需要(SNT)治疗方式科室包含(DCS)临床症状3.1.28三采集本模块所使用的数据为肿瘤电子病历系统(EHR)导出的电子病历数据,包括结构化数据和非结构化文本数据。结构化数据包括患者号、性别、年龄、入院时间、出院时
21、间、住院天数、婚否、疾病名称、治疗周期、治疗费用、体征数值等实体及数据属性,需要对上述数据的异常值、空值进行清洗;非结构化文本包括入院体察,诊疗计划,诊疗经过等,这些文本数据中包含需要的其他实体数据,包括患者、疾病、科室、临床症状、辅助检查、治疗方式、手术、药物、护理方式等,后续通过自然语言处理算法来完成上述实体的识别工作。结构化数据的数据清洗工作,通过pandas数据分析库来进行,PandaS提供了丰富的库函数,根据需求制定各项数据可根据数据质量情况自行定义,以下是一些参考规则:清洗规则,调用库函数来完成数据清洗工作。清洗规则将患者号为空的数据行标为异常,删除该条数据;2.将性别为空或不为1
22、、2的行标记为异常,删除该条数据。3 .将年龄为空值,小于O或大于100标记为异常,以平均值插入填充。4 .将出院时间和入院时间为空值,出院时间小于入院时间标为异常,删除该条数据。5 .将住院天数为空值,小于0的值标记为异常,以出院时间和入院时间的差值进行填充。6 .婚否、病灶大小不对后续推理造成影响,不做处理。7 .疾病名称将空值视为异常,删除该条数据。8 .治疗周期以相同疾病住院天数的平均值进行填充。9 .治疗费用以相同疾病治疗费用的平均值进行填充。10 .体征除了包括常规数据清洗工作,还需要将数值映射为状态,患者与自身体征数据相关联,而疾病与抽象出来的异常体征状态相关联,需要进行状态映射
23、的体征具体处理规则如表3-3所示。表3-3体征处理规则体映射规则映射结果征呼根据每分钟呼吸呼吸次数为12-20次视作呼吸正吸次数来划分状态脉根据每分钟脉搏搏跳数来划分状态疼根据疼痛的数值痛进行分段,每段对应一个状态体根据体温具体数温值来划分状态血根据舒张压和收压缩压的具体数值来划分状态氧根据氧饱和最大饱值和最小值的具和体数值来划分状态常,否则视作呼吸异常脉搏跳数结余60-100视作脉搏正常,否则视作脉搏异常疼痛值介于1-3视作轻度疼痛,疼痛值介于4-6视作中度疼痛,疼痛值介于7-9视作重度疼痛体温介36-37视作体温正常,否则视作体温异常舒张压介于60-90并且收缩压介90-140视作血压正常
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- CDSS 医疗 决策 支持系统 全套
链接地址:https://www.desk33.com/p-1564239.html