卫生健康信息数据元标准化规则WST303—2023.docx
《卫生健康信息数据元标准化规则WST303—2023.docx》由会员分享,可在线阅读,更多相关《卫生健康信息数据元标准化规则WST303—2023.docx(24页珍藏版)》请在课桌文档上搜索。
1、ICS11.020CCSC07WS中华人民共和国卫生行业标准WS/T3032023代替WS/T303-2009卫生健康信息数据元标准化规则Rulesfordataelementstandardizationofhealthinformation2023-08-07 发布2024-02-01实施中华人民共和国国家卫生健康委员会口二发布本标准为推荐性标准。本标准代替WS/T3032009卫生信息数据元标准化规则。与WS/T3032009相比,主要为编辑性修改。本标准由国家卫生健康标准委员会卫生健康信息标准专业委员会负责技术审查和技术咨询,由国家卫生健康委统计信息中心负责协调性和格式审查,由国家卫生
2、健康委规划发展与信息化司负责业务管理、法规司负责统筹管理。本标准起草单位:中国人民解放军总医院、国家卫生健康委统计信息中心、中国人民解放军空军军医大学。本标准主要起草人:刘丽华、刘建超、张黎黎、王骏、冯丹、王霞、胡建平。卫生健康信息数据元标准化规则1范围本标准规定了卫生健康信息数据元模型、属性、卫生健康信息数据元的命名、定义、分类以及卫生健康信息数据元内容标准编写格式规范。本标准适用于卫生健康信息数据元目录(数据元字典)的研究与制定、卫生健康信息数据元元数据注册系统的设计与开发、卫生健康信息标准的研究、教学与交流。2规范性引用文件下列文件中的内容通过文中的规范性引用而构成本标准必不可少的条款。
3、其中,注日期的引用文件,仅该日期对应的版本适用于本标准;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本标准。ISO3166-1国家和所属地区名称代码第1部分:国家代码GB/T18391.1信息技术元数据注册系统(MDR)第1部分:框架GB/T18391.3信息技术元数据注册系统(MDR)第3部分:注册系统元模型与基本属性3术语和定义下列术语和缩略语适用于本标准。3.1术语3.1. 1概念ConCePt由特征的一个独特组合所生成的知识单元。来源:GB/T15237.1-2000,3.2.13.1.2一般概念generaIconcept对应两个或两个以上对象的概念,由于共同的特性而形成
4、一个组。来源:GB/T15237.1-2000,3.2.33.1.3个别概念individualconcept仅对应一个对象的概念。来源:GB/T15237.1-2000,3.2.23.1.4数据元dataeIementDE用一组属性规定其定义、标识、表示和允许值的数据单元。来源:GB/T18391.1-2009,3.3.83.1.5数据元概念dataelementconceptDEC能以数据元的形式表示的概念,其表述与任何特定表示法无关。来源:GB/T18391.1-2009,3.3.93.1.6对象类objectcIass可以对其界限和含义进行明确的标识,且特性和行为遵循相同规则的观念、抽
5、象概念或现实世界中事物的集合。来源:GB/T18391.1-2009,3.3.223.1.7特性property一个对象类所有成员所共有的特征。来源:GB/T18391.1-2009,3.3.293.1.8表示representation数据元的值域、数据类型的组合,必要时也包括计量单位或表示类。来源:GB/T18391.1-2002,3.603.1.9表示类representationclass表示类型的分类。来源:GB/T18391.1-2009,3.3.353.1.10 1.10计量单位unitofmeasure用于计量相关值的实际单位。来源:GB/T18391.1-2009,3.3.3
6、63.1.11值域VaIUedomain;VD允许值的集合。来源:GB/T18391.1-2009,3.3.383.1.12允许值permissiblevalue在一个特定值域中允许的一个值含义的表达。来源:GB/T18391.1-2009,3.3,283.1.13值含义VaIUemeaning一个值的含义或语义内容。来源:GB/T18391.1-2009,3.3.393.1.14维度dimensionaIity无单位的计量表述。注:一个数量是具有一个相关计量单位的值。32“F、0C、1米和100厘米是数量。两个计量单位之间的等价由一个计量单位度量的值与另一个计量单位度量的值之间保持有一个一一
7、对应关系的数量来决定,并独立于相关语境,其特征运算是相同的。等价的计量单位在此意义上具有相同的维度。这里定义的等价在所有计量单位集合中形成了一个等价关系。每类等价对应一个维度。“华氏温度”和“摄氏温度”的计量单位具有相同的维度,因为对于相同的数量,每个由华氏计量的值,同样存在一个由摄氏计量的值,反之亦然。对于每个计量单位的数量可以进行同样的运算。温度一一对应的数量等式有:C=(5/9)*(Fo-32)和P=(9/5)*(G)+32。来源:GB/T18391.1-2009,3.3.123.1.15概念域conceptuaIdomain;CD有效的值含义的集合。来源:GB/T18391.1-200
8、9,3.3.61.1.1 16内涵intension术语学组成概念的特征的集合。来源:GB/T18391.1-2009,3.2.153.1.17外延extension术语学与一个概念对应的全体对象。来源:GB/T18391.1-2009,3.2,123.1.18元数据metadata定义和描述其它数据的数据。来源:GB/T18391.1-2009,3.2.163.1.19元数据项metadataitem一个元数据对象的实例。来源:GB/T18391.1-2009,3.2,173.1.20实体entity任何现存、曾经存在的或可能存在的具体的或抽象的事物,包括事物间的联系。来源:GB/T1839
9、1.1-2009,3.2,103.1.21属性attribute某个对象或实体的特征。来源:GB/T18391.1-2009,3.1.13.1.22属性值attributevalue某种属性的一个实例表示。3.1.23分类法taxonomy依据类及子类间的固有关系进行分类的方法。3.1.28主题词表thesaurus按给定顺序排列参照词汇,其中显示和标识了词汇间的关系。3.1.29注册机构标识符registrationauthorityidentifierRAI经授权对数据元进行注册的任何组织的标识符。3.1.30数据标识符dataidentifierDl由注册机构赋予数据元的标识符。3.1.
10、31版本标识符VerSionidentifier赋予版本的一个标识符,以此提交和更新数据元注册。3.1.32管理状态administrativestatus注册机构处理注册请求中赋予管理过程的状态的指称。来源:GB/T18391.1-2009,3.3.33.1.33数据元字典dataeIementdictionary列出并定义了所有相关数据元的一种信息资源。注:数据元字典可以有各种不同层级,例如:IS0/IEC委员会级、国际协会级、行业部门级、公司级、应用系统级。3.2 缩略语ISO:国际标准化组织(InternatiOnaIOrganizationforStandardization)1EC
11、:国际电工委员会(InternationalElectrotechnicalCommission)ETA:电子工业协会(EleCtrOniCIndustriesAssociation)4数据元概述4.1 数据元基本模型数据元的基本模型是由数据元概念和数据元两部分组成,见图1。数据元概念数据元图1数据元的基本模型一个数据元概念是由对象类和特性两部分组成,是能以一个数据元形式表示的概念,其描述与任何特定表示法无关。一个数据元是由对象类、特性和表示三部分组成。一个数据元概念对应多个数据元。对象类是可以对其界限和含义进行明确的标识,且特性和行为遵循相同规则的观念、抽象概念或现实世界中事物的集合。它是我
12、们希望采集和存储数据的事物。对象类是概念,在面向对象的模型中与类相对应,在实体-关系模型中与实体对应,例如,患者、医生、卫生机构等。对象类可能是一般概念。当对象类所对应的对象集有两个或多个元素时,就是一般概念。患者、医生、卫生机构等都是一般概念。对象类也可以是个别概念。当对象类对应的对象集仅有一个元素时,就是个别概念,例如“北京市医疗机构”就是个别概念。特性是一个对象类的所有成员所共有的特征。它用来区别和描述对象,是对象类的特征,但不一定是本质特征,它们构成对象类的内涵。特性也是概念,对应于面向对象模型或实体-关系模型中的属性,例如身高、体重、血压、脉搏、血型等。特性也可是一般概念或个别概念。
13、作为个别概念的例子有:病床总数或医疗收入。表示可包括值域、数据类型、表示类(可选的)和计量单位四部分,其中任何一部分发生变化都成为不同的表示。值域是数据元允许值的集合,例如医疗毛收入这一数据元的值域是用非负实数集(以人民币为单位)作为它的允许值集合;数据类型是表达数据元允许值的不同值的集合,以这些值的特性和运算为特征,例如患者姓名的数据类型是“字符”;表示类是表示类型的分类,它是可选的,例如性别代皿这一值域的表示类是“类别”:计量单位是用于计量相关值的实际单位,例如患者血压测量的计量单位是“mmHg”。当一个数据元概念与一个表示联系在一起时,就产生了一个数据元。在需要生成概念上相似的数据元时,
14、一个数据元概念可以与不同的表示关联产生不同的数据元。同一概念的表达方法有许多。例如,患者国籍这个数据元概念,可以应用ISO3166T中规定的世界各国7种不同的表示,有英文全称、2位字母码、3位字母码、地区代码等,每种都包含了一个表示集合,都可以用作与该数据元概念关联的表示。7种关联就形成了7个数据元。4.2 值域基本模型值域的基本模型由概念域和值域两部分组成,一个概念域对应多个值域,见图2。图2值域的基本模型4.2.1 值域值域是数据元允许值的集合。一个允许值是某个值和该值的含义的组合,值的含义称为值含义。例如,“患者病情状态”数据元的值域是:1表示危,2表示重,3表示一般。1、2和3是值,其
15、值含义分别是危、重和i般。值域有两种(非互斥的)子类:一一可枚举值域:由允许值(值和它们的含义)列表规定的值域;一一不可枚举值域:由描述规定的值域。一个可枚举值域是包含了它的所有值及值含义的一个列表。例如,“患者血型类别代码”数据元的一个可枚举值域列表见表1:表1”患者血型类别代码”的值域值值含一12B型3。型4AB型9一个不可枚举值域是由一个描述来规定。不可枚举值域的描述须准确描述属于该值域的允许值。例如,“传染病死亡率”数据元的值域是大于等于0且小于等于1的实数。描述数据有时需要计量单位。例如描述血压的值域记录时,为了准确理解值含义,需要使用计量单位mmHg或kPa;年龄值域记录的计量单位
16、可使用年、月、周、日;血糖值域记录的计量单位可以是mg/dl或mlL所以,计量单位与值域关联。4. 2.2概念域概念的外延构成了概念域,一个概念域是一个值含义集合。一个概念域的内涵是它的值含义。概念域也有两种(非互斥的)子类:一一可枚举概念域:由值含义列表规定的概念域;一一不可枚举概念域:由描述规定的概念域。可枚举概念域的值含义可以明确地列举。该类型概念域对应于可枚举类型的值域,见示例1。不可枚举概念域的值含义由“不可枚举概念域描述规则”来表述。该规则描述了不可枚举值域中允许值的含义。这种类型的概念域对应于不可枚举类型的值域,见示例2。如果一个计量单位的任何量可以转化为另一种计量单位下等同的量
17、,则这些计量单位彼此之间是等价的。所有等价的计量单位被认为具有相同的维。例如,长度计量单位(米,厘米等)具有相同的维,年龄计量单位(年、月、周、日)具有相同的维。所以,维与概念域关联。示例1:可枚举概念域概念域名称:国别代码概念域定义:世界各国名称的表示值含义:中国、美国、巴西、法国值域名称(1):国家代码-3位字母允许值:CHN,中国;USA,美国;BRA,巴西;FRA,法国;值域名称(2):国家代码一2位字母允许值:CN,中国;US,美国:BR,巴西;FR,法国;-值域名称(3):国家代码-3位数字允许值:156,中国;840,美国:076,巴西;250,法国;不例2:不口J枚举概念域概念
18、域名称:体重概念域定义:身体所有器官重量的总和概念域描述规则:用非负实数表示-值域名称(1):体重一N5,2值域描述:身体所有器官重量的总和,最大长度5位的非负实数,小数点后保留2位数字。计量单位:千克值域名称(2):体重一N4值域描述:身体所有器官重量的总和,最大长度4位的非负整数。计量单位:克IT-关系每个值域都是概念域的一个元素。多个值域可能是同一个概念域的外延,但一个值域只与一个概念域关联。概念域之间可以存在关系,由此创建概念域的一个概念体系。值域之间也可以存在关系,根据这些关系提供的框架,就能够捕捉相关值域和它们关联概念的结构。每个值域表示两种概念:数据元概念(间接地)和概念域(直接
19、地)。数据元概念是与一个数据元关联的概念。值域是数据元的表示,因此也间接地表达了数据元概念。但是,值域与一个概念域直接关联,因此,值域对概念的表示与数据元无关。4.3数据元的元数据总体模型数据元的元数据总体模型由概念层和表示层两个部分组成,见图3。概念层包括数据元概念类和概念域类。这两种类都表示概念。表示层包括数据元类和值域类。这两种类都表示数据值的容器。数据元概念八:N)概念层表示层(N概念域(1:Nl值域(N:1)图3数据元的元数据总体模型图3可以给出4个类的若干基本事实:个数据元是一个数据元概念和一个值域的结合体;一多个数据元可以共享相同数据元概念,这意味着一个数据元概念可以用多个不同方
20、式表示。例如,患者入院时间是一个数据元概念,它可以有多个表示方法,例如用YYYYMMDD表示患者入院的年月日,如果需表示小时和分,则用YYYYUMDDhhnim表示。“患者性别代码-英文全称”、“患者性别代码T位字母代码”共享同一个数据元概念患者性别。多个数据元可以共享相同的表示,这意味着一个值域可以被不同数据元重复利用。例如,“住院病人结算费用一元(人民币)”和“门急诊就诊费用一元(人民币)”数据元共享相同的值域“费用-元(人民币)”。值域不是必然与个数据元关联,可以单独管理;一不同值域所有允许值所对应的值含义都相同时,这些值域在概念上是等价的,因此,对应相同的概念域。例如,前述关于性别的值
21、域:性别代码T位数字、性别代码-英文全称及性别代码T位字母代码的允许值所对应的值含义相同,均表示“男性、女性、未知的性别、未说明的性别”。所以这些值域对应同一个概念域“性别”。不同值域部分允许值所对应的值含义相同时,这些值域在概念上是相关的,因此,在包含有其各自概念域的概念体系中共享一个由共同的值含义构成的概念域。例如,性别代码-符号的允许值是“8和9”,分别表示“男性和女性”。无其他符号表示“未知的性别”和“未说明的性别”,那么性别代码-符号与性别代码T位数字、性别代码-英文全称及性别代码T位字母代码值域在概念上相关,共享由共同的值含义“男性和女性”构成的概念域“性别”。个数据元概念仅与一个
22、概念域相关,因此共享相同数据元概念的所有数据元共享概念上相关的表示。例如,“新生儿体重-、5,2(千克)”和“新生儿体重-N4(克)”是两个不同的数据元,共享一个数据元概念瓶生2L体重。两个数据元的表示在概念上是相关的,共享概念域“体重”。千克和克都是重量的计量单位,称具有相同的维度。因此计量单位与值域相关,维度与概念域相关。许多数据元概念可以共享相同的概念域。例如,患者体重和新生儿体重是两个不同的数据元概念,共享一个概念域“体重”。4.4 数据元与其他数据概念的关系图4简化表示了数据元所在的不同数据环境。数据元出现在数据库、文件和数据交换集当中。数据元是系统所管理数据的基本单元,因而它必然是
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 卫生 健康 信息 数据 标准化 规则 WST303 2023

链接地址:https://www.desk33.com/p-919330.html