卫生健康信息数据集分类与编码规则WST306—2023.docx
《卫生健康信息数据集分类与编码规则WST306—2023.docx》由会员分享,可在线阅读,更多相关《卫生健康信息数据集分类与编码规则WST306—2023.docx(13页珍藏版)》请在课桌文档上搜索。
1、ICS11.020CCSC07WS中华人民共和国卫生行业标准WS/T3062023代替WS/T306-2009卫生健康信息数据集分类与编码规则Rulesforhealthinformationdatasetclassifyingandcoding2023-08-07 发布2024-02-01实施中华人民共和国国家卫生健康委员会口二发布本标准为推荐性标准。本标准代替WS/T3062009卫生信息数据集分类与编码规则。-WST3062009相比,主要为编辑性修改。本标准由国家卫生健康标准委员会卫生健康信息标准专业委员会负责技术审查和技术咨询,由国家卫生健康委统计信息中心负责协调性和格式审查,由国家
2、卫生健康委规划发展与信息化司负责业务管理、法规司负责统筹管理。本标准起草单位:中国人民解放军总医院、国家卫生健康委统计信息中心、中国人民解放军空军军医大学。本标准主要起草人:刘丽华、张黎黎、冯丹、李顺飞、王珊、王霞、胡建平。卫生健康信息数据集分类与编码规则1范围本标准规定了卫生健康信息数据集分类与编码需遵循的基本原则、技术方法以及应用规则。本标准适用于卫生健康领域各类卫生健康信息数据集分类与编码方案的制定。2规范性引用文件下列文件中的内容通过文中的规范性引用而构成本标准必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本标准;不注日期的引用文件,其最新版本(包括所有的修改单)适用
3、于本标准。GB/T2260中华人民共和国行政区划代码GB/T2659世界各国和地区名称代码GB/T7027信息分类和编码的基本原则与方法GB/T10113分类与编码通用术语GB/T11714全国组织机构代码编制规则GB/T13745学科分类与代码GB/T14396疾病分类与代码3术语和定义GB/T10113中确立的及下列术语和定义适用于本标准。3. 1数据集dataset具有一定主题,可以标识并可以被计算机化处理的数据集合。3.2数据集编码datasetcoding在分类的基础上,给数据集赋予的有一定规律性、计算机容易识别与处理的符号。3.3数据集标引datasetindexing指分析数据集
4、的内容属性及相关外表属性,并用特定语言表达分析出的属性或特征,从而赋予数据集检索标识的过程。4数据集概述4.1 数据集基本概念数据集是具有主题的、可标识的、能被计算机处理的数据集合。a)主题:围绕着某一项特定任务或活动进行数据规划和设计时,对其内容进行的系统归纳和描述。通常数据集主题应具有划分性和层级性,划分性是指主题间可通过不同的命名,将相同属性的主题归并在一起形成相同的类,将不同属性的主题区分开形成不同的类;层级性是指主题可被划分成若干子主题或子子主题。b)可标识:指能通过规范的名称和标识符等对数据集进行标记,以供识别。标识与名称的取值需要通过具体的命名或编码规则来规范。c)能被计算机处理
5、:指可以通过计算机技术(软硬件、网络),对数据集内容进行发布、交换、管理和查询应用。这些数据可以由不同的物理存储格式来实现,按照数据元的定义与数据类型,在计算机系统中以数值、日期、字符、图像等不同的类型表达。d)数据集合:指由按照数据元所形成的若干数据记录所构成的集合。例如,病案首页数据集由主索引、入出转、诊疗、护理、手术、费用等不同数据组成。4.2 数据集基本属性每个数据集所具有的属性都包括通用属性和特有属性两部分。数据集的通用属性包括数据集主题、标识、实体和数据项,又称“基本属性”。数据集特有属性包括类别、区域、专业、学科、建立时间、涉及的疾病等。4.3 卫生健康信息数据集卫生健康信息数据
6、集是在卫生健康领域,为满足政府卫生决策、业务处理、科学研究、信息发布与绩效评价等需求,按照数据集概念设计、归纳、整合的主题信息集合。卫生健康领域的数据集主要可以归纳为三个方面:a)信息发布类统计数据集:如中国卫生健康统计年鉴中卫生机构设置及规模、卫生人员资源的地区分布、卫生经费的筹集及分配等数据集,各类卫生机构的统计月报、年报,以及满足某一专项统计需求通过统计收集、归纳、整理、报告形成的数据集。b)业务系统建设类的基本数据集:包括医疗服务、公共卫生、药品供应、医疗保障、卫生管理等领域为了满足业务信息系统规范化建设和领域内部以及领域间数据交换与共享需求,设计归纳的各个子系统(或者功能模块)所包含
7、的最小数据元素的集合。如:儿童出生登记、食品卫生许可、个人健康档案、住院病人入出转、居民死亡登记报告等基本数据集。c)为满足特定目的收集整理制作的数据集:包括通过调查、观察、监测、检测、试验、实验等方式获取的满足科学研究、业务咨询或卫生服务决策等需求的数据集。如:近年来国家投入建设的国家人口健康科学数据集、卫生服务调杳数据集、疾病及危险因素调查等内容的数据集。5数据集分类5.1 分类基本原则a)系统性原则:综合考虑数据集主题一致性,按其内在联系进行系统化排列,确保类目唯一、结构合理、层次清晰,减少冗余。b)实用性原则:满足数据集分类编目的简便性、可操作和通用性需求和数据集查询的一致性理解。c)
8、可扩展性原则:保证分类体系框架适应数据集不断丰富的内容和日益增长的种类与数量。d)兼顾科学性原则:自顶向下,优先选择最能代表卫生健康信息数据集主题的语言、词条定义类目名称,编制受控分类体系表。e)稳定性原则:使用稳定的因素作为分类依据,同时提高分类体系的可延展性或兼容性,促进稳定性。5.2 分类方法5.2.1 主题优先法卫生健康信息数据集分类体系首先依据主题构建主分类框架,分类框架各层级类目可表示为一级、二级、三级类目等,见表1。表1卫生健康信息数据集主分类框架5一级类目二级类目三级类目n级类目数据集系列一级类目1二级类目1二级类目2三级类目1三级类目2n级类目1n级类目2数据集1数据集2n级
9、类目1n级类目2二.级类目3n级类目1n级类目2三级类目111级美日1n级类目2n级类目1/4夕36l3.刀/ZS卫生健康信息数据集以相同主题构建,同时在若干相同主题数据集中,又根据其个性,如时间、地域、疾病、学科、机构等多属性,构成辅助分类体系,即复分类体系。卫生健康信息数据集复分类见图1:有的 IHITt- 类目1类目2类目3X特什属性2 类目1特有属性9 类目1,I 2 3 ER 目目 -类目2类目3,二工 敖 掂 柒一员卫生健康信,类类目1类目2类目35. 2.3组配分类法组配分类法是按照多维度、交叉性方式,将数据集主分类框架与复分类表组合使用,对数据集进行分类的规则。在某个主分类下的
10、卫生健康信息数据集的组配分类示意见图2:数据集系列数据集1数据集2数据集3时间1949/01/011950/01/011951/01/01地域北京市天津市河北省疾病肺 乙 鼠布肝疫一目目目 关类类图2卫生健康信息数据集组配分类5.3类目设置规则5. 3.1主分类表类目设置6. 3.1.1类目界定规则卫生健康信息数据集分类与编码中的每一个类目都围绕特定的主题,表达一定主题知识的内涵和外延。遵照本分类与编码规则,科学分类体系所列的类目,能够容纳大量卫生健康信息的最小单元一数据集,从而成为管理数据集的工具。a)类目名称与主题对应:类目反映主题内容,一一对应。b)类目名称规范:名称应简洁、规范、通用、
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 卫生 健康 信息 数据 分类 编码 规则 WST306 2023

链接地址:https://www.desk33.com/p-919351.html