高质量呼吸音数据库建设及管理规范专家共识(完整版).docx
《高质量呼吸音数据库建设及管理规范专家共识(完整版).docx》由会员分享,可在线阅读,更多相关《高质量呼吸音数据库建设及管理规范专家共识(完整版).docx(8页珍藏版)》请在课桌文档上搜索。
1、高质量呼吸音数据库建设及管理规范专家共识(完整版)摘要人工智能(artificialintelligence,AI)进入新的发展阶段,在医疗领域,应用Al诊疗新模式和新手段建立快速精准的智能医疗体系是智慧医疗的重要发展目标。建立标准呼吸音数据库是基于医疗大数据的呼吸系统疾病辅助诊疗和家庭慢性肺部疾病管理系统研发和应用的基础。为了能规范建立高质量的呼吸音数据库,提高呼吸音Al研究的效率,促进Al大数据呼吸音研究的发展,本共识就呼吸音数据库建设,对呼吸音采集设备、采集流程、数据标准、质控要点、数据库架构和数据安全等内容进行推荐,为进一步开发Al算法研究奠定基础。关键词呼吸音;数据库;高质量;人工智
2、能肺部听诊是利用听诊器对气流通过气管支气管树产生的声音进行判断的方法,也是呼吸系统疾病筛查、诊断、评估和随访的重要工具,迄今仍无可替代。在获取临床症状的基础上增加肺部听诊可以提高诊断的敏感性1-2和准确性。传统听诊器的雏形是法国医师雷奈克(ReneLaennec)在1861年发明的。传统听诊器使用简单便捷,易于获取,医疗成本低,不依赖大型设备,无辐射,无痛苦,短时间内可以反复听诊。但传统听诊器也存在一些缺陷,包括呼吸音信息无法记录和保存,分享和交流困难,无法进行呼吸音持续监测,且呼吸音判别结果需依赖医师的临床经验和听觉感知能力,具有一定的主观性3-4o传统听诊器存在的短板问题严重阻碍了呼吸系统
3、疾病管理和监测的效能。利用电子听诊器(digitalstethoscope,DS)采集呼吸音,同时使用人工智能(artificialintelligence,AD技术进行自动分析是克服这些局限性的优化方式5-7。近年来AI技术的发展日新月异,基于医疗大数据的AI辅助决策技术已经成为迅速提高诊疗水平和拓展医疗资源的重要手段。数据、算法、算力和场景是构成Al的四要素,其中在医疗场景的Al研究中,主要依靠临床专业人员提供高质量的数据二AI通过机器学习和神经网络模型,对大量完成呼吸音标注的声音数据进行快速学习,最终实现呼吸音的自动分析。呼吸音的自动识别和分类主要分为2步:(1呼吸音数据的特征提取;(2
4、)利用提取的特征进行呼吸音的识别和分类8。AI在呼吸音领域的发展过程中,面临的主要问题是缺少可以用于研究算法并对不同算法进行比较的公共高质量大型呼吸音数据库,也是AI在呼吸音领域发展面临的主要困境。上海市医学会儿科分会呼吸学组、福建省医学会儿科分会呼吸学组和江苏省医学会儿科分会呼吸学组的儿科专家在分析国内外现有的呼吸音数据库的基础上,结合本领域的工作成果,共同制定高质量呼吸音数据库建设及管理规范专家共识,规范呼吸音采集设备、采集流程、数据标准、质控要点、数据库架构和数据安全,进而为儿童常见呼吸系统疾病,特别是下呼吸道感染、支气管哮喘为代表的标准化、规范化诊疗提供新的方法。1、呼吸音数据库的现状
5、和局限性呼吸音数据库作为重要诊疗信息的一部分,近年来有了快速发展。尤其是部分数据呈现开源共享模式,有利于不同数据的比对分析,制定统一标准,形成高质量数据库。在2017年之前,共有13个开放的公共呼吸音数据库8在临床研究中使用,其中4个是在线存储,9个是书籍附带的光盘资源,使用最广泛的是R.A.L.E.在线数据库(http:WW.rale,ca)和UnderstandingLungSOUndS(第3版)附带光盘内的呼吸音数据库,前者共有50余条儿童呼吸音数据和相关临床资料,每条时长10s:后者光盘内呼吸音数据总时长为60min。但这些呼吸音数据库的数量和种类比较有限,最初建立的目的是进行教学培训
6、,因此绝大部分是理想状态的呼吸音,并不适合用于真实环境中呼吸音数据算法模型的建立。葡萄牙和希腊的研究团队在2017年共同构建的呼吸音数据库(InternationalConferenceonBiomedicalandHealthInformatics2017,ICBHI2017)9,共纳入126例患者的920条呼吸音,其中儿童49例,每条呼吸音平均长度21.5s,获取6898个呼吸周期,1898个哮鸣音片段和8877个湿啰音片段。目前,在ICBHl2017开放的公共数据库(https:/bhichallenge.med.auth.gr)平台上,共有1864个湿啰音片段,886个哮鸣音片段和50
7、6个同时包含湿啰音和哮鸣音的片段。ICBHl2017已经成功进行了多种呼吸音Al算法模型的研究10-14,但该数据库也存在局限性,主要包括缺乏健康对照组,且均为单人标注数据,不符合金标准的标注要求,最终会影响数据库的质量。2021年,中国台湾建立了目前为止最大的呼吸音数据库HF_Lung_Vl(数量共279例,年龄均大于20岁,来自台湾地区,呼吸音数据共9765条,每条呼吸音时长15s,共包含湿啰音片段15606个,哮鸣音片段8457个和喘鸣音片段686个。但HF_Lung_Vl数据库同样存在局限性,缺乏健康对照组,其中261例患者的临床信息丢失,呼吸音数据均为单人标注。根据公共呼吸音数据库的
8、现状,现有的呼吸音数据库存在健康对照组缺乏;不同DS采集跨信道失配;数据库病例数量少,儿童呼吸音数据数量有限;呼吸音数据多为单人标注,缺乏质控,不符合“金标准”要求,精准度和可信度等明显不足,造成现有的呼吸音数据库在质和量方面均有明显缺陷,制约了AI在呼吸音领域的发展进程15-16,建立高质量的呼吸音数据库迫在眉睫,也是Al技术在本领域发展的基础。2、呼吸音数据库入库数据类型要求呼吸音AI研究主要在于呼吸音的识别和分类。呼吸音是胸部体格检查的重要体征,可以快速、准确、客观的反映疾病状态和病情变化,为临床诊治提供重要的依据。呼吸音数据是呼吸音数据库的主体部分,需力求信息完整、标注准确。2.1呼吸
9、音数据的采集设备呼吸音数据库的呼吸音数据需要通过DS采集获取。DS具有以下特点:采集的呼吸音数据通过数字信号传导,而非传统听诊器的声学振动;可以收集覆盖面更广的音频范围,进行数字信号转换;可以同步形成视觉声音图谱显示,在听到呼吸音的同时可以看见呼吸音的波形图谱,有助于对听诊技术进行调整获得更准确的听诊结果17。在呼吸音的临床研究中应用最多的听诊器是美国3M公司的LittnlannTMDS(Model3200),其他包括澳大利亚ClinicloudTMDS和美国ThinklabsTMDS。不同DS的设备参数存在差异,其中应用最多的LittnlannTMDS的声音可以放大24倍,带宽频率范围202
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 质量 呼吸 数据库 建设 管理 规范 专家 共识 完整版
链接地址:https://www.desk33.com/p-813075.html