2024上消化道内镜人工智能系统临床应用专家共识(完整版).docx
《2024上消化道内镜人工智能系统临床应用专家共识(完整版).docx》由会员分享,可在线阅读,更多相关《2024上消化道内镜人工智能系统临床应用专家共识(完整版).docx(19页珍藏版)》请在课桌文档上搜索。
1、2024上消化道内镜人工智能系统临床应用专家共识(完整版)食管癌和胃癌是严重危害我国患者生命健康的重大疾病,早诊早治是改善其预后及生活质量的主要策略。止匕外,消化道癌前病变如萎缩性胃炎、胃黏膜肠上皮化生,以及消化道危急重症如食管胃静脉曲张亦于临床十分常见,对此类疾病早期、准确的诊断有益于保障患者生命健康安全,具有重要意义。食管胃十二指肠内镜(esophagogastroduodenoscope,EGD)是诊断上消化道肿瘤、上消化道癌前病变及危急重疾病的临床一线工具,利用白光内镜、图像增强内镜、化学染色等方式,可早期发现上消化道肿瘤及癌前病变,阻止疾病的进展,亦可准确诊断食管胃静脉曲张等危急重疾
2、病,并针对以上疾病进行镜下分级,支撑临床医师进行后续治疗方案的决策。然而,在我国消化疾病诊疗领域,仍长期存在早期消化道肿瘤及癌前病变漏诊率居高不下、非肿瘤性病变诊断一致性差等问题。程树红等分析93例早期胃癌数据,发现早期胃癌漏诊率高达37.63%;赵书阳等分析297例反复长期出现上消化道症状的患者资料,经病理检查发现199例早期胃癌及癌前病变而常规EGD检查漏诊了其中的98例,漏诊率近50%,即使在应用放大染色内镜后漏诊率仍有6%o另有一项研究收集370例病理证实胃癌前病变患者,发现上述患者EGD下漏诊或可疑漏诊率达31.67%o据调查,我国2012年有超过6000家医疗机构开展消化内镜诊疗,
3、全年开展消化内镜诊疗接近3000万例,而消化内镜医师不足3万人,占全部注册执业医师的1%,每100万人口拥有消化内镜医师不足20人。随着技术的快速推广和人民群众健康需求的提升,尽管我国近年来消化内镜诊疗机构数量和诊疗量飞速上升,但医患比例的绝对不均衡现象依然严峻。因此,亟须探索内镜诊疗领域的新技术、新应用,以助解决我国消化内镜诊疗的上述关键性问题。人工智能(artificialintelligence,AI)技术是指模拟人类智慧的技术和方法,其核心目标是使机器能够执行通常需要人类智慧的任务,近年来在医疗领域广泛应用。深度学习技术是AI的分支,在图像识别任务中具有较强能力。近年来,中外学者就AI
4、在EGD的探索和应用中取得众多先进性成果,覆盖了EGD检查的方方面面,并就AI应用于临床实践的有效性、安全性开展临床试验,收效显著,引发国内外专家学者对AI进入真实医疗环境的讨论和思考,并提出众多积极的建议和展望。Al设备引入临床已是大势所趋。本共识旨在综合现有研究证据,为临床医师在应用EGDAI辅助模型时提供决策参考。本共识并非强制性标准,无法涵盖或解决所有技术相关的临床问题。建议临床医师在面对具体患者时,应充分了解目前能够获取的最佳临床证据,结合患者病情和治疗意愿,根据自己的专业知识、临床经验和可获得的医疗资源,制定临床决策。本共识基于PICO(participants,intervent
5、ions,comparisons,outcomes)原则提出陈述意见,参考GRADE(gradingofrecommendations,assessment,development,andevaluation)系统对证据质量(表1)和推荐强度(表2)进行分级。采用改良Delphi方法由专家投票表决达成共识:(1)完全同意;(2)同意,有较小保留意见;(3)同意,有较大保留意见;(4)不同意。投票表决意见中(1)+(2)比例80%属于达成共识,共识水平以表决意见中的(1)+(2)比例表示。最终,本共识最终达成80%以上共识水平的推荐意见共13项(表3)。表1证据质量的推荐分级评估、制定和评价证据
6、质等定义量级高等质非常确信估计的效应值接近真实效应值,进一步研究也A量不可能改变其可信度中等质对估计的效应值确信度中等,其有可能接近真实效应B量值,进一步研究有可能改变其可信度低等质对估计的效应值确信度有限,其与真实效应值可能大不C量相同,进一步研究极有可能改变其可信度很低等对估计的效应值几乎没有信心,其与真实效应值很可能D质量完全不同,对其的任可估计者B很不确定表2推荐强度分级推荐定义强度明确显示干预措施利大于弊或者弊大于利,在大多数情况下适强用于大多数患者利弊不确定,或无论质量高低证据均显示利弊适当,适用于很弱多患者,但根据患者价值观与偏好性会有差异表3上消化道内镜人工智能系统临床应用专家
7、共识陈述汇总k证据推荐共织推存除质果强度水平陈述1:对广需费接受EGD检代的患者.推称将Al辅助EGD检代时间作为质状控制IH95.45%陈述2:对于需要接受EGD检者的患*.椎样招AI辅助IiK位测作为质状控制工具A强100.00%陈述3:推荐在ECD检件中使用AI实时辅助发现食管舁常病灶C强95.45%陈述4:推荐而巴甯特食管患并使川Al辅助测出相愣分C强86.36%陈述5:对怀StH期食管&状缰眼密或以期食管赧施的志卷.均推荐使用AIiS行辅助诊断C强95.45%陈述6:中于未获母代理浸润深度的早期食臂Ift患#.建汉在川辅助FfS测是否发生懿兼卜200Am以上的浸树C强90.91%陈述
8、7:财干肝硬化患力.推荐临床使用Al辅助内摊下食竹H静脓曲张识别C强95.45%陈述8:财广编珍优W臼静脉曲*的患在.HT在使川Alle助内债Frtlft程度分级C强95.45%陈述9:建议在雷规EGD检件中使用AI实时辅助发现胃舁常嫡灶C强90.91%陈述10:对于禽螯接受EGD检传的患者.推吞使用AlIll助目炎诊断C强95.45%陈述11:时于怀疑M期胃艺的患者.推荐帙床应用Al助诊断H强90.91%陈述12:对于怀疑不期同蟾并需饕接受内摊钻腴卜剁离术或行足联学活检的患界.建议在Al情助卜进行范阳标定C强90.91%陈述13:可解脩性Al帙整性能和侯师接受度优于传统AleSP,推荐优先使
9、用典备可解耗性的AleJ型C强95.45%注:EeD指食管巴I.指析内愉:Al指人r智能一、EGDAI辅助系统功能(一)AI辅助EGD检查时间统计01陈述1:对于需要接受EGD检查的患者,推荐将AI辅助EGD检查时间作为质量控制工具。(证据质量:A,推荐强度:强,共识水平:95.45%)EGD是检出早期上消化道肿瘤的重要手段。EGD的检查时间指内镜从插管到拔管,对食管、胃和十二指肠的观察时间。为了保证EGD的检查质量,欧洲胃肠内镜学会等协会提出标准的EGD检查时间作为质量控制规范,指南建议EGD检查时间应不少于7mino由于临床诊疗环节复杂、诊疗任务繁重,并且缺乏经济有效的质量控制方式,目前很
10、难对EGD检查时间进行严格监测。近年来,基于深度学习的AI技术不断发展,并在医学图像识别领域取得重大进展,其图像处理与识别的高效性有助于AI技术在胃肠内镜质量控制中的应用,可实现低成本、高效率的EGD检查时间监测。Yu等和Wu等均通过构建深度学习模型实现了EGD检查过程中准确实时地识别解剖位置并记录EGD检查时间。Wu等构建的深度学习模型在107个真实EGD视频中正确预测93.46%视频的检查开始时间和97.20%视频的检查结束时间。(=)AI辅助盲区监测陈述2:对于需要接受EGD检杳的患者,推荐将AI辅助盲区监测作为质量控制工具。(证据质量:A,推荐强度:强,共识水平:100.00%)高质量
11、EGD检查是上消化道肿瘤早诊早治的关键。英国胃肠病学会和欧洲胃肠内镜学会等均建议在EGD检查中对上消化道进行系统性观察,通过减少盲区来降低肿瘤漏诊率。受限于内镜医师操作水平和对解剖部位的认知差异,容易出现检查部位覆盖不全的问题,且缺乏有效的EGD质量控制和评估体系。近年来,AI迅速发展,可通过深度学习对数据、图像等快速自动识别和分析,目前Al在EGD检查中部位识别、减少检查盲区有了较大进展。2018年Takiyama等构建基于深度卷积神经网络的部位识别系统,共纳入27335张EGD白光图片,将上消化道分为喉、食管、胃和十二指肠,其中胃又分为上部、中部和下部,然后用17081张图片验证其部位识别
12、的能力,结果显示该系统自动识别上消化道各个解剖部位的整体准确率为97%o然而该研究仅针对静态图片的部位进行评估,并不能反应Al在实时视频状态下的检测性能。Wu等研发的WISENSE系统利用深度学习技术,基于欧洲胃肠内镜学会EGD操作指南和日本EGD系统筛查方案,将上消化道分为26个部位,并实现实时状态下识别EGD解剖部位。基于该模型,该团队开展了单中心随机对照研究以评价WISENSE对EGD检查质量的影响。该研究共招募324例EGD检查患者(WISENSE辅助组153例,对照组150例),WISENSE辅助组的盲区率显著低于对照组(5.86%比22.46%,0.001)o随后,为验证该模型在不
13、同EGD检查类型中的效果,该团队完成了一项3组随机平行对照研究,结果显示,AI辅助下常规、无痛和超细EGD检查的盲区率均低于对照组(无痛EGD组:3.42%比22.46,P0.001;超细EGD组:21.77%比29.92%,0.001;常规EGD组:31.23%比42.46%,Ao.001)o此外,多中心随机对照研究的结果再次验证了AI辅助EGD检查可减少盲区。综上,AI在临床实践中可作为辅助监督工具,通过实时识别部位反馈盲区,提醒内镜医师规范操作减少检查部位的遗漏监督和提高EGD检查质量。(三)AI辅助食管异常病灶识别陈述3:推荐在EGD检查中使用AI实时辅助发现食管异常病灶。(证据质量:
14、Cz推荐强度:强,共识水平:95.45%)食管异常病灶主要包含食管癌、食管癌前病变和其他食管良性病变(食管炎、食管胃黏膜异位和静脉瘤等)。我国每年因食管癌死亡人数超过10万。我国食管癌以鳞状细胞癌为主要病理类型,占比超过90%,以巴雷特食管为前驱病变的食管腺癌在西方较为多发,但也是我国食管癌的主要病理类型之一。早期发现并切除食管癌及癌前病变,可有效改善患者预后,但食管癌前病变及早期癌病变黏膜改变轻微,诊断困难。因此利用AI辅助检出早期食管癌及其癌前病变具有重要意义。GUo等进行多中心的样本收集,使用AI检测癌前病变及早期食管鳞状细胞癌、食管胃静脉曲张、食管炎、食管胃黏膜异位等多种食管异常病灶,
15、其模型在图像测试中的灵敏度为98.04%,特异度为95.03%Liu等进行多中心的样本收集,构建AI模型在白光下检测早期食管鳞状细胞癌。其模型在内部和外部图像测试中检测早期食管鳞状细胞癌的准确率分别为85.7%和84.5%为了进一步拓展图像模态,Yuan等使用AI在白光内镜、碘染、放大内镜窄带光成像(ME-NBI)x窄带光成像(NBI)多种内镜成像模式下检测早期食管鳞状细胞癌。模型在不同内镜成像模式下均取得了较好的诊断性能,在白光下识别食管鳞状细胞癌的准确率、灵敏度和特异度分别为82%、90%和74%;在NBI或碘染下识别食管鳞状细胞癌的准确率、灵敏度和特异度分别为86%、93%和80%,与经
16、验丰富的内镜医师诊断性能相似。Pan等利用白光、NBI图像开发了两个全卷积神经网络分别分割胃食管交界处和鳞柱状交界处,交并比(IoU)分别为0.56和0.82,该方法优于使用单个深度学习网络的传统方法,可以更好地对巴雷特食管识别和分割。Horie等使用AI同时检测食管鳞状细胞癌和食管腺癌,该模型灵敏度为98%,阳性预测值为40%o(四)Al辅助巴雷特食管测量和评分陈述4:推荐对巴雷特食管患者使用AI辅助测量和评分。(证据质量:C,推荐强度:强,共识水平:86.36%)巴雷特食管是一种癌前病变,巴雷特食管3cm的患者每年进展为腺癌的比率(025%)显著高于巴雷特食管3cm的患者(0.07%)。因
17、此,指南建议根据巴雷特食管长度确定监测间隔。布拉格C&M分类基于内镜下可见的食管柱状黏膜的整个环状上移的长度(C)和上移最大长度(M)对巴雷特食管进行分级,已被美国、欧盟和英国等多指南推荐作为确定内镜监测间隔的风险分层工具。Ali等利用白光、NBI图像训练AI模型进行巴雷特食管范围测量,视频测试中,C和M以及岛状黏膜测量平均精度97.2%,边界平均偏差为0.9mm,而巴雷特食管上皮测量精度98.4%,与真实值平均偏差仅为0.4Cm2,系统提供的C和M测量值与专家评分一致,C和M评分的边界总体相对误差(平均差)分别为8%(3.6mm)和7%(2.8mm)。(五)AI辅助早期食管癌诊断陈述5:对怀
18、疑早期食管鳞状细胞癌或早期食管腺癌的患者,均推荐使用AI进行辅助诊断。(证据质量:C,推荐强度:强,共识水平:95.45%)食管癌患者的生存时间与其临床分期密切相关,实现食管癌早诊早治,可以大幅度改善患者预后。然而由于早期食管癌病变范围较小,内镜下形态学表现与一些良性疾病及癌前病变鉴别困难,不同年资、经验的内镜医师诊断水平差异较大,对病变的性质、范围、浸润深度、分化情况认识不足,使早期食管癌容易漏诊。OhmOri等进行了一项单中心、回顾性的临床试验,使用Al在不同内镜成像下对食管鳞状细胞癌与食管炎、血管异常、轻度色素沉着、糖原性棘皮病等良性病变进行鉴别诊断。AI在NBI及蓝光成像(BLI)图像
19、测试中的灵敏度、特异度和准确率分别为100%、63%和77%,在白光中的灵敏度、特异度和准确率分别为90%、76%和81%在MENBI及BLl中的灵敏度、特异度和准确率分别为98%、56%和77%oTang等、Cai等以及Li等均对早期食管鳞状细胞癌与非癌鉴别诊断功能进行了辅助阅片验证,在AI的辅助下,内镜医师的诊断准确率、灵敏度、特异度均显著升高。Liu等进行了一项多中心临床试验,在白光下使用AI检测和描绘早期食管鳞状细胞癌的边界,AI模型、高级内镜医师(拥有4年内镜操作经验)和专家内镜医师(拥有8年内镜操作经验)划定边界的准确率分别为98.1%、78.6%和95.3%,Al模型与内镜专家的
20、性能相似,优于高级内镜医师。在巴雷特食管患者内镜筛查和监测过程中,西雅图活检方案建议每12cm进行1次四象限活检。然而,采样误差可能会限制其灵敏度,特别是对于长段巴雷特食管黏膜内的小区域癌症或不典型增生。止匕外,食管腺癌或不典型增生常呈扁平状,难以与周围的非不典型增生巴雷特食管黏膜区分。内镜医师常常未对长节段巴雷特食管进行广泛活检,亦增加癌症漏诊的风险。vanderSommen等基于44例巴雷特食管患者的100张图像开发了一种用于检测巴雷特食管早期肿瘤性病变的深度学习模型,图片测试中该系统的灵敏度和特异度均为0.83,在以患者为单位的测试集中,灵敏度和特异度分别为086和0.87。deGroo
21、f等前瞻性收集40例肿瘤性巴雷特食管病变和20例无不典型增生巴雷特食管白光图像,构建模型识别肿瘤性病变,准确率、灵敏度和特异度分别为92%、95%和85%,识别正确的案例中,89.5%案例模型标记区域位于专家标注范围内。deGroof等进行了一项多中心、回顾性的临床研究,基于5个白光数据集训练并验证了一个计算机辅助检测(CAD)系统,CAD系统将图像分类为包含肿瘤或无不典型增生巴雷特食管,分别在两个数据集(数据集4,数据集5)中进行图像外部验证,在数据集4中准确率为89%,灵敏度为90%,特异度为88%o在数据集5中,CAD系统与普通内镜医师的准确率分别为88%和73%,灵敏度为93%和72%
22、,特异度为83%和74%CAD系统准确率优于所有53名非专家内镜医师。数据集4和5中,CAD系统检测的肿瘤区域与专家识别的区域均重叠。CAD系统在97%数据集4)和92%(数据集5)的病例中检测到了肿瘤活检的最佳部位。deGroof等在另一项单中心前瞻性研究中,验证基于白光图像构建无不典型增生巴雷特食管和巴雷特食管肿瘤性病变鉴别模型,以每2cm巴雷特食管上皮的白光图像作为一个水平,对CAD系统进行验证,其准确率、灵敏度和特异度分别为90%、91%和89%o(六)AI辅助食管癌浸润深度预测陈述6:对于未获得病理浸润深度的早期食管癌患者,建议在AI辅助下预测是否发生黏膜下200m以上的浸润。(证据
23、质量:C,推荐强度:强,共识水平:90.91%)食管癌浸润深度与其淋巴转移风险和预后紧密相关。指南规定对于浸润至上皮层、黏膜固有层、黏膜肌层以及黏膜下层200m以内(SMl)的食管癌患者,由于发生淋巴结转移风险较小,在不伴脉管瘤栓或神经侵犯、不伴食管周围区域淋巴结肿大的情况下推荐行内镜切除术,而浸润至黏膜下200m以上(SM23)的食管癌患者应进行外科手术治疗。因此,准确预测食管癌浸润深度是改善患者预后并避免过度诊疗的关键。Tokai等基于白光内镜收集日本肿瘤研究所1751例食管鳞状细胞癌患者的内镜图像构建AI模型,用于判断浸润深度。该模型对食管鳞状细胞癌浸润深度的预测准确率为80.9%,准确
24、率评分超过92%的内镜医师。Uema等和Nakagawa等构建的AI系统区分SM1和SM23的食管鳞状细胞癌的灵敏度为90.1%,特异度为95.8%,准确率为91.0%,与经验丰富内镜医师的性能相当。对于食管腺癌的患者,Ebigbo等利用多中心、回顾性收集的巴雷特食管相关食管癌的白光图像构建浸润深度分型模型,AI区分黏膜癌和黏膜下癌的准确率、灵敏度和特异度分别为71%、77%和64%,表现出与内镜专家相似的诊断性能。()AI辅助食管胃静脉曲张识别陈述7:对于肝硬化患者,推荐临床使用AI辅助内镜下食管胃静脉曲张识别。(证据质量:C,推荐强度:强,共识水平:95.45%)食管胃静脉曲张破裂出血是肝
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2024 消化道 人工智能 系统 临床 应用 专家 共识 完整版
链接地址:https://www.desk33.com/p-1220008.html