最新:肠镜人工智能系统临床应用专家共识(完整版).docx
《最新:肠镜人工智能系统临床应用专家共识(完整版).docx》由会员分享,可在线阅读,更多相关《最新:肠镜人工智能系统临床应用专家共识(完整版).docx(22页珍藏版)》请在课桌文档上搜索。
1、最新:肠镜人工智能系统临床应用专家共识(完整版)我国结直肠癌发病率居恶性肿瘤第二位,死亡率居第四位,且2000至2016年以来,结直肠癌的发病率和死亡率呈现上升趋势。早诊早治是改善结直肠癌预后的重要手段。炎症性肠病(inflammatoryboweldisease,IBD)是一类以肠道黏膜慢性炎症反复发作且迁延不愈为主要特点的疾病,近二十年在我国发病率逐年升高。IBD的鉴别诊断、严重程度评估以及转归预测对患者的疾病精准管理具有重要意义。肠镜是检出、诊断和治疗结直肠癌及癌前病变、IBD等疾病的临床一线工具。利用肠镜可以观察结直肠黏膜,检出并切除早期结直肠癌及癌前病变。肠镜筛查项目的普及有效降低了
2、结直肠癌的发病率和死亡率。内镜有助于IBD活动度评估,为临床医师进行后续治疗方案选择提供重要依据。然而,我国肠镜仍然存在退镜时间不规范、病灶漏诊率高、内镜医师之间诊断一致性差等问题。退镜时间影响内镜医师对结直肠黏膜的检查质量,欧洲胃肠内镜协会(EuropeanSocietyforGastrointestinalEndoscopyzESGE)、美国胃肠内镜协会(AmericanSocietyforGastrointestinalEndoscopy,ASGE)均推荐肠镜退镜时间应6mino然而,据Xiang等的多中心临床研究统计,有超过80%的肠镜退镜时长不足6mino腺瘤检出率(adenomad
3、etectionrate,ADR)是肠镜质量控制的重要指标之一,ADR每增加1%,发生致死性间隔期结直肠癌的风险将降低5%o据Zhao等meta分析报道,肠镜筛查中ADR平均约为22%,但一项涉及136名胃肠病医师的调查研究发现,内镜医师之间的ADR参差不齐(7.4%52.5%),因此,亟需新的辅助工具改善肠镜的诊疗质量。人工智能(artificialintelligence,AI)是随着互联网、计算机行业的迅猛发展而取得爆炸式进展的高新技术,在医疗领域取得广泛应用。深度学习技术是AI的分支在图像识别任务中具有较强能力。近年来,中外学者就AI在肠镜的探索和应用中取得众多先进性成果,覆盖了肠镜检
4、查的方方面面,并就Al应用于临床实践的有效性、安全性开展临床试验,取得显著收效。AI设备引入临床已是箭在弦上,大势所趋。本共识旨在综合现有研究证据,为临床医师在应用肠镜AI辅助模型时提供决策参考。但它不是强制标准,也不可能包含或解决技术相关的全部临床问题。建议临床医师在面对具体患者时,应充分了解目前能够获取的最佳临床证据,结合患者病情和治疗意愿,结合自己的专业知识、临床经验和可获得的医疗资源,综合制定临床决策。本共识基于PICO(participants,interventions,comparisons,outcomes)原则提出陈述意见,参考GRADE(gradingofrecommend
5、ations,assessment,development,andevaluation)系统对证据质量(表1)和推荐强度(表2)进行分级,采用改良Delphi方法由专家投票表决达成共识:完全同意;同意,有较小保留意见;同意,有较大保留意见;不同意。其中,投票表决意见中+比例80%属于达成共识,共识水平以表决意见中的+比例表示。最终本共识达成80%以上共识水平的推荐意见共9大类12项表3)。随着以后更多消化内镜Al相关文献发表,本共识将进一步更新,以期未来在统一诊断标准下实现AI辅助下的肠镜的早诊、早治,以及制定更加准确的治疗策略。表1证据质量的推荐分级评估、制定和评价证据质等定义量级高等质非常
6、确信估计的效应值接近真实效应值,进一步研究也A量不可能改变其可信度中等质对估计的效应值确信度中等,其有可能接近真实效应B量值,进一步研究有可能改变其可信度低等质对估计的效应值确信度有限,其与真实效应值可能大不C量相同,进一步研究极有可能改变其可信度很低等对估计的效应值几乎没有信心,其与真实效应值很可能D质量完全不同,对其的彳到可估计都很不确定表2推荐强度分级推荐定义强度明确显示干预措施利大于弊或者弊大于利,在大多数情况下适强用于大多数患者利弊不确定,或无论质量高低证据均显示利弊适当,适用于很弱多患者,但根据患者价值观与偏好性会有差异表3肠镜人工智能系统临床应用专家共识陈述汇总证据推荐共识推荐意
7、见质量强度水平一、术前肠道清洁度评估陈述1:对于接受肠镜检查的患者,推荐使用AIA强95.4辅助术前肠道准备评估5%二、术中肠道清洁度评估陈述2:对于接受肠镜检查的患者,推荐使用AIC强90.9辅助术中肠道准备评估1%三、肠镜质量控制陈述3:对于接受肠镜检查的患者,推荐使用AIA强95.4辅助统计盲肠插镜率5%陈述4:在退镜过程中,推荐使用AI辅助计算退A强95.4镜时间5%陈述5:对于接受肠镜检查的患者,推荐使用CA强86.3AQ提高ADR6%四、肠镜息肉识别陈述6:对于接受肠镜检查的患者,推荐使用CADe提高ADRA强86.36%陈述7:同时使用CAQ和CADe相匕弹独使用CADe可以进一
8、步提升ADR才隹荐在肠镜检查中同时使用CAQ和CADeA强95.45%五、肠镜下息肉分型陈述8:对于5mm的结直肠息肉,推荐使用AI预测息肉病理性质以辅助诊疗决策B强81.82%六、肠癌浸润深度预测陈述9:对怀疑存在黏膜下浸润的结直肠息肉,推荐使用AI预测其浸润深度B强86.36%七、炎症性肠病诊断陈述10:对怀疑炎症性肠病的患者,推荐使用AI辅助进行内镜下诊断C强86.36%八、溃疡性结肠炎内镜下活动度评估陈述11:对确诊溃疡性结肠炎的患者,推荐使用AI辅助进行内镜下活动度评估B强90.91%九、模型可解释性陈述12:可解释性的多模态AI模型性能优于传统Al模型,推荐优先使用具备可解释性的多
9、模B强90.91%态AI模型注:AI指人工智能;CAQ指计算机辅助质量控制;ADR指腺瘤检出率;CADe计算机辅助息肉检测一.肠镜Al系统功能(一)术前肠道清洁度评估陈述1:对于接受肠镜检查的患者,推荐使用AI辅助术前肠道准备评估。(证据质量:A;推荐强度:强;共识水平:95.45%)充分的肠道准备是肠镜发现腺瘤和预防结直肠癌的关键。在常规实践中,结肠镜检查前的肠道准备评估主要由患者自己进行。然而,患者独立评估可能由于宣教程度不足或主观性等因素导致评估不够准确,进而导致患者在肠道准备不充分的情况下接受结肠镜检查。1.u等通过随机对照临床试验比较了患者自评和AI术前肠道准备评估的效果,两组的波士
10、顿肠道准备评分(Bostonbowelpreparationscale,BBPS)、息肉检测率(polypdetectionrate,PDR)和ADR都相似。Zhu等开发了一款基于Al利用厕所粪便的照片预测患者肠道准备质量的智能手机应用程序,预测准确率达到95.15%,且在随机临床试验中,AI组充分肠道准备的患者占比(88.54比65.59%,AO.001)、BBPS总评分(6.741.25)分比(5.971.81)分,P0.001,饮食限制遵从率(93.68%比83.81%,Ao.001)和泻药指令遵从率(96.05%比84.62%,P0.001)方面均明显优于对照组,显著提高了患者依从性。
11、根据现有研究AI有潜力在临床实践中替代患者自评,改进现有的术前肠道准备评估。(二)术中肠道清洁度评估陈述2:对于接受肠镜检查的患者,推荐使用AI辅助术中肠道准备评估。(证据质量:C;推荐强度:强;共识水平:90.91%)良好的肠道清洁是保证肠黏膜有效观察的前提。肠道准备不充分会导致腺瘤漏诊率升高等多种不良结果。不准确的肠道准备评估可能导致结肠镜复查周期不必要地缩短,从而增加成本和并发症风险,或不当地延长复查周期,增加癌症风险。因此,指南建议准确地识别肠道准备不充分患者,并推荐这些患者接受肠镜复查以确保肠镜检查的有效性。Wang等利用119个视频中获取的10118张图像,建立基于U-NET卷积网
12、络体系结构的深度学习模型,以实现对粪便污染部分的自动分割,AI标记区占人工标记区域的94.7%0.67%,每张图片的分割仅用时03634so1.ee等使用来自200个结肠镜检查的73304张图像开发AI肠道准备评估模型,模型评估肠道准备不足的灵敏度为100%,医师评估者之间的一致性为68.9%,而评估者和AI的一致性为89.7%oZhou等回顾性地收集5583张肠镜检查图像以训练系统,然后通过人机竞赛将其性能与内镜医师进行比较,其准确率优于所有内镜医师。Zhou等开发了一种基于深度学习的自动波士顿肠道准备评分(automaticBBPS,e-BBPS)系统,该系统评分与ADR显著负相关(P=-
13、0.976,P3分的患者ADR明显低于e-BBPS3分的患者(15.93%比28.03%,A0.001)。(三)肠镜质量控制陈述3对于接受肠镜检查的患者推荐使用AI辅助统计盲肠插镜率。(证据质量:A;推荐强度:强;共识水平:95.45%)陈述4:在退镜过程中,推荐使用AI辅助计算退镜时间。(证据质量:A;推荐强度:强;共识水平:95.45%)陈述5:对于接受肠镜检查的患者,推荐使用计算机辅助质量控制(computeraidedqualitycontrol,CAQ)提高ADRo(证据质量:A;推荐强度:强;共识水平:86.36%)盲肠插镜是完全结肠镜检查的先决条件,充足的退镜时间是全面黏膜检查的
14、前提,二者与间隔期结直肠癌风险高度相关。ADR是结肠镜检查质量控制的重要指标,研究表明ADR每提高1%,可使间隔期结直肠癌风险降低3%,结直肠癌死亡率降低6%o良好的结肠镜质量控制要求达盲率90%,退镜检查时间6min,ADR25%在肠镜退镜过程中,退镜时间过短、退镜速度过快、滑镜、肠壁黏膜褶皱会导致结肠镜检查时出现盲区和漏诊的情况从而影响ADRoASGE指南建议结肠镜退镜时间为610min,中国早期结直肠癌筛查及内镜诊治指南(2014年,北京)建议的退镜时间应不少于6mino然而,尽管指南对肠镜退镜进行了明确规范,在实际临床实践中,由于缺乏有效监管和实用的监督工具,加上我国患者数量庞大,现有
15、内镜医师数量不能满足日益增长的结肠镜检查需求,肠镜退镜质量往往达不到指南规定标准。目前关于AI在肠镜退镜质量控制方面的研究日益增加。Gong等利用20000多张结肠镜图像通过VGG-16和感知哈希算法构建了一个CAQ系统,以实时监测盲肠插镜、退镜速度及退镜时间,并提醒内镜医师因滑镜而引起的盲区;随后该团队招募791例患者进行随机对照临床试验发现Al辅助组的ADR16.34%期显高于对照组(7.74%)。Yao等在此研究基础上研发一个质量控制系统,该系统对接医院医疗信息管理系统服务端、内镜洗消追溯系统服务端、病理信息检索系统服务端数据库所存储的原始医疗数据作为输入,在后台完成对原始数据的统计、分
16、析,再将统计、分析结果作为输出展示到前端界面,可实现包括达盲率及未达盲原因核验报告、ADR、PDRx退镜时间、肠道准备成功比例、肠癌检出率、平均采图张数等核心质量控制指标的自动评估。前后自身平行对照研究显示,在该系统辅助下的内镜医师的各项结肠镜核心评价指标均有上升,而对照组不论是在检出率、达盲率、退镜速度等方面均没有明显改善。Su等基于卷积神经网络开发结合息肉识别与退镜监控功能的CAQ系统,并发现该系统在实际临床环境中可延长退镜时间,提高ADRo除退镜时间与退镜速度外,肠道黏膜褶皱的完整观察对减少肠镜检查盲区、提高ADR也至关重要。1.iU等基于AI开发一种用于评估结肠镜退镜中黏膜褶皱检查质量
17、的系统,该系统对肠镜黏膜褶皱检查质量的评估与结肠镜专家的评分之间存在很强的相关性,可以通过实时质量分析提醒内镜医师进行相关操作以更全面地检查黏膜褶皱,减少结肠镜检查期间的盲区。CAQ系统可以在内镜医师做检查时,实时监测退镜速度和黏膜褶皱检查情况并反馈给操作医师,保证退镜时间和速度,从而保证肠镜操作质量,减少病变漏诊;并在一定程度上缩小不同水平内镜医师技术上的差异,改善我国现阶段高水平内镜医师短缺且诊疗水平参差不齐的现状。(四)肠镜息肉识别陈述6:对于接受肠镜检查的患者,推荐使用计算机辅助息肉检测(computeraidedpolypdetection,CADe)系统提高ADRo(证据质量:A;
18、推荐强度:强;共识水平:86.36%)陈述7:同时使用CAQ和CADe相比单独使用CADe可以进一步提升ADR,推荐在肠镜检查中同时使用CAQ和CADeo(证据质量:A;推荐强度:强;共识水平:95.45%)肠镜检查是目前检测息肉的主要方法。通过肠镜检查发现和切除腺瘤性息肉已被证明可有效预防结直肠癌,但由于视觉模式、疲劳等原因,医师可能漏掉出现在视野内的息肉,导致间隔期结直肠癌风险。近年来,研究者们开发了CADe系统以解决视野内息肉漏诊的问题。Wang等在一项随机对照临床试验中纳入1058例患者(536例患者接受普通肠镜检查,522例患者接受CADe系统辅助肠镜检查),CADe组相比对照组拥有
19、更高的ADR(29.1%tt20.3%)oRepici等开展了类似的非盲随机对照临床研究,发现CADe组的ADR为54.8%,明显优于对照组的40.4%,证实CADe在西方人群中的有效性。Wang等随后开展了一项双盲随机对照临床试验,其中患者被随机分为假辅助组(n=478)或CADe组(n=484),结果显示CADe组的ADR为34%,优于假辅助组的28%oBarua等纳入了5项随机对照临床研究(共4311例患者方得出结论使用CADe系统辅助肠镜检查的ADR(29.6%)明显优于无辅助肠镜检查(19.3%)。不少研究已经证明CADe系统在随机对照环境中检测息肉和腺瘤的优越性。然而,其有效性最近
20、也受到质疑。1.eVy等比较在他们的大容量中心引入CADe(GIGenius,美国Medtronic)前后6个月期间腺瘤和息肉检出率,发现CADe反而降低了内镜医师的ADR(30.3%比35.2%,0.001)和PDR(36.5%比40.9%,P=O.004)。Wei等为进一步探索CADe在非实验环境中的真实影响,在社区中开展一项多中心随机临床研究,发现CADe组和非CADe组每次结肠镜的腺瘤检出数并无显著差异(0.73个比0.67个,P=0.496)o1.adabaum等采用历史对照与同期对照比较引入CADe前后3个月内镜医师的ADR,发现CADe对ADR的影响并无统计学意义(OR=1.14
21、,95%C:0.83-1.56,P=O.41)。为了最大化地发挥CADe的作用,或许需要结合包括退镜速度监控、黏膜暴露实时评估在内的多维Al功能,以促进高质量的肠镜检查。此外,CADe技术的一个显著局限性是可能具有很高的误报率,即假阳性率。尽管Wang等和1.ui等实验中的误报率较低,但Hassan等报告共1092次误报,平均每例结肠镜检查27.3次。尽管CADe的假阳性已经引起关注,但目前还未发现CADe假阳性率对于内镜医师的负面影响,未来仍需进一步探究以确保CADe临床应用的安全性。Areia等使用Markov模型对CADe进行经济效益评估,并发现CADe能够将每个肠镜筛查患者的成本从34
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 最新 人工智能 系统 临床 应用 专家 共识 完整版

链接地址:https://www.desk33.com/p-1427122.html