【优秀论文】美国人工智能医疗器械监督管理与应用分析时间: 2024-08-05 08:01:04 | 作者: hth平台官网 |
|
发布日期:2024-08-05 08:01:04 | |
近年来人工智能医疗器械发展迅速,美国在该类型器械的注册审批与监管制度建设上全球领先。本研究对美国食品药品监督管理局人工智能医疗器械监督管理制度和已上市产品的审批与应用情况做分析,发现美国正在探索创新管理制度,希望通过对上市后真实世界数据的利用,加快产品上市速度、加强产品全生命周期监管。美国该领域发展虽仍处于起步阶段,但已有多个类型的人工智能产品上市,用于对癌症、心脑血管、骨折、眼科等疾病的监测、诊断与检验。从头开始和实质等同是主要上市途径,产品性能测试与临床效果评价方法较为多样,审批经验逐渐积累。
近年来,人工智能技术在医疗器械领域的应用发展迅速,为多种疾病的诊断、慢性病的监测与管理提供了更为高效的技术手段
,而人工智能医疗器械的注册审批是决定该技术能否产品化、获得市场准入并进行规模化临床应用的前提条件。不同于传统医疗器械,人工智能医疗器械具有迭代速度快、算法可释性差、对诊疗影响较大等特点,产品审批涉及产品划分、算法评估、临床评价、数据处理等多方面内容,难度较大,对管理机构和人员在审批途径、方法、指标等方面的选择提出挑战
。2017年8月,美国出台《数字健康创新行动计划》(Digital Health Innovation Action Plan),提出要鼓励创新,提高管理效率,实现监管现代化
。作为医疗器械的监管机构,美国食品 药品监督管理局(Food and Drug Administration, FDA)认为传统审批程序不能很好适用于人工智能医疗器械产品,计划通过开展软件预认证试点项目等改革探索,创新审批模式,提高对产品上市后真实世界数据的利用效率,为上市前审批创造较为宽松的空间,并在上市后持续保障产品的安全、有效
。与此同时,FDA针对人工智能医疗器械传统途径审批也已展开,多种用途产品陆续上市,已积累一定审批经验。本研究旨在通过对FDA人工智能医疗器械准入制度的改革创新和已上市产品审批与应用的分析,总结前沿监管思路与方法,以期为我国行政管理部门和制造商对人工智能医疗器械产品的监督与管理提供参考。
1976年美国通过《医疗器械修正案》(Medical Device Amendments)
,提出对医疗器械上市前和上市后监管的理念,建立了以产品风险为依据的医疗器械分类管理制度, 将医疗器械按照风险程度分为Ⅰ—Ⅲ类
。FDA对Ⅰ类低风险产品实行一般控制,除极少数产品外,大多数Ⅰ类产品仅需备案管理,而不需要进行上市前通告 [510(k)] ;Ⅱ类为中等风险产品,FDA 对其实施特殊控制,需要进行510(k)审批,将拟申报医疗器械与已上市的参照器械在功能、性能、技术等方面进行对比,通过实质等同证明申报器械的安全性和有效性,从而获准上市,也有少量Ⅱ类产品可豁免510(k);对于Ⅲ类高风险医疗器械,FDA则要求制造商进行更为严格的上市前审批(Premarket Approval Application,PMA
从头开始(De Novo)通道是FDA针对高风险以外的医疗器械新品种提供的审批通道,设立于1997年,同 510(k)与PMA一样,依据法律框架《联邦食品、药品 和化妆品法案》(Food Drug & Cosmetic Act)下的条款513(f)(2)设立
。FDA规定企业进行 510(k)申请时,在收到没有实质等同(No Substantial Equivalence,NSE)通知的30天内,可以提交De Novo申请,请FDA对器械进行风险评估并分类,按照实际风险类型的要求进行审批。FDA会对产品使用的收益和风险进行衡量,给出是否通过的决定
,如果De Novo被批准,不仅该器械会被允许在美国市场销售,还会随之建立一个医疗器械新类型,后续同类产品则可以使用该分类以510(k)途径进行上市前申请
。在此通道设立前,无论产品风险高低,只要已上市产品中不存在相同类型,就需要提交Ⅲ类器械的PMA申请。De Novo通道的设立加快了中低风险创新医疗器械的审批效率,降低了产品的上市成本。2016 年,根据美国《21世纪治愈法案》(21st Century Cures Act
的新规定,制造商可自行就是否存在同类型上市产品做出判断,不再需要提前获得FDA的NSE即可提交De Novo申请。
为应对人工智能软件快速持续学习、不断进化等特性所带来的监管挑战,FDA于2017年启动了软件预认证试点项目,提出将尝试建立基于制造商质量与组织卓越文化(Culture of Quality and Organizational Excellence,CQOE) 的审批模式,作为完全基于产品的传统审批模式的选择性补充(图 1)。该项目旨在通过对制造商及其产品上市后表 现及管理行为的收集,评估制造商是否已建立CQOE,能否做到保障软件在全生命周期内的安全、有效
。2017年FDA已从100家制造商中选出9家参与首期项目,其中包括苹果、罗氏、Fitbit、强生等,并着手进行更多制造商的评选
2019年,FDA公布软件预认证试点项目1.0版工作模型,根据流程,FDA将先对软件制造商的卓越性进行评价,从企业资源、用户使用、学习与成长和管理过程四个角度评价企业在患者安全、产品质量、临床责任、网络安全责任和前瞻性文化五个方面的管理水平和既往表现,评价问题多达140余项。经认可的制造商也将被分为两级,具有卓越文化且软件监管经验较多的制造商被评为二级,其低风险和中等风险产品不再需进行FDA上市审批;而具有卓越文化但软件监管经验较少的制造商为一级,仅低风险产品不需要审批。
经认可制造商仍需要审批的产品将通过流程化程序进行审批,FDA将参考制造商在CQOE评估中提交的产品资 料,结合制造商在证明产品分析性能、临床表现和安全性 测量方面提交的材料,给出最终审批决定。FDA希望在流程化审批中更早介入与制造商的互动以提高审批效率,缩短上市所需时间。
预认证项目框架另一特点在于重视上市后真实世界的产品表现和受管理情况。经认可制造商在产品上市后需要持续关注产品表现,收集用户体验、产品性能、临床结果等数据,并持续保障产品的安全性,解决出现的风险问题。此外,制造商在CQOE申请中所声明和承诺的内容也将在 产品上市后的管理中由FDA进行核实与查证。
FDA将数字医疗器械软件主要分为四类,即医疗器械独立软件、移动医疗应用程序、临床决策支持软件和医疗器械数据系统
。前三种软件涉及疾病检测、监测、诊断、治疗等功能,是目前运用人工智能技术的主要软件类型。FDA参考国际医疗器械监管机构论坛标准,根据软件所申明的用途和所针对疾病的严重性对其进行风险分类
。而最后一类软件功能以医疗数据的储存、传输和管理为主,通常作为低风险软件管理,不作为人工智能软件监管的重点。
以独立软件为代表的人工智能医疗器械在使用过程中会根据真实世界数据和反馈不断自我学习与进化,FDA希望能根据软件特性制定新的管理框架和监管范式,在不影响产品上市后安全性和有效性的基础上,允许其在一定程 度内学习和进化以提高软件性能,且不需要重新审批
。2019年2月,FDA发布了《人工智能医疗器械独立软件修正监管框架(讨论稿)》(Proposed Regulatory Framework for Modifications to Artificial Intelligence/Machine Learning (AI/ ML) -Based Software as a Medical Device Discussion Paper),提出对人工智能独立软件进行全生命周期监管的思路与方法
。FDA认为人工智能软件持续的改进和迭代可以遵循以下原则:①制造商需要建立质量标准监管系统,以及包括数据管理、特征抽取、训练和评价在内的机器学习质量管理规范 ;②制造商可以在提交上市申请时同时提交产品在使用时发生“学习”后,性能等方面预期发生的变化,并提供产品发生预期变化后仍保持安全性和有效性的方法;③当产品发生预期变化后收集资料做好记录,如产品发生预期外变化则需与FDA沟通,将变化控制在预期之内或提交新的预期变化申请;④加强管理透明度和产品真实世界性能监测,并提交周期性报告。
自2017年美国第一个人工智能医疗器械软件上市以来,该类型器械在FDA的审批数量持续上升,截至2019年底,已有数十种产品通过审批进入市场,主要审批途径为510(k)和De Novo。这些获批产品的主要类型包括放射诊断器械、临床化学检测系统、心血管诊断和监测器械、神经病学诊断器械和眼科诊断器械等,其中以医学影像诊断软件数量最多,用途包括多种疾病诊断(表 1),而目前上市的产品基本为“锁定”算法软件
2017年1月,FDA批准了首个人工智能医疗器械软件Arterys Cario DL,该软件可以通过对心脏血流和血管的核磁影像数据的分析,为医生和专家提供临床决策支持。无论是从产品名称还是产品的对外宣传都可以发现这是一款应用了深度学习技术的人工智能软件,然而在FDA发布的产品概要中却没有关于算法的描述。而且,这款产品的审批通道是510(k),其选择进行实质等同对比的两款参照器械也并未说明是人工智能软件。一年后该公司用于肿瘤学辅助诊断的产品Arterys Oncology DL上市,此次的产品概要中就明确提出应用了深度学习模型。
ContaCT是FDA通过De novo通道获准上市的第一个影像计算机辅助分级提示软件,它通过人工智能算法对脑血管CT影像中闭塞的大血管数量做多元化的分析,将超过阈值的影像返回医生进行复核,医生可以通过移动应用程序预先浏览这些图片的压缩版。软件概要在用途的说明中明确表示,不会在图片上做任何标记和提示,也不做出任何诊断,是医生标准诊断流程的额外辅助。为验证产品的有效性,制造商用300张脑血管CT影像对产品进行测试,并将产品判断结果与多位神经放射学专家读片标定的真实结果进行比较,结果显示产品ROC曲线下面积(Area Under Curve,AUC)为0.91,灵敏度和特异性分别为87.8%和89.6%。此外,制造商还进行了产品检测时间与传统流程下检测时间的对比,证明该产品的使用可以提高医生的诊断效率。FDA基于该软件设置的新分类为影像计算机辅助分类提示软件,此后又有多家公司的数款产品以该分类通过FDA准许上市,功能包括乳腺癌检查等。
OsteoDetect是一款影像计算机辅助骨折诊断软件,通过对成人后前位和侧位手腕X射线影像的分析,辅助医生识别桡骨远端骨折。产品使用深度学习算法,通过三层结构运行,即网络层、表示层和决策层。制造商对使用该产品医生和未使用该产品医生诊断结果的AUC、灵敏度、特异性、阳性预测值、阴性预测值等数据进行对比,以证明OsteoDetct可以辅助医生进行诊断。
AI-ECG Platform是FDA 以510(k)通道批准上市的人工智能心电图产品,其功能是进行12导联心电图数据的测量和自动化结果的分析与解释,为医生提供心率不齐、心肌梗塞、心室肥大等心脏异常的判断。医生可自行在软件判断的基础上做出确认、修正或删除的决定。该产品选择与两种参照器械分别在数据测量和数据分析上实质等同,其中一种是同公司的心电图产品,另一种是2005年上市的可编程心电图诊断软件。AI-ECG Platform虽引入了人工智能算法,在算法上与参照软件有所不同,但产品预期功能不变且未引入影响安全性与有效性的新问题,FDA则仍判定该产品与已上市的参照器械实质等同。同样以510(k)通道获准上市的产品还包括KardiaAI等。
作为人工智能移动医疗应用程序的代表,Apple公司的两款配合其智能手表使用的非处方移动医疗应用程序ECG APP 和 Irregular Rhythm Notification Feature 也通过FDA的De Novo通道获准上市,分别用于心率失常的识别和基于不规则心率的心房纤颤提醒。通过可穿戴设备获取并分析生理数据,用于特定疾病的监测也是人工智能器械的重要应用方向之一。
IDx-DR是由FDA眼科评审专家组以De Novo途径审 批通过的首个糖尿病性视网膜病变诊断软件,基于该软件 设立的新分类为视网膜诊断软件。IDx-DR采用基于服务器的自适应算法,通过对眼底照相机获得的眼底彩色图像进行识别,判断视网膜病变及其程度,并由软件自动给出检测出轻度以上糖尿病视网膜病变(more than mild Diabetic Retinopathy,mtmDR)、未检测出的 mtmDR或图片质量不足以进行判断的结果,但该软件仅用于已确诊糖尿病但从未检测出糖尿病性视网膜病变的成年患者。软件从FDA收到De Novo申请到审批上市历时仅3个月。
DreaMed Advisor Pro是由FDA临床化学评审专家组审批通过的胰岛素疗法调节器械,也是该分类下的第一款产品。该产品根据I型糖尿病患者的动态血糖监测、自我血糖监测和胰岛素泵数据的计算,就患者胰岛素泵使用的基础输注率、碳水化合物比率、校正系数以及患者行为做出优化建议,辅助医生进行临床决策。制造商提供了两组短期小规模临床试验数据,其中一组为15人的多中心试验,对比针对同一患者产品和专家所给出的建议结果,另一组为6人的单一中心试验,对比应用产品和专家的决策方案后,血糖的数据情况,结果证明DreaMed Advisor Pro与内分泌专家给出胰岛素使用方案基本相似。
DIP/U.S. Urine Analysis Test System是FDA通过510(k)途径上市的一款家用尿检测处方软件,由应用程序、色板和尿检测试剂条组成,用于半定量分析尿样本中的葡萄糖、蛋白质、血、尿液比重和pH值,以及定性判断尿中是否含有亚硝酸盐。该软件可以辅助医生管理并诊断影响肾脏功能导致内分泌失调的代谢性疾病或系统性疾病,而患者端是无法看到检测结果的。该软件图像识别算法运行时基于后端的云计算服务器,运用服务器端算法进行数据分析,输出检测结果。制造商通过两组试验对产品的精确性、可用性、准确性、稳定性、干扰、检测极限等指标进行评价,结果表明其各项性能皆优于其选择的参照器械,从而证明实质等同。此后,该公司用于检测尿液中白蛋白和肌酐的软件ACR LAB Urine Analysis Test System也通过相同途径获准上市。
无论从分类编号还是参与评审的专家组来看,美国人工智能医疗器械的审批与其他医疗器械一样,根据产品的功能与用途进行分类。一些影像辅助诊断产品在功能未发生改变的情况下,虽引入了人工智能算法,但仍能被视为与十余年前上市的参照器械等同,通过510(k)途径获准上市,不需要开展大规模临床实验。具有新的功能和用途的中等风险人工智能医疗器械通过De Novo途径上市后,也将为其后续具有相似功能的产品建立新的分类,并将成为后续产品的实质性等同的参照器械,从而加快产品的上市速度。
虽然FDA对Ⅱ类特殊控制的人工智能器械提出了算法说明要求,但从目前获准上市器械的概要文件中可以发现,产品对于算法部分的描述较为简单且没有统一标准。部分产品明确提出运用了人工智能技术或机器学习、深度学习、卷积神经网络等算法、模型,而部分产品仅提到算法,甚至少量产品未对算法进行描述,这个现象在影像辅助诊断以外的产品中尤为明显。制造商大多通过短期、小规模临床实验从产品的灵敏度、特异性等角度证明产品性能优于已上市参照器械,且在用途上未引入其他风险,即可获得实质等同的判定。
近年来,美国人工智能医疗器械上市产品数量快速增长,除本土产品外,以色列、意大利、中国等多个国家都已有产品在美国上市,这一方面说明美国市场的巨大吸引力,另一方面也肯定了美国注册准入制度的效率。从已上市产品来看,人工智能软件的分类代码不断增加,既有通过De Novo审批途径后新设立的,也有既有类型产品在技术改进后引入人工智能技术的,已实现了多种疾病的监测、诊断和检测。此外,该领域还存在同一家公司产品用途迅速扩展的特点,Zebra Medical Vision仅在2019年就有颅内出血、气胸、胸腔积液等多款产品相继上市,而Aidoc Medical的BriefCase也从首款颅内出血诊断产品陆续实质等同出大血管闭塞诊断等多种产品。
从监管制度建设与产品上市进展来看,美国人工智能医疗器械的发展仍处于起步阶段,器械上市审批仍沿用传统审批程序,已上市的数十种产品应用范围仅包括癌症、心脑血管、眼科和骨科等领域小部分疾病的辅助诊断、检测和监测。但同时,该领域发展受到联邦政府的高度重视,上市产品数量与用途迅速增长,注册审批经验不断积累,多个针对AI特点制定的审批模式正在探索、试点阶段,管理当局希望能通过对制度的创新和对上市后真实世界数据的有效利用,继续加快产品上市速度,保障产品使用安全,并顺应产品特点,允许其在上市后继续“进化”。
相比于美国,中国人工智能医疗器械的准入管理更为严格,2018年8月正式施行的新版《医疗器械分类目录》对于诊断功能软件有着明确界定,通过算法对病变部位进行自动识别并提供明确诊断提示的软件,按照第Ⅲ类医疗器械进行管理
。基于此分类原则,目前国内提交申请的大部分新一代人工智能医疗器械都将被判定为第Ⅲ类器械进行注册与监管,有必要进行严格的临床试验。此外,虽然中国在2015年发布《医疗器械临床评价技术指导原则》中就已提出同品种评价的概念,但鲜有产品通过该评价方法获批上市,所以美国常用的实质等同审批在我国较难实现
。我国医疗器械管理存在“严进宽出”的特点,上市后监管力度不足,数据难以获得和利用,依靠上市后数据和CQOE辅助评价的“美国模式”在当前阶段也并不适用。我国人工智能医疗器械管理需要借鉴国外已有经验并结合我国行业发展特点,就国内外器械研发方向尽快建立目标疾病的测试数据库,从产品的试验设计、临床表现、工作流程和数据安全管理等方面做好上市前评价,并逐步完善上市后监管机制,积累器械全生命周期管理数据和经验,为领域长期发展做好准备。
目前,国家药品监督管理局及其下属机构已发布《深度学习辅助决策医疗器械软件审评要点》《医疗器械生产质量管理规范附录独立软件》《医疗器械软件注册技术审查指导原则》等临床与注册指导性文件
,并已着手进行眼底影像、肺部影像等数据库的建设。截至2020年底,我国已有8个国产和1个进口人工智能医疗器械通过审批并在国内上市,类型包括眼科图像诊断、心电数据监测与诊断、生化数据监测和影像分析辅助诊断等软件和器械。
[1]孟祥峰,王浩,王权,等.影像类人工智能医疗器械评价方法研究[J].中国医疗设备,2018,33(12):14-21.
[4]孟祥峰,王浩,张超,等.人工智能医疗器械辅助诊断及探测性能评估参数的讨论[J].中国药事,2019,33(9):1026-1031.
[15]彭亮.软件预认证:有望开启医疗器械监督管理新篇章[N].中国医药报,2019-06-04(8).
[22]胡凯,甄辉,杨辉,等.美国上市影像类人工智能辅助诊断软件临床评价的研究与思考[J].中国医疗器械杂志,2019,43(5):71-75.
[25]国家药品监督管理局医疗器械技术审评中心.关于发布深度学习辅助决策医疗器械软件审评要点的通告[EB/OL]. (2019-07-03)[2020-02-04].