创新医疗器械的上市审批和临床应用,需基于高质量临床研究,证明其可靠性、安全性和有效性。2016年IDEAL(Idea,Development,Exploration,Assessment and Long-term follow-up)协作网在IDEAL框架与推荐的基础上扩展形成了适用于创新医疗器械全生命周期评价的IDEAL-D方法学框架,其包括临床前开发阶段、设计阶段、探索阶段、评价阶段和长期随访阶段共5个阶段。本文旨在基于IDEAL框架与推荐(2019年版),对IDEAL-D框架各阶段评价的目的、内容、设计等进行解读,为创新医疗器械临床研究的设计和开展提供可操作的方法学指导。
引用本文: 郭琼, 冯堃, 龙囿霖, 林逸飞, 向瑾, 黄进, 杜亮. 创新医疗器械临床研究方法学框架解读. 中国胸心血管外科临床杂志, 2022, 29(7): 828-833. doi: 10.7507/1007-4848.202205018 复制
我国将医疗器械定义为“直接或者间接用于人体的仪器、设备、器具、体外诊断试剂及校准物、材料以及其它类似或者相关的物品,包括所需要的计算机软件;其效用主要通过物理等方式获得,不是通过药理学、免疫学或者代谢的方式获得,或者虽然有这些方式参与但是只起辅助作用;其目的是:(1)疾病的诊断、预防、监护、治疗或者缓解;(2)损伤的诊断、监护、治疗、缓解或者功能补偿;(3)生理结构或者生理过程的检验、替代、调节或者支持;(4)生命的支持或者维持;(5)妊娠控制;(6)通过对来自人体的样本进行检查,为医疗或者诊断目的提供信息[1]。
近年,新材料、5G技术和人工智能的发展推动医疗器械不断创新,产品更新换代快且新产品不断涌现,截至2020年12月底,我国有效医疗器械产品数量已达187 062件[2],2021年国家药品监督管理局又批准医疗器械首次注册1 710件[3]。面对日益增长的医疗器械,如何对其安全性和有效性进行科学、快速评估,促进新器械快速上市,同时做好上市后监管,是目前监管当局面临的最大挑战之一。
与药物不同,美国、欧盟和中国对器械均实行按风险分类管理[4],但其上市管理远不如药物严格,器械获准上市并非必须进行临床试验[5]。根据风险不同,中国将医疗器械分为三类:第一类器械实行备案管理,免于开展临床试验;第二、三类器械实行注册管理,部分器械可通过同品种器械比较路径上市而免于开展临床试验[1]。在欧盟和美国,器械上市审批历来以安全性证据为最低要求,部分器械只有很少甚至无临床证据,仅基于临床前证据就被批准上市[5]。医疗器械上市审批存在证据质量低、证据不足和证据缺乏等问题,监管不严使器械在临床使用中存在不少安全隐患,如近年来多家厂商召回了安置在数十万患者体内的植入式心律转复除颤器导线[6-9]。
为加强医疗器械全生命周期监管,提高其安全性和有效性评价的证据质量,尚需一个方法学框架明确器械全生命周期不同评价阶段的证据要求[9]。2009年IDEAL(Idea,Development,Exploration,Assessment and Long-term follow-up)协作网提出了IDEAL框架与推荐,旨在对新的外科手术、有创性医疗器械和其它复杂的干预措施提供科学评价路径,即对外科创新干预从概念提出到不同临床实践使用阶段分别推荐适当的研究方法和报告规范等[10-12]。IDEAL框架与推荐最初是为创新外科手术设计的,可为医疗器械的全生命周期评估提供模板,但由于医疗器械具有广泛的临床前迭代优化和比外科手术更严格的监管要求,以及存在首创器械与改进器械的区分等特殊性[9],IDEAL框架与推荐(2009年版)不完全适用于创新器械。2016年,IDEAL协作网将其扩展形成IDEAL-D框架,以适用于对器械的评价[13]。2019年,IDEAL协作网在IDEAL框架与推荐(2009年版)和IDEAL-D框架的基础上全面更新了IDEAL框架与推荐,以提供更详细的指导建议并扩大实际应用范围,使其也适用于评价治疗器械[14-15]。本文将基于最新的IDEAL框架与推荐(2019年版),对适用于医疗器械全生命周期评价的IDEAL-D框架进行解读。
1 概述
IDEAL框架与推荐(2009年版)主要用于评价创新外科手术,确定了从首次人体使用到长期随访的5阶段框架,包括设计阶段(第1阶段)、开发阶段(第2a阶段)、探索阶段(第2b阶段)、评价阶段(第3阶段)和长期随访阶段(第4阶段)[10, 12]。IDEAL-D框架对创新医疗器械的评价路径也分为5个阶段,但由于创新器械的迭代修改大部分都在临床前完成,故将开发阶段(第2a阶段)调整为临床前开发阶段(第0阶段)[13]。而更新的IDEAL框架与推荐(2019年版)将外科创新技术的评价增加为5个阶段,即在保留开发阶段(第2a阶段)的基础上新增临床前评价(Pre-IDEAL阶段)[11, 14-15];见图1。

不同颜色表示相比于IDEAL框架与推荐(2009年版),IDEAL-D框架(2016年版)和IDEAL框架与推荐(2019年版)的变化
2 临床前开发阶段(第0阶段)
医疗器械进入临床前应开展临床前评价,论证医疗器械创新概念和技术的可行性,即通过计算机模拟、尸体、动物、模型和成本效益研究等确定患者可能面临的所有风险及潜在收益,为后期临床研究提供前期理论数据和风险评估结果[14-15]。在选择研究类型时,基于动物福利伦理原则,应优先考虑开展尸体和计算机模拟等实验室研究,当安全性、有效性和可行性等相关证据充分时,则可免于开展动物实验;当实验室研究证据不足时,才需进一步开展动物实验[16]。医疗器械在临床前开发阶段,需对产品工作原理、作用机制、使用材料、功能部件、设计特征、可操作性、安全性和可靠性等各方面进行验证,任一方面不合格都无法进入临床评价阶段[17]。因此,绝大部分创新器械在临床前开发阶段即被淘汰。有研究[18]发现,学术界提出的创新手术器械,10年内仅9.8%能进入人体研究阶段。由此可见,器械的创新迭代优化主要在人体首次使用前完成,临床前评价对于创新器械评价尤其重要。
创新医疗器械应从哪些方面进行评价,取决于器械类别和器械风险程度。Marcus等[19]在2021年据此提出了一套器械分类、器械风险评估、临床前研究分类以及基于风险确定评价内容的方法学框架。以下将对该框架的核心内容进行介绍。
2.1 器械分类
目前各国对医疗器械都实行按风险程度分类管理,该框架在遵循美国和欧盟[4]的器械分类方法基础上进行三层描述分类[19],该分类有助于阐明不同器械对患者可能造成的伤害。第一层根据器械是否接触或接近体腔和开放性伤口分为侵入性器械与非侵入性器械;第二层根据器械是否穿透身体表面分为外科器械与非外科器械;第三层对侵入性外科器械进一步细分为手术器械、可吸收手术植入物和不可吸收手术植入物;见表1。

2.2 器械风险评估
器械潜在风险程度与其分类相关,如侵入性越强的外科器械具有潜在风险越高,但仅基于分类评估器械风险并不一定恰当,因为同类别器械的风险也可能不同,如心血管导管与缝合针。失效模式与效应分析(failure modes and effects analysis,FMEA)方法可以很好地解决这一问题[20],其可对目标器械每种潜在失效方式发生的可能性及严重程度进行全面、主动评估,并通过矩阵图确定风险水平;见图2。

可忽略:不便或暂时性不适;轻微:导致无需专业医疗干预的暂时性伤害或损伤;严重:导致需要专业医疗干预的损伤或伤害;危险:导致永久性损伤或威胁生命的伤害;灾难性:导致死亡;绿色:低风险;橙色:中风险;红色:高风险
2.3 临床前研究分类
用于临床前评价的研究类型广泛,在评价时应充分考虑所有利益相关者的观点,评价视角可包括器械、患者、医生和卫生系统视角[19]。从器械视角评价,临床前研究首先通过风险评估方法识别可能影响器械固有安全性或有效性的特征,如结构材料、预期适应证等,然后根据特征选择细胞研究(如细胞毒性试验)、动物研究(如生殖毒性试验)和无菌测试等研究类型,以系统地评估器械固有安全性和技术有效性。从患者视角评价,旨在采用患者调查或焦点小组法了解潜在患者对新器械的需求与接受度。从医生视角评价,主要侧重于对医生偏好、器械实用性和学习曲线的评价,即设计器械应考虑医生偏好,以提高使用率;评估用户界面等实用性,以减少误用的可能;开展用户学习曲线研究,以确保首次临床使用前对医生提供足够的培训,并为器械设计与改进提供信息。从卫生系统视角评价,临床前研究主要采用调查与焦点小组法了解当前医疗保健系统的需求,然后通过经济学建模、文献回顾、服务评价等方法评估需求潜在健康效益、健康经济影响及其与新器械的相关性,最终确定新器械是否满足目前医疗保健系统的需求,以及是否具有成本效益。
2.4 基于风险的器械评价
从伦理角度考虑,恰当的器械评价既应确保所开展的安全性评估足够,也需促进创新器械及时应用,因此,针对经FMEA评估后具有不同潜在风险的器械,其推荐需开展的最基本的临床前评价视角有所不同;见图3。对于不同类型的器械,各评价视角的具体评价内容也有所差异。对于低风险器械,其潜在风险可控,对患者危害小,可仅开展适当的器械视角评价(例如,对一次性使用手术垫单开展无菌测试)。而对于中风险器械,尤其是涉及患者或医生操作的器械,使用不当也可能对患者造成严重伤害,且患者使用体验直接影响治疗满意度和依从性[8],因此,除了开展器械视角评价(例如,对手持式体外冲击波碎石机开展制造仿真试验和实验室台架试验等),还应开展患者和医生视角评价,包括患者对器械的可接受性以及器械对医生的实用性评价等。对于高风险器械,其潜在危害严重且发生率不低,临床前需从器械、患者、医生和卫生系统视角开展全面、充分的评价,尤其是卫生系统视角评价有助于判断器械的需求性和经济性。例如,比较脑活检手动穿刺与采用穿刺针引导系统穿刺的风险以判定引导系统的必要性,考虑到高风险器械成本投入高,只有同时满足需求性与经济性的高风险器械才适合进入首次人体研究。通过以上分层评价,既可使患者快速受益于低风险创新器械,又可保护患者免受高风险创新器械的伤害。

临床前评价是创新器械评价的起始阶段,涉及知识产权保护和商业利益维护,研究者完成研究后很难完整报告所有研究细节,但完整开展并充分报告临床前研究情况对下一阶段研究开展很有必要。因此,IDEAL框架与推荐认为在首次人体试验前,应完成临床前评价并至少公开技术一致性的最小数据集。此外,基于伦理考虑,该阶段应注意:(1)尽可能减少动物模型的使用,只有动物模型适用于人类时才使用;(2)模拟研究应考虑人群公平性。
3 设计阶段(第1阶段)
该阶段是创新医疗器械首次应用于人体的阶段,旨在通过少于10例的个案报告或小型病例系列研究初步评估器械的安全性、可行性和短期疗效,重点是详细、完整、准确地描述新器械的早期临床应用数据,尤其是不良事件,为后期开展更大样本的人体试验提供前期数据,以最大限度地减少患者伤害[14-15]。在开展任何医疗器械临床试验前,首先应接受正式的伦理审批,然后向相应的药品监督管理部门备案,对具有较高风险的第三类医疗器械还需经国务院药品监督管理部门批准,随后在世界卫生组织国际临床试验注册平台的一级注册机构(共17个,我国为中国临床试验注册中心)和美国临床试验注册中心(ClinicalTrials.gov)注册,报告新器械的相关信息,避免同行重复既往失败研究,以履行研究者的伦理义务,最后在获得受试者的书面知情同意后开始人体试验[1, 9, 11]。考虑到报告不利结果可能面临法律方面的挑战,为鼓励研究者充分完整报告,IDEAL框架与推荐建议匿名报告[10],IDEAL-D框架提议通过立法确保那些证明创新器械有害的报告不被用作法律证据,从而保护器械创新[13]。
4 探索阶段(第2b阶段)
考虑到外科手术具有易变性的特点,IDEAL框架与推荐将第2阶段分为2a(开发阶段)和2b(探索阶段)两个阶段,其中开发阶段旨在通过开展单中心小样本前瞻性队列研究或病例系列研究对外科创新技术不断迭代优化,以获得成熟稳定的优化技术方案;探索阶段旨在通过开展更大范围的研究,如多中心前瞻性队列研究、可行性随机对照试验(randomized controlled trial,RCT)评估外科创新技术的稳定性和质量水平,以及下一阶段开展确证性RCT的可行性,最终在外科创新技术和开展RCT可行性方面达成共识[14-15]。
与外科手术的迭代优化主要发生于临床环境不同,器械技术迭代很大程度由研发厂商独自在首次人体应用前完成,只有多家制造商生产竞争器械时才需达成共识。因此,对于单独使用的医疗器械,如单个第2阶段的前瞻性研究足以促进创新器械发展到第3阶段的确证性RCT,则无需再分2a和2b两个阶段。但对于首创器械,尤其是植入式创新器械和作为手术工具的手术机器人或腹腔镜等器械,因涉及手术技术开发过程,则仍需第2a阶段[9]。对于器械技术和适应证的重要改变,建议以图形形式详细阐述改变的时间和原因[11],同时该阶段研究应注意尽可能减少学习曲线为患者带来的潜在危害。
5 评价阶段(第3阶段)
该阶段主要考虑开展多中心大样本RCT比较外科创新技术与当前标准疗法,以获得外科创新技术安全性与有效性的确切证据,重点是在新技术迭代稳定后到广泛使用前的时间段快速完成评价,以促进创新技术应用同时确保患者安全[15]。
与外科手术优先考虑多中心RCT不同,医疗器械更新换代快、商业生命周期通常很短、种类多且风险程度不同,采用“一刀切”的方式要求所有新器械开展RCT并不科学也不符合实际,其它可选设计包括前瞻性队列设计、对照中断时间序列设计等,但何种设计最合适,仍存在争议[5]。Páez等[5]认为那些不声明其具有新作用机制或具有更好效果的创新器械不应开展RCT,并据此提供了一个评价创新治疗器械的研究类型选择框架。IDEAL-D框架建议由监管机构定义需进行RCT的器械类别[13]。该阶段研究强调进行独立监查,关注器械操作标准化和患者参与研究的公平性问题[14]。
6 长期随访阶段(第4阶段)
该阶段主要采用观察性研究如注册登记研究、罕见病例报告等研究方法,对创新医疗器械的广泛临床实践过程进行长期监测和随访,重点关注长期或罕见不良反应、长期疗效、适应证改变和创新医疗器械的质量变化[14-15]。该阶段需要通过器械注册登记以获取长期随访数据,考虑到早期开始前瞻性注册登记有利于研究者提前了解技术改进效果,促进创新技术迅速成熟,同时还可及时发现罕见事件及器械异常报告,有利于保护患者安全[13],因此,IDEAL-D框架推荐从人体最早应用创新器械时就建立注册登记系统,以实现对医疗器械全生命周期的连续评价[13]。该阶段主要关注数据使用知情同意以及隐私保护等伦理问题[11, 14]。
7 结语
针对医疗器械的IDEAL-D框架主要强调:(1)临床前评价至关重要,因为器械迭代更新主要发生在人体应用前,如果创新器械评估的方法学框架从首次临床研究开始,将会忽略大部分的开发过程,故IDEAL-D框架专门提出针对临床前评价的第0阶段[13];(2)不强制开展RCT,如果监管机构坚持所有器械都要开展RCT,那么证据问题将成为创新器械上市最大的障碍之一[19];(3)大部分学者认为该框架更适用于风险较高的器械,因为低风险器械可能没必要进行如此严格的评估[9]。
IDEAL框架与推荐和IDEAL-D框架在实际应用中并非完全独立,一方面,经过适用性调整后,IDEAL框架与推荐(2019年版)也适用于创新医疗器械评估,IDEAL-D框架则专门提出了器械评估的特殊点;另外,外科器械与手术技术的创新有时是相辅相成的,例如,手术机器人和腹腔镜是外科器械创新,但它作为手术工具开始应用于临床也伴随着相应术式的创新,此时应在IDEAL框架与推荐的第1阶段充分描述其首次人体使用情况,且同时开展第0阶段和第2a阶段研究[9]。
IDEAL框架与推荐(2019年版)和IDEAL-D框架详细描述了器械从早期开发到上市后监测全生命周期各阶段的评价核心内容,并为每阶段评价提供了特异性建议,为创新医疗器械临床研究提供了可操作的方法学指导。目前,IDEAL框架与推荐(2019年版)和IDEAL-D框架在创新医疗器械实践中应用有限,为促进该方法学框架的传播与推广,本文为国内学者详细解读了框架内容,旨在提升今后医疗器械研究质量。
利益冲突:无。
作者贡献:郭琼提出设想,撰写论文;冯堃、龙囿霖、林逸飞、向瑾修改论文;杜亮、黄进提出设想,审阅及修改论文。
我国将医疗器械定义为“直接或者间接用于人体的仪器、设备、器具、体外诊断试剂及校准物、材料以及其它类似或者相关的物品,包括所需要的计算机软件;其效用主要通过物理等方式获得,不是通过药理学、免疫学或者代谢的方式获得,或者虽然有这些方式参与但是只起辅助作用;其目的是:(1)疾病的诊断、预防、监护、治疗或者缓解;(2)损伤的诊断、监护、治疗、缓解或者功能补偿;(3)生理结构或者生理过程的检验、替代、调节或者支持;(4)生命的支持或者维持;(5)妊娠控制;(6)通过对来自人体的样本进行检查,为医疗或者诊断目的提供信息[1]。
近年,新材料、5G技术和人工智能的发展推动医疗器械不断创新,产品更新换代快且新产品不断涌现,截至2020年12月底,我国有效医疗器械产品数量已达187 062件[2],2021年国家药品监督管理局又批准医疗器械首次注册1 710件[3]。面对日益增长的医疗器械,如何对其安全性和有效性进行科学、快速评估,促进新器械快速上市,同时做好上市后监管,是目前监管当局面临的最大挑战之一。
与药物不同,美国、欧盟和中国对器械均实行按风险分类管理[4],但其上市管理远不如药物严格,器械获准上市并非必须进行临床试验[5]。根据风险不同,中国将医疗器械分为三类:第一类器械实行备案管理,免于开展临床试验;第二、三类器械实行注册管理,部分器械可通过同品种器械比较路径上市而免于开展临床试验[1]。在欧盟和美国,器械上市审批历来以安全性证据为最低要求,部分器械只有很少甚至无临床证据,仅基于临床前证据就被批准上市[5]。医疗器械上市审批存在证据质量低、证据不足和证据缺乏等问题,监管不严使器械在临床使用中存在不少安全隐患,如近年来多家厂商召回了安置在数十万患者体内的植入式心律转复除颤器导线[6-9]。
为加强医疗器械全生命周期监管,提高其安全性和有效性评价的证据质量,尚需一个方法学框架明确器械全生命周期不同评价阶段的证据要求[9]。2009年IDEAL(Idea,Development,Exploration,Assessment and Long-term follow-up)协作网提出了IDEAL框架与推荐,旨在对新的外科手术、有创性医疗器械和其它复杂的干预措施提供科学评价路径,即对外科创新干预从概念提出到不同临床实践使用阶段分别推荐适当的研究方法和报告规范等[10-12]。IDEAL框架与推荐最初是为创新外科手术设计的,可为医疗器械的全生命周期评估提供模板,但由于医疗器械具有广泛的临床前迭代优化和比外科手术更严格的监管要求,以及存在首创器械与改进器械的区分等特殊性[9],IDEAL框架与推荐(2009年版)不完全适用于创新器械。2016年,IDEAL协作网将其扩展形成IDEAL-D框架,以适用于对器械的评价[13]。2019年,IDEAL协作网在IDEAL框架与推荐(2009年版)和IDEAL-D框架的基础上全面更新了IDEAL框架与推荐,以提供更详细的指导建议并扩大实际应用范围,使其也适用于评价治疗器械[14-15]。本文将基于最新的IDEAL框架与推荐(2019年版),对适用于医疗器械全生命周期评价的IDEAL-D框架进行解读。
1 概述
IDEAL框架与推荐(2009年版)主要用于评价创新外科手术,确定了从首次人体使用到长期随访的5阶段框架,包括设计阶段(第1阶段)、开发阶段(第2a阶段)、探索阶段(第2b阶段)、评价阶段(第3阶段)和长期随访阶段(第4阶段)[10, 12]。IDEAL-D框架对创新医疗器械的评价路径也分为5个阶段,但由于创新器械的迭代修改大部分都在临床前完成,故将开发阶段(第2a阶段)调整为临床前开发阶段(第0阶段)[13]。而更新的IDEAL框架与推荐(2019年版)将外科创新技术的评价增加为5个阶段,即在保留开发阶段(第2a阶段)的基础上新增临床前评价(Pre-IDEAL阶段)[11, 14-15];见图1。

不同颜色表示相比于IDEAL框架与推荐(2009年版),IDEAL-D框架(2016年版)和IDEAL框架与推荐(2019年版)的变化
2 临床前开发阶段(第0阶段)
医疗器械进入临床前应开展临床前评价,论证医疗器械创新概念和技术的可行性,即通过计算机模拟、尸体、动物、模型和成本效益研究等确定患者可能面临的所有风险及潜在收益,为后期临床研究提供前期理论数据和风险评估结果[14-15]。在选择研究类型时,基于动物福利伦理原则,应优先考虑开展尸体和计算机模拟等实验室研究,当安全性、有效性和可行性等相关证据充分时,则可免于开展动物实验;当实验室研究证据不足时,才需进一步开展动物实验[16]。医疗器械在临床前开发阶段,需对产品工作原理、作用机制、使用材料、功能部件、设计特征、可操作性、安全性和可靠性等各方面进行验证,任一方面不合格都无法进入临床评价阶段[17]。因此,绝大部分创新器械在临床前开发阶段即被淘汰。有研究[18]发现,学术界提出的创新手术器械,10年内仅9.8%能进入人体研究阶段。由此可见,器械的创新迭代优化主要在人体首次使用前完成,临床前评价对于创新器械评价尤其重要。
创新医疗器械应从哪些方面进行评价,取决于器械类别和器械风险程度。Marcus等[19]在2021年据此提出了一套器械分类、器械风险评估、临床前研究分类以及基于风险确定评价内容的方法学框架。以下将对该框架的核心内容进行介绍。
2.1 器械分类
目前各国对医疗器械都实行按风险程度分类管理,该框架在遵循美国和欧盟[4]的器械分类方法基础上进行三层描述分类[19],该分类有助于阐明不同器械对患者可能造成的伤害。第一层根据器械是否接触或接近体腔和开放性伤口分为侵入性器械与非侵入性器械;第二层根据器械是否穿透身体表面分为外科器械与非外科器械;第三层对侵入性外科器械进一步细分为手术器械、可吸收手术植入物和不可吸收手术植入物;见表1。

2.2 器械风险评估
器械潜在风险程度与其分类相关,如侵入性越强的外科器械具有潜在风险越高,但仅基于分类评估器械风险并不一定恰当,因为同类别器械的风险也可能不同,如心血管导管与缝合针。失效模式与效应分析(failure modes and effects analysis,FMEA)方法可以很好地解决这一问题[20],其可对目标器械每种潜在失效方式发生的可能性及严重程度进行全面、主动评估,并通过矩阵图确定风险水平;见图2。

可忽略:不便或暂时性不适;轻微:导致无需专业医疗干预的暂时性伤害或损伤;严重:导致需要专业医疗干预的损伤或伤害;危险:导致永久性损伤或威胁生命的伤害;灾难性:导致死亡;绿色:低风险;橙色:中风险;红色:高风险
2.3 临床前研究分类
用于临床前评价的研究类型广泛,在评价时应充分考虑所有利益相关者的观点,评价视角可包括器械、患者、医生和卫生系统视角[19]。从器械视角评价,临床前研究首先通过风险评估方法识别可能影响器械固有安全性或有效性的特征,如结构材料、预期适应证等,然后根据特征选择细胞研究(如细胞毒性试验)、动物研究(如生殖毒性试验)和无菌测试等研究类型,以系统地评估器械固有安全性和技术有效性。从患者视角评价,旨在采用患者调查或焦点小组法了解潜在患者对新器械的需求与接受度。从医生视角评价,主要侧重于对医生偏好、器械实用性和学习曲线的评价,即设计器械应考虑医生偏好,以提高使用率;评估用户界面等实用性,以减少误用的可能;开展用户学习曲线研究,以确保首次临床使用前对医生提供足够的培训,并为器械设计与改进提供信息。从卫生系统视角评价,临床前研究主要采用调查与焦点小组法了解当前医疗保健系统的需求,然后通过经济学建模、文献回顾、服务评价等方法评估需求潜在健康效益、健康经济影响及其与新器械的相关性,最终确定新器械是否满足目前医疗保健系统的需求,以及是否具有成本效益。
2.4 基于风险的器械评价
从伦理角度考虑,恰当的器械评价既应确保所开展的安全性评估足够,也需促进创新器械及时应用,因此,针对经FMEA评估后具有不同潜在风险的器械,其推荐需开展的最基本的临床前评价视角有所不同;见图3。对于不同类型的器械,各评价视角的具体评价内容也有所差异。对于低风险器械,其潜在风险可控,对患者危害小,可仅开展适当的器械视角评价(例如,对一次性使用手术垫单开展无菌测试)。而对于中风险器械,尤其是涉及患者或医生操作的器械,使用不当也可能对患者造成严重伤害,且患者使用体验直接影响治疗满意度和依从性[8],因此,除了开展器械视角评价(例如,对手持式体外冲击波碎石机开展制造仿真试验和实验室台架试验等),还应开展患者和医生视角评价,包括患者对器械的可接受性以及器械对医生的实用性评价等。对于高风险器械,其潜在危害严重且发生率不低,临床前需从器械、患者、医生和卫生系统视角开展全面、充分的评价,尤其是卫生系统视角评价有助于判断器械的需求性和经济性。例如,比较脑活检手动穿刺与采用穿刺针引导系统穿刺的风险以判定引导系统的必要性,考虑到高风险器械成本投入高,只有同时满足需求性与经济性的高风险器械才适合进入首次人体研究。通过以上分层评价,既可使患者快速受益于低风险创新器械,又可保护患者免受高风险创新器械的伤害。

临床前评价是创新器械评价的起始阶段,涉及知识产权保护和商业利益维护,研究者完成研究后很难完整报告所有研究细节,但完整开展并充分报告临床前研究情况对下一阶段研究开展很有必要。因此,IDEAL框架与推荐认为在首次人体试验前,应完成临床前评价并至少公开技术一致性的最小数据集。此外,基于伦理考虑,该阶段应注意:(1)尽可能减少动物模型的使用,只有动物模型适用于人类时才使用;(2)模拟研究应考虑人群公平性。
3 设计阶段(第1阶段)
该阶段是创新医疗器械首次应用于人体的阶段,旨在通过少于10例的个案报告或小型病例系列研究初步评估器械的安全性、可行性和短期疗效,重点是详细、完整、准确地描述新器械的早期临床应用数据,尤其是不良事件,为后期开展更大样本的人体试验提供前期数据,以最大限度地减少患者伤害[14-15]。在开展任何医疗器械临床试验前,首先应接受正式的伦理审批,然后向相应的药品监督管理部门备案,对具有较高风险的第三类医疗器械还需经国务院药品监督管理部门批准,随后在世界卫生组织国际临床试验注册平台的一级注册机构(共17个,我国为中国临床试验注册中心)和美国临床试验注册中心(ClinicalTrials.gov)注册,报告新器械的相关信息,避免同行重复既往失败研究,以履行研究者的伦理义务,最后在获得受试者的书面知情同意后开始人体试验[1, 9, 11]。考虑到报告不利结果可能面临法律方面的挑战,为鼓励研究者充分完整报告,IDEAL框架与推荐建议匿名报告[10],IDEAL-D框架提议通过立法确保那些证明创新器械有害的报告不被用作法律证据,从而保护器械创新[13]。
4 探索阶段(第2b阶段)
考虑到外科手术具有易变性的特点,IDEAL框架与推荐将第2阶段分为2a(开发阶段)和2b(探索阶段)两个阶段,其中开发阶段旨在通过开展单中心小样本前瞻性队列研究或病例系列研究对外科创新技术不断迭代优化,以获得成熟稳定的优化技术方案;探索阶段旨在通过开展更大范围的研究,如多中心前瞻性队列研究、可行性随机对照试验(randomized controlled trial,RCT)评估外科创新技术的稳定性和质量水平,以及下一阶段开展确证性RCT的可行性,最终在外科创新技术和开展RCT可行性方面达成共识[14-15]。
与外科手术的迭代优化主要发生于临床环境不同,器械技术迭代很大程度由研发厂商独自在首次人体应用前完成,只有多家制造商生产竞争器械时才需达成共识。因此,对于单独使用的医疗器械,如单个第2阶段的前瞻性研究足以促进创新器械发展到第3阶段的确证性RCT,则无需再分2a和2b两个阶段。但对于首创器械,尤其是植入式创新器械和作为手术工具的手术机器人或腹腔镜等器械,因涉及手术技术开发过程,则仍需第2a阶段[9]。对于器械技术和适应证的重要改变,建议以图形形式详细阐述改变的时间和原因[11],同时该阶段研究应注意尽可能减少学习曲线为患者带来的潜在危害。
5 评价阶段(第3阶段)
该阶段主要考虑开展多中心大样本RCT比较外科创新技术与当前标准疗法,以获得外科创新技术安全性与有效性的确切证据,重点是在新技术迭代稳定后到广泛使用前的时间段快速完成评价,以促进创新技术应用同时确保患者安全[15]。
与外科手术优先考虑多中心RCT不同,医疗器械更新换代快、商业生命周期通常很短、种类多且风险程度不同,采用“一刀切”的方式要求所有新器械开展RCT并不科学也不符合实际,其它可选设计包括前瞻性队列设计、对照中断时间序列设计等,但何种设计最合适,仍存在争议[5]。Páez等[5]认为那些不声明其具有新作用机制或具有更好效果的创新器械不应开展RCT,并据此提供了一个评价创新治疗器械的研究类型选择框架。IDEAL-D框架建议由监管机构定义需进行RCT的器械类别[13]。该阶段研究强调进行独立监查,关注器械操作标准化和患者参与研究的公平性问题[14]。
6 长期随访阶段(第4阶段)
该阶段主要采用观察性研究如注册登记研究、罕见病例报告等研究方法,对创新医疗器械的广泛临床实践过程进行长期监测和随访,重点关注长期或罕见不良反应、长期疗效、适应证改变和创新医疗器械的质量变化[14-15]。该阶段需要通过器械注册登记以获取长期随访数据,考虑到早期开始前瞻性注册登记有利于研究者提前了解技术改进效果,促进创新技术迅速成熟,同时还可及时发现罕见事件及器械异常报告,有利于保护患者安全[13],因此,IDEAL-D框架推荐从人体最早应用创新器械时就建立注册登记系统,以实现对医疗器械全生命周期的连续评价[13]。该阶段主要关注数据使用知情同意以及隐私保护等伦理问题[11, 14]。
7 结语
针对医疗器械的IDEAL-D框架主要强调:(1)临床前评价至关重要,因为器械迭代更新主要发生在人体应用前,如果创新器械评估的方法学框架从首次临床研究开始,将会忽略大部分的开发过程,故IDEAL-D框架专门提出针对临床前评价的第0阶段[13];(2)不强制开展RCT,如果监管机构坚持所有器械都要开展RCT,那么证据问题将成为创新器械上市最大的障碍之一[19];(3)大部分学者认为该框架更适用于风险较高的器械,因为低风险器械可能没必要进行如此严格的评估[9]。
IDEAL框架与推荐和IDEAL-D框架在实际应用中并非完全独立,一方面,经过适用性调整后,IDEAL框架与推荐(2019年版)也适用于创新医疗器械评估,IDEAL-D框架则专门提出了器械评估的特殊点;另外,外科器械与手术技术的创新有时是相辅相成的,例如,手术机器人和腹腔镜是外科器械创新,但它作为手术工具开始应用于临床也伴随着相应术式的创新,此时应在IDEAL框架与推荐的第1阶段充分描述其首次人体使用情况,且同时开展第0阶段和第2a阶段研究[9]。
IDEAL框架与推荐(2019年版)和IDEAL-D框架详细描述了器械从早期开发到上市后监测全生命周期各阶段的评价核心内容,并为每阶段评价提供了特异性建议,为创新医疗器械临床研究提供了可操作的方法学指导。目前,IDEAL框架与推荐(2019年版)和IDEAL-D框架在创新医疗器械实践中应用有限,为促进该方法学框架的传播与推广,本文为国内学者详细解读了框架内容,旨在提升今后医疗器械研究质量。
利益冲突:无。
作者贡献:郭琼提出设想,撰写论文;冯堃、龙囿霖、林逸飞、向瑾修改论文;杜亮、黄进提出设想,审阅及修改论文。