一项具有临床应用价值的干预措施必须是有效且安全的,因此评价干预措施时,需综合权衡其益害比,只有益处大于危害的干预措施才有应用价值。评价某种干预措施的益害关系,应在临床试验中同时报告益处和危害的证据。为了提高临床试验中危害的报告质量,CONSORT工作组曾在2001版的CONSORT声明中增加了1项有关危害的条目,之后又于2004年发布了针对危害报告的扩展版,但该扩展版并未得到广泛应用,目前危害的报告仍不充分。为了改善这一情况,CONSORT工作组对《更好地报告随机试验中的危害:CONSORT声明扩展版》进行了更新,发布了《CONSORT危害2022声明、解释与说明:随机试验危害报告指南的更新版》(Harms 2022)。本文对Harms 2022更新情况进行介绍和解读,旨在帮助研究人员更好地理解与应用该声明,以期为提高临床研究中危害的报告质量提供帮助。
引用本文: 李斌艳, 王丽琼, 段炎珊, 王宇, 屠建锋, 石广霞, 刘存志. 随机试验危害报告指南:Harms 2022声明解读. 中国循证医学杂志, 2024, 24(3): 339-347. doi: 10.7507/1672-2531.202306157 复制
干预措施的益害关系对临床应用的选择及证据评价尤为重要[1]。几乎所有医疗干预措施都会对人体存在或多或少的不良影响,因此评价某项干预措施时,不但要了解其益处,还要知道其危害性,以综合权衡益害比[2],明确临床应用价值。但是由于干预和随访时间短、计划和设计不充分、文章篇幅有限、研究人员报告意识差[3]、缺乏监督管理机构[4]等原因,临床试验中对危害的报告仍存在不足[5,6]。干预措施的危害会严重影响患者的生活质量[7]和治疗依从性[8],并增加患者和卫生系统的经济成本[9]。为了让患者和医疗保健提供者做出真正明智的决定,建议在临床试验中同时报告益处和危害的证据。
随机对照试验(randomized controlled trial,RCT)是目前国际上公认的评价干预措施效果的金标准,为规范RCT的报告,1996年David Moher和Drummond Rennie教授起草了第一版CONSORT声明[10],该版声明并未对危害的报告提出要求;随后在2001年的修订版中增加了一项关于危害的条目[11],但仅这一项条目并不能充分反映危害相关问题的重要性;因此,CONSORT工作组集中讨论了如何改进这一不足,于2004年发布了《更好地报告随机试验中的危害:CONSORT声明扩展版》(简称“Harms 2004”),对危害的完整报告提供了具体指导[12]。然而,该版声明并未得到广泛应用。有研究发现自Harms 2004发布以来,RCT中危害的报告情况略有改善但仍不理想,Harms 2004中有一半条目的报告率低于50%[13]。有系统评价对2015—2016年发表在BMJ、JAMA、NEJM、Lancet期刊上的RCT进行分析,发现所有纳入研究均未使用Harms 2004以规范危害的报告[6]。尽管CONSORT已获得众多医学期刊的认可,但大部分医学期刊的投稿说明中并未明确提及其危害扩展版,Harms 2004的认可度仍亟待提高。
为改善临床试验中危害报告不充分的情况,CONSORT工作组对Harms 2004进行了更新,于2023年4月在BMJ杂志上发布了《CONSORT危害2022声明、解释与说明:随机试验危害报告指南的更新版》(简称“Harms 2022”)。本文对Harms 2022所有条目进行中文解读,旨在帮助研究人员更好地理解与应用该声明,以期为提高临床研究中危害的报告质量提供帮助。
1 Harms 2022声明简介
与Harms 2004不同,Harms 2022不再被设为独立的扩展版,而是将危害有关的条目整合到CONSORT中,目的是促进RCT中干预措施利弊关系的完整透明报告。该清单包括标题和摘要、引言、方法、结果、讨论和其他信息6个部分共16个条目,其中新增的3个条目,分别是6c、17a2和17c,以减少潜在的报告偏倚;17a2要求如果在正文中未报告危害,应提供原因(如在附件中补充报告、未监测危害、未观察到危害发生等)以及是否可以从其他地方获得数据;17c要求若没有观察到危害,应清楚报告是零事件。另外13个条目(1b、2b、6a、11a、12a、13a、14a、16、17a、17b、18、20和24)在CONSORT原条目的基础上通过添加“益处和危害(benefits and harms)”这一短语进行最低限度的修改。CONSORT 2010[14]和Harms 2022[15]的条目清单比较见表1。Harms 2004中的条目5、6、8包含多个组成部分,给危害的报告带来挑战,Harms 2022对这些条目进行了细化,使其更加清晰,并新增了条目24,是关于试验方案的报告。Harms 2004[12]与Harms 2022[15]条目清单比较见表2。
2 术语
Harms 2022将危害定义为干预或治疗过程中可能产生的不良后果的总和,将不良事件和药物不良反应作为描述危害的另一个术语,多用于监督管理研究。声明中还明确提到不推荐使用其他术语来描述危害,例如“安全性(safety)”“副作用(side effect)”“风险(risk)”。应用“安全性”一词报告危害的研究很多[16,17],但“安全性”一词有一定的误导性,可能暗示干预措施的危害很小或没有危害,应尽量避免使用;“副作用”指应用治疗量的药物后出现的与治疗目的无关的药理作用,会随着治疗目的的不同而有所改变,并暗示与干预措施的机制有关。例如,阿托品在临床上有广泛应用,可解除胃肠道平滑肌痉挛、抑制腺体分泌、扩瞳(表现为视物不清)等[18]。当患者服用阿托品治疗胃肠道疼痛时,视物不清是其副作用;而作为眼科扩瞳药物时,视物不清又是其药理作用。因此虽然副作用有时会引起一定的不适,但并非一定指有害的作用。除此之外,参加德尔菲调查的患者代表们认为副作用一词低估了危害的严重性,不推荐使用;“风险”一词强调不确定性,通俗来讲,指的是发生某事件的概率,并不能用来表示事件的性质。当用风险一词描述危害时,其实际代表的是该干预措施发生危害的概率。同时要求避免使用一些没有明确含义、模棱两可的术语,例如“意外事件(unintended events)”、“预期事件(anticipated events)”等。
Harms 2022要求在试验中应说明危害的结局是否是预先设定的,如果是,还应说明如何监测危害(系统评估还是非系统评估)。其中预先设定是指在方案中明确定义的结局指标,非预先设定是指试验方案或试验注册之外的结局指标。系统评估是指使用标准化的临床检查、问卷调查和医疗器械测量受试者的相关指标;非系统评估则是指对危害进行被动或非结构化报告,是患者在无提示的基础上进行的自发报告,因此可以发现先前未报告过的危害,尤其是当多个受试者出现相同的危害事件,可以对系统评估做有意义的补充。
在危害报告中使用不规范的术语,可能会误导读者、低估危害严重性等,Harms 2022对术语的使用做了进一步规范,可以提高研究者对危害的重视程度,平衡好RCT研究中对益处和危害的报告。
3 条目解读
3.1 标题和摘要
条目1b:结构式摘要,包括试验设计、方法、益处和危害结局的结果、结论几个部分(具体的指导建议见“CONSORT for abstracts”)。
解读:修改条目,通过添加“benefits and harms”短语。摘要中危害的报告若缺乏准确性和完整性可能会对读者造成误导或带来困惑,尤其是对于那些无法获取全文的读者。例如在摘要中只报告益处而未提及危害,可能会使读者不清楚该研究是未监测危害,还是监测了但未观察到危害发生,亦或是监测并观察到了危害但未报告。此外,在摘要中使用模棱两可的描述(如“安全”“耐受良好”)可能误导读者认为该干预措施是安全的。因此在摘要的结果部分,应同时报告益处和危害。
3.2 引言
条目2b:对益处和危害结局的具体目的或假设。
解读:修改条目,同上。几乎所有医疗干预措施都会对人体存在或多或少的不良影响,因此评价某项干预措施时,不但要了解其益处,还要知道其危害性。该条目要求研究者在引言部分同时说明试验计划中对益处和危害的考虑。报告时可以用一句话概括,如“我们假设,与假经颅直流电刺激(transcranial direct current stimulation,tDCS)相比,tDCS对抑郁症的疗效更佳,并且两组的不良事件发生率相似”[19]。
3.3 方法
条目6a:完整而确切地说明预先设定的主要和次要结局指标,包括益处和危害,以及它们是在何时、如何测评的。
解读:修改条目,同上。危害应该被视为重要的结局指标进行详细说明,其原则是提供的信息要足以使他人也能够使用这些指标。对预先设定并进行系统评估的危害,应提供定义(如失眠)、具体的测量工具(如失眠的严重程度指数)、评估指标(如较基线的变化值、疗后值、时间-事件)、统计指标(如均值、中位数、比例)、每个结局指标收集的时间点等;对于非系统评估的危害,则应详细说明收集患者危害信息的具体方法及时间点(如附上一个空白的病例报告表)。若预先设定的结局指标在评估的时间点、统计指标等方面存在改动,也应进行报告,明确这些信息可减少潜在的报告偏倚,提高可信度。
关于测量方式,建议研究中尽可能使用标准化和确证过的测量工具来监测危害。例如艾森贝格(Asberg)抗抑郁药不良反应量表可用于评定患者服用抗抑郁药后的不良反应、诺氏(Naranjo's)评估量表可用来评价和确定药物使用与药物不良反应之间的相关性及紧密程度。关于如何选择测量工具,COSMIN(consensus-based standards for the selection of health measurement instruments)等指南中有具体指导。
条目6c:描述是否以及如何确定非预先设定的益处和危害结局,包括任何选择标准,如果适用的话。
解读:新增条目。在试验报告中增加非预先设定的结局指标是一个备受关注的问题[20],一项研究评估了2015年10月至11月发表在BMJ、JAMA、Lancet、NEJM、Ann Intern Med期刊上的所有试验,发现纳入的67个试验共增加了365个结局指标,但只有13.7%的结局指标被描述为非预先设定[21]。预先设定的结局和最终报告的结局之间的差异会给试验带来选择性报告偏倚,因此要求研究者在试验报告中说明是否有非预先设定的益处和危害结局指标。如果有,还应报告哪些是非预先设定的结局,增加这些结局的原因以及采用的测量工具、评估指标、统计指标以及每个指标的采集时间等。
条目11a:如果实施了盲法,分配干预措施之后对谁设盲(例如受试者、医护提供者、益处和危害的结局评估者)以及盲法是如何实施的。
解读:修改条目,同上。研究者在试验过程中可能会倾向于使干预组的危害少于对照组,而对危害的结局评估者设盲可减少其个人倾向对结局评估的影响。如果可以的话,可以选择设立外部委员会,由委员会的成员对危害进行评估和归因分析。患者是否设盲对危害评估也可能会造成影响。例如明确知道自己服用的是安慰剂的患者(已破盲)和不确定自己服用的是药物还是安慰剂的患者(未破盲),二者对危害的报告可能是不同的,主要取决于患者的预期是积极还是消极。
条目12a:用于比较各组益处和危害的主要和次要结局指标的统计学方法。
解读:修改条目,同上。要求研究者报告每个结局指标所采用的统计学方法,包括益处和危害的,并说明这些方法是否是预先设定的。对于非系统评价的危害,很多研究在统计分析之前会对其进行编码并分组。例如在一项评估健康新生儿口服2型脊髓灰质炎疫苗的安全性研究中,将患者主动报告的不良事件分为感染类、胃肠类、皮肤病等不同类别[22]。将不良事件进行分类,有利于发现危害相关的综合征,但可能导致忽视某种重要危害。若涉及这种情况,研究者应明确分类的标准以及分类是否是预先设定的。
当危害与时间相关时,研究者还应说明试验中如何计划和解释危害发生的时间、持续时间,随访时间以及复发性不良事件的计数方式(是作为不同的事件分别计数还是只算作一起不良事件),报告这些信息有利于更准确全面地了解危害。例如化疗药物产生的周围神经病变,其发病特点为早期出现,随着时间的推移而逐渐好转,其症状严重程度可能随化疗周期呈现“锯齿状模式”[23]。对于这种危害,需要在报告的时候,将症状与时间相关联。
3.4 结果
条目13a:随机分配到各组的受试者例数,接受已分配治疗的例数,以及纳入益处和危害结局分析的例数。
解读:修改条目,同上。由于筛选或脱落等原因,纳入益处和危害结局分析的人群可能是不同的[24],应分别交代。例如,治疗中使用了禁用药物的受试者,根据符合方案数据集的定义,应将其从疗效分析中排除,但该受试者接受过至少一次治疗,符合安全性数据集定义,应纳入危害分析中。此外,试验中干预措施剂量减少、停药的信息也应进行报告,并强调原因。因为虽然患者并未退出试验,但这种变化可能与危害、患者耐受性等有关。有研究[25]将停药、降低剂量等定义为重要不良事件,程度虽不如严重不良事件,但重视这些信息有助于改进干预措施,更好地应用于临床。
在长期随访的试验中,对于因危害退出的患者,应将早期和晚期退出的受试者分开描述(可区分早期和晚期危害),以提高危害相关信息的准确性。
条目14a:招募期、对益处和危害结局的随访时间,并说明具体日期。
解读:修改条目,同上。对危害评估的时间多种多样,可以在整个研究期间进行,也可以只在部分期间或特定时间点进行,甚至在疗效评估完成后继续进行,因此应明确报告对危害结局的随访时间。
CONSORT Harms 2022特殊考量:试筛期(run-in periods)。
解读:试筛期是指在随机化之前,通过给病人试验性用药,排除那些出现危害事件的病人,因此使用试筛期的试验可能会低估干预措施的危害性[26]。从评估危害的角度出发,如果试验使用了试筛期,研究者应对试筛期期间或之后因危害而被排除的患者进行报告,否则可能低估干预措施的危害性;报告的内容应包括:被排除患者的数量、基线特征以及被排除的原因等。
条目16:各组纳入每一种益处和危害结局分析的受试者数目(分母),以及是否按最初的分组分析,以及是否有任何排除。
解读:修改条目,同上。益处和危害结局指标的分析人群可能是不同的[24,27],研究者应报告清楚是哪些人群被包含在哪些分析中以及对应的受试者数目。安全性数据集可用于临床试验的危害评价,通常包括所有随机化后至少接受一次治疗的受试者。
条目17a:各组关于益处和危害的每一项主要和次要结局指标的结果,效应估计值及其精确性(如95%可信区间)
解读:修改条目,同上。要求对危害的结局指标,也应提供结果、效应值和精确性(95%可信区间)等信息。在报告危害时,建议将其分为系统和非系统评价,并且无论危害是否与干预措施有关,均进行报告;同时要求在报告中明确以下内容:① 报告的是至少出现一种不良事件的参与者人数(发生率)还是每单位时间内不良事件的发生数(率),以及复发性不良事件是否包括在内;② 严重不良事件的发生情况;③ 报告危害发生的时间并明确指出危害与暴露时间的相关性。因为暴露时间不同,患者出现危害的可能性也不同;④ 如果进行了归因分析,即使危害被认为与干预措施无关,也应报告。
条目17a2:对于试验报告中省略的结局(益处和危害),应提供未报告的理由,并指出可以从何处获得省略的数据。
解读:新增条目。在一篇文章中同时报告益处和危害,可帮助研究者更好的权衡干预措施的利弊,但由于文章篇幅有限、有大量预先设定的次要结局指标等原因,研究者可能无法在正文中同时报告所有益处和危害的结果。当出现这种情况时,研究者应说明未在正文中报告的原因,以及在何处可以获得省略的数据。如果未能在附件中提供省略的数据,也需说明原因。
条目17b:对于益处和危害的结局,建议同时提供相对效应值和绝对效应值。
解读:修改条目,同上。危害的结局指标常被定义为二分类变量,这种情况下遵循CONSORT指南要求,同时提供带有可信区间的相对和绝对效应值是合适的。然而对于非系统评价的危害,应谨慎使用相对和绝对效应值,因为这些结果不是主动收集的。研究者对危害进行主动监测能更及时、客观地获得相关信息,若依赖于被动监测可能导致报告不及时、漏报率高等问题,进而低估危害的发生率[28]。建议对项目17a和17b的报告应视情况而定,而不仅仅基于结果是否是二分类变量。
条目17c:如果未观察到危害,则报告零事件。
解读:新增条目。要求研究者如果未观察到任何危害发生,应在RCT中明确报告结果为无不良事件发生,而不能选择不报告,使读者明确该研究是未进行监测危害,还是监测了但未观察到危害发生,亦或是监测并观察到危害但未进行报告,提高研究透明度。
条目18:对益处和危害结局所做的其他分析的结果,包括亚组分析和校正分析,指出哪些是预先设定的分析,哪些是非预先设定的分析。
解读:修改条目,同上。要求研究者对益处和危害所做的其他分析给予同等重视。与益处的亚组分析相似,危害也应报告分析了哪些亚组、选择这些亚组的原因以及亚组间差异的大小和方向是否是预先设定的。对危害的亚组分析是有意义的,例如某干预措施在全部研究对象中观察到的危害性是可接受的,但研究者可能还想知道在一些特定亚组中该干预措施的危害性是否同样可以接受,因此可能会做亚组分析;并且越来越多的监管机构在新药上市前,会要求对年龄、性别、种族等进行亚组分析[12],以全面评价新药安全性,尽可能保证用药安全。
3.5 讨论
条目20:试验的局限性、与收集或报告危害数据有关的潜在偏倚和不精确的原因、以及出现多种分析结果或进行选择分析的原因(如果有这种情况)。
解读:修改条目,同上。研究者应注意报告危害相关的局限性,包括无结论性的发现、对危害的检验效能低、事后分析、短期干预可能无法发现长期治疗后产生的危害、仅报告出现危害事件的患者比例而忽视了重复出现的危害事件、由于危害停止干预后导致患者数据缺失等。在报告局限性时,建议同时说明为减少局限性所采取的措施。例如由于危害导致停止干预后,患者的部分数据缺失,采用多重插补等方式处理缺失值。
条目24:在哪里可以获取完整的试验方案和其他相关文件,包括与危害有关的补充信息。
解读:修改条目,同上。有研究显示,在临床试验中,普遍存在危害报告不充分的问题[5]。虽然Harms 2022要求尽可能在一篇文章中同时报告益处与危害以方便权衡利弊,但受篇幅限制等原因,在正文中报告关于危害的所有信息可能是困难的,因此建议研究者将未能在正文中报告的危害相关信息以附件或补充材料的方式提供给读者,并说明在哪里可以获取到这些信息。
4 讨论
CONSORT声明被广泛用于提高RCT的质量,已得到500多家医学期刊的认可,包括Lancet、BMJ、JAMA等。Harms 2022通过将危害有关的条目融入到CONSORT中,对试验中危害的报告提出最低限度的要求。其中1b、2b、6a等13个条目是在CONSORT 2010原条目基础上通过添加“益处和危害(benefits and harms)”这一短语进行修改的,旨在要求研究者在报告中同时提供干预措施益处和危害的证据;对新增的6c、17a2和17c条目内容进行对比,发现3个条目分别提到了“非预先设定的危害”“省略报告的危害”“未观察到危害”,说明Harms 2022强调全面详细地报告危害。危害报告的缺失容易给读者带来困惑且不利于全面衡量干预措施的利弊关系。例如在正文中省略报告危害,可能会使读者不清楚该研究是未监测危害,还是监测了但未观察到危害发生,亦或是监测并观察到了危害但未报告。这提示研究者在开展RCT时,应尽可能详细报告所有危害,如未观察到危害,应明确报告无危害发生,必要时可添加相关补充材料。此外,Harms 2022减少了危害报告中的各类偏倚,如对危害的结局评估者设盲可减少测量偏倚,区分预先设定和非预先设定的危害可减少报告偏倚,完整报告纳入危害结局分析的人数及是否有任何排除可减少随访偏倚。与Harms 2004相比,Harms 2022的最大变化是将危害有关的项目整合到CONSORT 2010中,不再设为单独的扩展版;其次,有综述[15]表明,Harms 2004中包含多个组成部分的条目不利于危害的报告,而Harms 2022通过在CONSORT基础上进行条目的修改和增加,使危害的报告条目更加清晰;最后,在条目方面Harms 2022新增了一条对危害补充信息报告的要求。
几乎所有医疗干预措施都会对人体存在或多或少的不良影响,因此评价某项干预措施时,不但要了解其益处,还要知道其危害性,综合权衡益害后才能明确其临床应用价值[2]。但是大量证据显示,迄今为止临床试验中危害的报告仍不充分[3,6],其原因可能在于从申办者到研究者都存在对危害的概念认识不清和报告意识薄弱的问题[4];除此之外,我国在对临床试验的安全监管方面存在不足,导致一些研究的申办者可能会对试验进行干预以减少不良事件的记录。
Harms 2022是在CONSORT 2010的基础上,结合Harms 2004,经过严格的文献综述、专家咨询(德尔菲法)和面对面共识会议等步骤修订而成,可信度高。因此建议发表RCT的医学期刊将该声明引入稿约或作者须知,同时建议研究者、期刊审稿人、编辑等参考本声明不断规范和完善RCT中危害的报告。作为医学期刊编辑,应合理应用该声明审阅和评价稿件内容,引导研究者按照声明开展临床研究,做到完整、清晰和透明地报告干预措施的益处和危害,从而达到提高期刊质量的目的。作为研究者,在试验设计和实施阶段,即参考本声明考虑对干预措施益处和危害的评估,最终在论文中向读者详细报告有关干预措施益害关系的充分信息。另外,可以开展有效的宣传教育以提高研究者、期刊编辑等对本清单的知晓率,提高研究者对危害报告的重视程度。
本文对Harms 2022报告清单进行解读,旨在帮助研究者更好地理解和应用该声明,以期为提高RCT中危害的报告质量提供帮助,不断促进研究者完整透明地报告RCT中干预措施的益处和危害,有利于全面评估干预措施的益害关系,使其更好地服务于临床,最终提高临床诊疗水平、促进患者健康。
干预措施的益害关系对临床应用的选择及证据评价尤为重要[1]。几乎所有医疗干预措施都会对人体存在或多或少的不良影响,因此评价某项干预措施时,不但要了解其益处,还要知道其危害性,以综合权衡益害比[2],明确临床应用价值。但是由于干预和随访时间短、计划和设计不充分、文章篇幅有限、研究人员报告意识差[3]、缺乏监督管理机构[4]等原因,临床试验中对危害的报告仍存在不足[5,6]。干预措施的危害会严重影响患者的生活质量[7]和治疗依从性[8],并增加患者和卫生系统的经济成本[9]。为了让患者和医疗保健提供者做出真正明智的决定,建议在临床试验中同时报告益处和危害的证据。
随机对照试验(randomized controlled trial,RCT)是目前国际上公认的评价干预措施效果的金标准,为规范RCT的报告,1996年David Moher和Drummond Rennie教授起草了第一版CONSORT声明[10],该版声明并未对危害的报告提出要求;随后在2001年的修订版中增加了一项关于危害的条目[11],但仅这一项条目并不能充分反映危害相关问题的重要性;因此,CONSORT工作组集中讨论了如何改进这一不足,于2004年发布了《更好地报告随机试验中的危害:CONSORT声明扩展版》(简称“Harms 2004”),对危害的完整报告提供了具体指导[12]。然而,该版声明并未得到广泛应用。有研究发现自Harms 2004发布以来,RCT中危害的报告情况略有改善但仍不理想,Harms 2004中有一半条目的报告率低于50%[13]。有系统评价对2015—2016年发表在BMJ、JAMA、NEJM、Lancet期刊上的RCT进行分析,发现所有纳入研究均未使用Harms 2004以规范危害的报告[6]。尽管CONSORT已获得众多医学期刊的认可,但大部分医学期刊的投稿说明中并未明确提及其危害扩展版,Harms 2004的认可度仍亟待提高。
为改善临床试验中危害报告不充分的情况,CONSORT工作组对Harms 2004进行了更新,于2023年4月在BMJ杂志上发布了《CONSORT危害2022声明、解释与说明:随机试验危害报告指南的更新版》(简称“Harms 2022”)。本文对Harms 2022所有条目进行中文解读,旨在帮助研究人员更好地理解与应用该声明,以期为提高临床研究中危害的报告质量提供帮助。
1 Harms 2022声明简介
与Harms 2004不同,Harms 2022不再被设为独立的扩展版,而是将危害有关的条目整合到CONSORT中,目的是促进RCT中干预措施利弊关系的完整透明报告。该清单包括标题和摘要、引言、方法、结果、讨论和其他信息6个部分共16个条目,其中新增的3个条目,分别是6c、17a2和17c,以减少潜在的报告偏倚;17a2要求如果在正文中未报告危害,应提供原因(如在附件中补充报告、未监测危害、未观察到危害发生等)以及是否可以从其他地方获得数据;17c要求若没有观察到危害,应清楚报告是零事件。另外13个条目(1b、2b、6a、11a、12a、13a、14a、16、17a、17b、18、20和24)在CONSORT原条目的基础上通过添加“益处和危害(benefits and harms)”这一短语进行最低限度的修改。CONSORT 2010[14]和Harms 2022[15]的条目清单比较见表1。Harms 2004中的条目5、6、8包含多个组成部分,给危害的报告带来挑战,Harms 2022对这些条目进行了细化,使其更加清晰,并新增了条目24,是关于试验方案的报告。Harms 2004[12]与Harms 2022[15]条目清单比较见表2。
2 术语
Harms 2022将危害定义为干预或治疗过程中可能产生的不良后果的总和,将不良事件和药物不良反应作为描述危害的另一个术语,多用于监督管理研究。声明中还明确提到不推荐使用其他术语来描述危害,例如“安全性(safety)”“副作用(side effect)”“风险(risk)”。应用“安全性”一词报告危害的研究很多[16,17],但“安全性”一词有一定的误导性,可能暗示干预措施的危害很小或没有危害,应尽量避免使用;“副作用”指应用治疗量的药物后出现的与治疗目的无关的药理作用,会随着治疗目的的不同而有所改变,并暗示与干预措施的机制有关。例如,阿托品在临床上有广泛应用,可解除胃肠道平滑肌痉挛、抑制腺体分泌、扩瞳(表现为视物不清)等[18]。当患者服用阿托品治疗胃肠道疼痛时,视物不清是其副作用;而作为眼科扩瞳药物时,视物不清又是其药理作用。因此虽然副作用有时会引起一定的不适,但并非一定指有害的作用。除此之外,参加德尔菲调查的患者代表们认为副作用一词低估了危害的严重性,不推荐使用;“风险”一词强调不确定性,通俗来讲,指的是发生某事件的概率,并不能用来表示事件的性质。当用风险一词描述危害时,其实际代表的是该干预措施发生危害的概率。同时要求避免使用一些没有明确含义、模棱两可的术语,例如“意外事件(unintended events)”、“预期事件(anticipated events)”等。
Harms 2022要求在试验中应说明危害的结局是否是预先设定的,如果是,还应说明如何监测危害(系统评估还是非系统评估)。其中预先设定是指在方案中明确定义的结局指标,非预先设定是指试验方案或试验注册之外的结局指标。系统评估是指使用标准化的临床检查、问卷调查和医疗器械测量受试者的相关指标;非系统评估则是指对危害进行被动或非结构化报告,是患者在无提示的基础上进行的自发报告,因此可以发现先前未报告过的危害,尤其是当多个受试者出现相同的危害事件,可以对系统评估做有意义的补充。
在危害报告中使用不规范的术语,可能会误导读者、低估危害严重性等,Harms 2022对术语的使用做了进一步规范,可以提高研究者对危害的重视程度,平衡好RCT研究中对益处和危害的报告。
3 条目解读
3.1 标题和摘要
条目1b:结构式摘要,包括试验设计、方法、益处和危害结局的结果、结论几个部分(具体的指导建议见“CONSORT for abstracts”)。
解读:修改条目,通过添加“benefits and harms”短语。摘要中危害的报告若缺乏准确性和完整性可能会对读者造成误导或带来困惑,尤其是对于那些无法获取全文的读者。例如在摘要中只报告益处而未提及危害,可能会使读者不清楚该研究是未监测危害,还是监测了但未观察到危害发生,亦或是监测并观察到了危害但未报告。此外,在摘要中使用模棱两可的描述(如“安全”“耐受良好”)可能误导读者认为该干预措施是安全的。因此在摘要的结果部分,应同时报告益处和危害。
3.2 引言
条目2b:对益处和危害结局的具体目的或假设。
解读:修改条目,同上。几乎所有医疗干预措施都会对人体存在或多或少的不良影响,因此评价某项干预措施时,不但要了解其益处,还要知道其危害性。该条目要求研究者在引言部分同时说明试验计划中对益处和危害的考虑。报告时可以用一句话概括,如“我们假设,与假经颅直流电刺激(transcranial direct current stimulation,tDCS)相比,tDCS对抑郁症的疗效更佳,并且两组的不良事件发生率相似”[19]。
3.3 方法
条目6a:完整而确切地说明预先设定的主要和次要结局指标,包括益处和危害,以及它们是在何时、如何测评的。
解读:修改条目,同上。危害应该被视为重要的结局指标进行详细说明,其原则是提供的信息要足以使他人也能够使用这些指标。对预先设定并进行系统评估的危害,应提供定义(如失眠)、具体的测量工具(如失眠的严重程度指数)、评估指标(如较基线的变化值、疗后值、时间-事件)、统计指标(如均值、中位数、比例)、每个结局指标收集的时间点等;对于非系统评估的危害,则应详细说明收集患者危害信息的具体方法及时间点(如附上一个空白的病例报告表)。若预先设定的结局指标在评估的时间点、统计指标等方面存在改动,也应进行报告,明确这些信息可减少潜在的报告偏倚,提高可信度。
关于测量方式,建议研究中尽可能使用标准化和确证过的测量工具来监测危害。例如艾森贝格(Asberg)抗抑郁药不良反应量表可用于评定患者服用抗抑郁药后的不良反应、诺氏(Naranjo's)评估量表可用来评价和确定药物使用与药物不良反应之间的相关性及紧密程度。关于如何选择测量工具,COSMIN(consensus-based standards for the selection of health measurement instruments)等指南中有具体指导。
条目6c:描述是否以及如何确定非预先设定的益处和危害结局,包括任何选择标准,如果适用的话。
解读:新增条目。在试验报告中增加非预先设定的结局指标是一个备受关注的问题[20],一项研究评估了2015年10月至11月发表在BMJ、JAMA、Lancet、NEJM、Ann Intern Med期刊上的所有试验,发现纳入的67个试验共增加了365个结局指标,但只有13.7%的结局指标被描述为非预先设定[21]。预先设定的结局和最终报告的结局之间的差异会给试验带来选择性报告偏倚,因此要求研究者在试验报告中说明是否有非预先设定的益处和危害结局指标。如果有,还应报告哪些是非预先设定的结局,增加这些结局的原因以及采用的测量工具、评估指标、统计指标以及每个指标的采集时间等。
条目11a:如果实施了盲法,分配干预措施之后对谁设盲(例如受试者、医护提供者、益处和危害的结局评估者)以及盲法是如何实施的。
解读:修改条目,同上。研究者在试验过程中可能会倾向于使干预组的危害少于对照组,而对危害的结局评估者设盲可减少其个人倾向对结局评估的影响。如果可以的话,可以选择设立外部委员会,由委员会的成员对危害进行评估和归因分析。患者是否设盲对危害评估也可能会造成影响。例如明确知道自己服用的是安慰剂的患者(已破盲)和不确定自己服用的是药物还是安慰剂的患者(未破盲),二者对危害的报告可能是不同的,主要取决于患者的预期是积极还是消极。
条目12a:用于比较各组益处和危害的主要和次要结局指标的统计学方法。
解读:修改条目,同上。要求研究者报告每个结局指标所采用的统计学方法,包括益处和危害的,并说明这些方法是否是预先设定的。对于非系统评价的危害,很多研究在统计分析之前会对其进行编码并分组。例如在一项评估健康新生儿口服2型脊髓灰质炎疫苗的安全性研究中,将患者主动报告的不良事件分为感染类、胃肠类、皮肤病等不同类别[22]。将不良事件进行分类,有利于发现危害相关的综合征,但可能导致忽视某种重要危害。若涉及这种情况,研究者应明确分类的标准以及分类是否是预先设定的。
当危害与时间相关时,研究者还应说明试验中如何计划和解释危害发生的时间、持续时间,随访时间以及复发性不良事件的计数方式(是作为不同的事件分别计数还是只算作一起不良事件),报告这些信息有利于更准确全面地了解危害。例如化疗药物产生的周围神经病变,其发病特点为早期出现,随着时间的推移而逐渐好转,其症状严重程度可能随化疗周期呈现“锯齿状模式”[23]。对于这种危害,需要在报告的时候,将症状与时间相关联。
3.4 结果
条目13a:随机分配到各组的受试者例数,接受已分配治疗的例数,以及纳入益处和危害结局分析的例数。
解读:修改条目,同上。由于筛选或脱落等原因,纳入益处和危害结局分析的人群可能是不同的[24],应分别交代。例如,治疗中使用了禁用药物的受试者,根据符合方案数据集的定义,应将其从疗效分析中排除,但该受试者接受过至少一次治疗,符合安全性数据集定义,应纳入危害分析中。此外,试验中干预措施剂量减少、停药的信息也应进行报告,并强调原因。因为虽然患者并未退出试验,但这种变化可能与危害、患者耐受性等有关。有研究[25]将停药、降低剂量等定义为重要不良事件,程度虽不如严重不良事件,但重视这些信息有助于改进干预措施,更好地应用于临床。
在长期随访的试验中,对于因危害退出的患者,应将早期和晚期退出的受试者分开描述(可区分早期和晚期危害),以提高危害相关信息的准确性。
条目14a:招募期、对益处和危害结局的随访时间,并说明具体日期。
解读:修改条目,同上。对危害评估的时间多种多样,可以在整个研究期间进行,也可以只在部分期间或特定时间点进行,甚至在疗效评估完成后继续进行,因此应明确报告对危害结局的随访时间。
CONSORT Harms 2022特殊考量:试筛期(run-in periods)。
解读:试筛期是指在随机化之前,通过给病人试验性用药,排除那些出现危害事件的病人,因此使用试筛期的试验可能会低估干预措施的危害性[26]。从评估危害的角度出发,如果试验使用了试筛期,研究者应对试筛期期间或之后因危害而被排除的患者进行报告,否则可能低估干预措施的危害性;报告的内容应包括:被排除患者的数量、基线特征以及被排除的原因等。
条目16:各组纳入每一种益处和危害结局分析的受试者数目(分母),以及是否按最初的分组分析,以及是否有任何排除。
解读:修改条目,同上。益处和危害结局指标的分析人群可能是不同的[24,27],研究者应报告清楚是哪些人群被包含在哪些分析中以及对应的受试者数目。安全性数据集可用于临床试验的危害评价,通常包括所有随机化后至少接受一次治疗的受试者。
条目17a:各组关于益处和危害的每一项主要和次要结局指标的结果,效应估计值及其精确性(如95%可信区间)
解读:修改条目,同上。要求对危害的结局指标,也应提供结果、效应值和精确性(95%可信区间)等信息。在报告危害时,建议将其分为系统和非系统评价,并且无论危害是否与干预措施有关,均进行报告;同时要求在报告中明确以下内容:① 报告的是至少出现一种不良事件的参与者人数(发生率)还是每单位时间内不良事件的发生数(率),以及复发性不良事件是否包括在内;② 严重不良事件的发生情况;③ 报告危害发生的时间并明确指出危害与暴露时间的相关性。因为暴露时间不同,患者出现危害的可能性也不同;④ 如果进行了归因分析,即使危害被认为与干预措施无关,也应报告。
条目17a2:对于试验报告中省略的结局(益处和危害),应提供未报告的理由,并指出可以从何处获得省略的数据。
解读:新增条目。在一篇文章中同时报告益处和危害,可帮助研究者更好的权衡干预措施的利弊,但由于文章篇幅有限、有大量预先设定的次要结局指标等原因,研究者可能无法在正文中同时报告所有益处和危害的结果。当出现这种情况时,研究者应说明未在正文中报告的原因,以及在何处可以获得省略的数据。如果未能在附件中提供省略的数据,也需说明原因。
条目17b:对于益处和危害的结局,建议同时提供相对效应值和绝对效应值。
解读:修改条目,同上。危害的结局指标常被定义为二分类变量,这种情况下遵循CONSORT指南要求,同时提供带有可信区间的相对和绝对效应值是合适的。然而对于非系统评价的危害,应谨慎使用相对和绝对效应值,因为这些结果不是主动收集的。研究者对危害进行主动监测能更及时、客观地获得相关信息,若依赖于被动监测可能导致报告不及时、漏报率高等问题,进而低估危害的发生率[28]。建议对项目17a和17b的报告应视情况而定,而不仅仅基于结果是否是二分类变量。
条目17c:如果未观察到危害,则报告零事件。
解读:新增条目。要求研究者如果未观察到任何危害发生,应在RCT中明确报告结果为无不良事件发生,而不能选择不报告,使读者明确该研究是未进行监测危害,还是监测了但未观察到危害发生,亦或是监测并观察到危害但未进行报告,提高研究透明度。
条目18:对益处和危害结局所做的其他分析的结果,包括亚组分析和校正分析,指出哪些是预先设定的分析,哪些是非预先设定的分析。
解读:修改条目,同上。要求研究者对益处和危害所做的其他分析给予同等重视。与益处的亚组分析相似,危害也应报告分析了哪些亚组、选择这些亚组的原因以及亚组间差异的大小和方向是否是预先设定的。对危害的亚组分析是有意义的,例如某干预措施在全部研究对象中观察到的危害性是可接受的,但研究者可能还想知道在一些特定亚组中该干预措施的危害性是否同样可以接受,因此可能会做亚组分析;并且越来越多的监管机构在新药上市前,会要求对年龄、性别、种族等进行亚组分析[12],以全面评价新药安全性,尽可能保证用药安全。
3.5 讨论
条目20:试验的局限性、与收集或报告危害数据有关的潜在偏倚和不精确的原因、以及出现多种分析结果或进行选择分析的原因(如果有这种情况)。
解读:修改条目,同上。研究者应注意报告危害相关的局限性,包括无结论性的发现、对危害的检验效能低、事后分析、短期干预可能无法发现长期治疗后产生的危害、仅报告出现危害事件的患者比例而忽视了重复出现的危害事件、由于危害停止干预后导致患者数据缺失等。在报告局限性时,建议同时说明为减少局限性所采取的措施。例如由于危害导致停止干预后,患者的部分数据缺失,采用多重插补等方式处理缺失值。
条目24:在哪里可以获取完整的试验方案和其他相关文件,包括与危害有关的补充信息。
解读:修改条目,同上。有研究显示,在临床试验中,普遍存在危害报告不充分的问题[5]。虽然Harms 2022要求尽可能在一篇文章中同时报告益处与危害以方便权衡利弊,但受篇幅限制等原因,在正文中报告关于危害的所有信息可能是困难的,因此建议研究者将未能在正文中报告的危害相关信息以附件或补充材料的方式提供给读者,并说明在哪里可以获取到这些信息。
4 讨论
CONSORT声明被广泛用于提高RCT的质量,已得到500多家医学期刊的认可,包括Lancet、BMJ、JAMA等。Harms 2022通过将危害有关的条目融入到CONSORT中,对试验中危害的报告提出最低限度的要求。其中1b、2b、6a等13个条目是在CONSORT 2010原条目基础上通过添加“益处和危害(benefits and harms)”这一短语进行修改的,旨在要求研究者在报告中同时提供干预措施益处和危害的证据;对新增的6c、17a2和17c条目内容进行对比,发现3个条目分别提到了“非预先设定的危害”“省略报告的危害”“未观察到危害”,说明Harms 2022强调全面详细地报告危害。危害报告的缺失容易给读者带来困惑且不利于全面衡量干预措施的利弊关系。例如在正文中省略报告危害,可能会使读者不清楚该研究是未监测危害,还是监测了但未观察到危害发生,亦或是监测并观察到了危害但未报告。这提示研究者在开展RCT时,应尽可能详细报告所有危害,如未观察到危害,应明确报告无危害发生,必要时可添加相关补充材料。此外,Harms 2022减少了危害报告中的各类偏倚,如对危害的结局评估者设盲可减少测量偏倚,区分预先设定和非预先设定的危害可减少报告偏倚,完整报告纳入危害结局分析的人数及是否有任何排除可减少随访偏倚。与Harms 2004相比,Harms 2022的最大变化是将危害有关的项目整合到CONSORT 2010中,不再设为单独的扩展版;其次,有综述[15]表明,Harms 2004中包含多个组成部分的条目不利于危害的报告,而Harms 2022通过在CONSORT基础上进行条目的修改和增加,使危害的报告条目更加清晰;最后,在条目方面Harms 2022新增了一条对危害补充信息报告的要求。
几乎所有医疗干预措施都会对人体存在或多或少的不良影响,因此评价某项干预措施时,不但要了解其益处,还要知道其危害性,综合权衡益害后才能明确其临床应用价值[2]。但是大量证据显示,迄今为止临床试验中危害的报告仍不充分[3,6],其原因可能在于从申办者到研究者都存在对危害的概念认识不清和报告意识薄弱的问题[4];除此之外,我国在对临床试验的安全监管方面存在不足,导致一些研究的申办者可能会对试验进行干预以减少不良事件的记录。
Harms 2022是在CONSORT 2010的基础上,结合Harms 2004,经过严格的文献综述、专家咨询(德尔菲法)和面对面共识会议等步骤修订而成,可信度高。因此建议发表RCT的医学期刊将该声明引入稿约或作者须知,同时建议研究者、期刊审稿人、编辑等参考本声明不断规范和完善RCT中危害的报告。作为医学期刊编辑,应合理应用该声明审阅和评价稿件内容,引导研究者按照声明开展临床研究,做到完整、清晰和透明地报告干预措施的益处和危害,从而达到提高期刊质量的目的。作为研究者,在试验设计和实施阶段,即参考本声明考虑对干预措施益处和危害的评估,最终在论文中向读者详细报告有关干预措施益害关系的充分信息。另外,可以开展有效的宣传教育以提高研究者、期刊编辑等对本清单的知晓率,提高研究者对危害报告的重视程度。
本文对Harms 2022报告清单进行解读,旨在帮助研究者更好地理解和应用该声明,以期为提高RCT中危害的报告质量提供帮助,不断促进研究者完整透明地报告RCT中干预措施的益处和危害,有利于全面评估干预措施的益害关系,使其更好地服务于临床,最终提高临床诊疗水平、促进患者健康。