循证临床实践指南的证据到推荐意见的转化往往是复杂且繁琐的。本文主要阐述两部分内容:首先介绍证据及推荐意见分级的演进过程;其次,根据目前已有的、具有代表性的指南手册,分析推荐意见制定时存在的问题,总结证据到推荐意见的形成途径,并陈述形成最终推荐意见的方法。目前,虽尚无完善的、严谨的方法学指导证据到推荐意见的转化,但部分组织针对推荐意见的制定提供了不同的内容框架或辅助工具,国内循证临床实践指南制定者可借鉴其经验,结合本国国情,构建本土化的形成推荐意见的方法。
引用本文: 王云云, 靳英辉, 陈耀龙, 曾宪涛, 陈昊, 王利, 陆翠, 曹虹. 循证临床实践指南推荐意见形成的方法分析. 中国循证医学杂志, 2017, 17(9): 1085-1092. doi: 10.7507/1672-2531.201612007 复制
2011 年,美国医学科学院(institute of medicine,IOM)指出临床实践指南是针对患者特定的临床问题,基于系统评价形成的证据,对各种备选干预方式进行全面的利弊平衡分析,并提出最优指导意见[1]。该组织强调了基于证据制定临床实践指南的重要性。一些国际组织专门开发了指南手册,用以指导循证临床实践指南(evidence-based clinical practice guideline,E-CPG)的制定。我国也于 2016 年 1 月发布了国内首部“指南的指南”[2]。指南手册的发布对规范和严谨地制定 E-CPG 起到极大的促进作用,但研究显示现有的循证指南仍然存在一定的方法学缺陷,尤其在证据到推荐意见的转化过程缺乏透明性及清晰性[3-5]。然而证据是 E-CPG 的基础,推荐意见是 E-CPG 的核心内容,它们的概念、内涵的逐步发展及证据到推荐意见的转化过程对 E-CPG 推荐意见的制定有重要意义。本文旨在总结 E-CPG 推荐意见制定的方法,以期为我国 E-CPG 制定者提供可参考的建议。
1 证据及推荐意见分级的历史进展
自 20 世纪 60 年代,美国两位社会学家 Campbell 和 Stanley 首次引入证据分级概念后[6-8],随着循证医学和临床流行病学的逐步发展,证据的分级标准、证据与推荐意见的关系等概念和内涵也在持续不断地完善(表 1)。主要表现在以下几个方面:证据分级标准从单一因素考虑(试验设计)到多因素(研究质量、间接性和结果一致性等)综合评定;最高级别证据的定义标准从单个 RCT 到多个 RCT 的 Meta 分析;证据的来源愈发广泛,逐步纳入系统评价、动物研究和中医文献等;证据的分类从单一走向多样化(治疗、预防和经济学分析等);证据与推荐意见的关系从最初的相互独立、绝对对应(高质量证据的推荐强度也高),发展成相互影响又相互制约的关系(高质量证据的推荐强度不一定高)。

2 从证据到推荐意见的形成
2.1 制定推荐意见时考虑的标准
以往证据质量等级与推荐强度等级一一对应,如高质量证据常常意味着强推荐,即研究者在制定推荐级别时只考虑证据质量这一唯一因素。随后,越来越多的学者认识到此方法存在弊端,推荐意见的制定不再单一地依赖证据质量,各指南工作组仍需考虑患者的价值观和偏好、成本、利弊平衡、临床意义等因素(表 2)。目前多个学术组织制定了指南手册,其中对推荐意见在制定时需考虑因素的规定不完全相同。

2.1.1 “证据质量”、“证据体质量”的内涵有所不同 E-CPG 强调推荐意见的制定应着重考虑其收集的证据质量。证据质量是指对预测值的真实性有多大把握[31]。GRADE 工作组对不同级别的证据质量提出明确定义,如高质量证据,GRADE 工作组最初认为其是指进一步研究也不可能改变该疗效评估结果可信度的证据;随后,又将其定义为研究者非常确信真实的效应值接近效应估计的证据。而低质量证据,GRADE 工作组原先将其定义为进一步研究极有可能影响该疗效评估结果的可信度,且该评估结果很可能改变;随后,又将其解释为对效应估计值的确信程度有限:真实值可能与估计值不相同[32-34]。“证据质量”等级概念描述的具体化,方便研究者对证据质量的正确理解,并对证据进行质量评价和分级。
然而在不同组织或机构制定的指南手册或指南标准中,“证据质量”的内涵有所不同。一方面,如 ESHRE[18]、ASCO[26]、纽约州立大学等[19]认为证据质量既可以是单个或多个研究的质量,又可以是系统评价的质量。另一方面,有些组织虽以“证据体”为单位对证据进行质量分级,但对证据体质量的含义阐述不完全相同。GRADE 工作组将证据体(body of evidence)定义为系统评价的效应指标,且其质量是综合考虑系统评价纳入研究的偏倚风险、发表偏倚、不一致性及间接性等因素而评定的[35]。AAN[16]、KHA-CARI[25]、MINDS 项目组[21]等均应用 GRADE 系统对“证据体”进行质量评价。NHMRC[14]在其指南手册中也应用了“证据体”一词,但它认为“证据体”由证据基础(evidence base)、一致性(consistency)、临床意义(clinical impact)、普遍性(generalizability)、应用性(applicability)5 个要素构成,其中证据基础包括证据数量(quantity of evidence)、证据水平(level of evidence)以及证据质量(quality of evidence)。这与 GRADE 证据分级有一定的相似性,也有一些区别,其除了考虑研究结果间的一致性和纳入研究的质量等因素,也考虑了推荐意见在应用时需要评估的因素,如临床意义、普遍性、应用性(表 2)。
2.1.2 制定推荐意见时考虑的因素不完全相同 如表 2 所示,不同组织或机构在推荐意见制定时考虑的因素有相同也有不同。患者的价值观和意愿[15, 16, 19-22, 24, 25]、推荐意见实施时需要的成本或资源及实施后所带来的利弊[13, 15-22, 24, 25]、推荐意见应用时需要的临床条件与实践中具体临床环境的差距[14, 22-24, 27]是指南制定者常常考虑的因素。推荐意见制定时考虑的因素不同之处如:ASCO 是美国临床肿瘤协会组织,致力于通过研究、教育及推广最优质的病人治疗护理方案以应对肿瘤,在其指南制定手册中提及推荐意见制定时需关注肿瘤专家与患者的沟通方式这一主题[26];HICPAC[13]则认为其制定的推荐意见内容应与 FDA、EPA 的政策保持一致;NICE[30]注意社会价值观、伦理性对推荐意见的影响;而 WHO[22]、SIGN[24]在推荐意见制定时还考虑临床问题的优先性、推荐意见的可接受性及可行性等因素。
2.1.3 相同的因素在不同指南手册或标准中的阐述有所不同 虽然各组织或机构制定推荐意见时考虑的标准有诸多相同之处,但具有相同措辞的标准其含义又略有差异。比如:关于成本的含义,一般来说,成本即指推荐意见实施时需要的器械、药品、人员等物质或非物质成本,且其与干预效果的关系直接影响患者对推荐意见的选择。因此,指南制定者可从成本-效果分析结果[29]或将其与临床应用效果[30]结合等角度评估推荐意见。SIGN[24]进行成本分析时,特别强调了患者、卫生保健体系或医疗机构对成本的要求不同。然而,有些机构仅考虑纳入文献中提及的成本及成本效果问题,并未将“成本”作为推荐意见制定时必须评估的标准[27]。
普遍性和应用性是推荐意见制定时常考虑的因素,其含义相似,往往是指推荐意见在目标人群中可推广的程度及推荐意见在临床情境中的适应程度。NHMRC[14]认为“普遍性”是指证据中的研究人群及临床情境与指南的应用人群、推荐意见将被应用的临床环境的匹配程度;并将“应用性”解释为证据与其所在的国家卫生保健系统或推荐意见应用的临床情境的相关性,比如文化或组织基础等。而 BTS[27]、MoHM[28]、AAN[16]仅将普遍性或应用性作为推荐意见制定时考虑的标准,并未给予详细的解释。
针对价值观和偏好,不同组织设立该项推荐意见评估标准的出发点不同,大部分指南制定机构考虑的是患者或照顾者的价值观和偏好对推荐意见的影响[19-22, 25, 30],而有的组织考虑的是指南制定工作组对主要结局指标的价值观和偏好[13]。
2.1.4 制定推荐意见时相同含义的因素在不同组织间的分类不同 推荐意见需评估的因素中,有的本质上含义是相同的,但在不同指南手册中的分类或归属略有所差异。比如,WHO[22]、SIGN[24]不仅将利弊平衡、资源等单独作为推荐意见制定需评估的标准,也设立可接受性、可行性标准评估其对推荐意见产生的综合影响。其中,“可接受性”是评定相关利益人员如患者、指南使用者等对干预的利与弊、成本等的可接受程度。这与 IDSA[20]、Center MG[21]只独立考虑利弊平衡、成本和资源利用分别对推荐意见的影响不同。此外,“可行性”往往考虑推荐意见实施时可能遇到的障碍因素,如资源、法律、文化等,WHO[22]、SIGN[24]均综合考虑资源的可获取性、患者的价值观或偏好、法律等对推荐意见实施的影响,并将“可行性”单独作为一个评估标准。而部分组织在推荐意见评估标准清单中,提及患者的价值观或偏好、资源、法律及公平等,未综合考虑其对推荐意见实施的整体性影响(表 2)。
2.2 从证据到推荐意见的形成途径
证据到推荐意见形成的过程往往是复杂且繁琐的,少有指南系统地记录从证据到推荐意见制定的过程[36]。如何使推荐意见制定的过程更加系统、透明是国际指南制定机构、各学术组织一直探讨的问题。指南 2.0 清单明确提出了建议:制定推荐意见时需应用结构化分析框架和透明系统的过程综合推荐意见的影响因素;选择合适的模块总结影响推荐意见的因素;规划并分享共识会议中参与者制定推荐意见的具体细节;评估模版中影响推荐意见的因素等[37, 38]。
目前,各国际指南制定机构或学术组织根据推荐意见制定时需要考虑的因素,提供了不同的内容框架或辅助工具。比如,决策模型(USPSTF)[29]、FAME 框架(JBI)[23]、GRADE 框架(WHO)[22]、DECIDE EtD 框架(SIGN)[24]等。不同的内容框架均用文字、图形或表格等形式对推荐意见制定需要评估的因素进行相关陈述,以及介绍如何用该内容框架指导指南推荐意见的制定。但每一种内容框架又各具特色,如:DECIDE EtD 框架将推荐意见的制定过程分为三个步骤:构建临床问题、评估决策考虑标准、得出结论。其中,“构建临床问题”以 PICO 的模式呈现[39],并陈述该临床问题产生的主要背景、制定推荐意见的原因和指南制定者出于何种角度(政府或卫生部门/患者)制定推荐意见等;“评估决策考虑标准”包括对利弊平衡、可接受性和可行性等因素的评定;此外,“得出结论”是指指南制定者基于临床问题和决策考虑标准的评估结果,填写指南决策表,进而总结推荐意见并阐述强推荐或弱推荐的理由、实施推荐意见时的注意事项、监测和评估标准、推荐研究等信息[40]。
E-CPG 中的系统、透明的推荐意见制定过程,不仅需要内容框架作为指导,且需要相关表格、模板等不同的辅助工具[15, 16, 18-25, 29]。比如,MIND 项目组提供推荐意见提取表格、推荐意见强度投票表格、推荐意见呈现表格、推荐意见制定过程陈述表、证据及推荐意见总结表[21]。AAN[16]在考虑推荐意见是否适应临床情境的问题时,建议利用“决策树”或“因果路径”等演绎推理的方式先将证据与推荐意见联系起来,再进一步考虑干预措施的可得性及成本等问题,并提供结论和推荐意见构建工具、推荐意见主要评估因素陈述词表格。
2.3 形成最终推荐意见的方法
推荐意见制定过程需综合考虑多种因素,然而指南制定小组成员众多,包括相关领域专家、方法学专家、一线临床医生和患者代表等,如何得出一致性较高的决策意见,专家共识在这个过程中起到重要作用。专家共识包括正式、非正式两种方式。正式的专家共识方法包括德尔菲、名义群体法、共识形成会议法;非正式专家共识指没有正式的达成共识的程序和流程,专家们自由讨论,通过自由讨论达成对一个问题的共识[41]。各指南制定组织推荐意见达成共识的方式不一。循证指南制定中采用的是正式的专家共识方法。如 ACCF/AHA[15]、ASCO[26]均在指南手册中描述了达成正式共识的具体方法,其中,ACCF/AHA 应用的是共识形成会议法,通过组织会议、遴选会议成员、确定会议讨论的问题及正式投票等过程达成共识;ASCO 采用了改良的德尔菲法,借用 5 分或 7 分的利克特量表,并制定达成共识的规则,促使达成统一的推荐意见[42]。
此外,当意见不一致时,指南制定小组可采用 GRADE 网格(GRADE Grid)达成共识指南[43],比如,《万古霉素治疗药物监测指南》项目组基于 GRADE 网格,利用改良的德尔菲法,通过 3 轮调查就推荐意见达成共识,并制定了达成共识的规则:若除了“0”以外的任何一格票数超过 50%,则视为达成共识,可直接确定推荐意见的方向和强度;若“0”某一侧两格总数超过 70%,亦视为达成共识,可确定推荐方向,推荐强度则直接定为弱;其余情况视为未达成共识,推荐意见进入下一轮投票[44](表 3)。

同时注意,应用共识方法制定推荐意见时,可能存在以下两点问题:一方面,参与共识专家的利益冲突,对推荐意见的形成有直接的影响。为解决这一问题,指南工作组可按照国际指南协会(Guideline International Network)管理利益冲突的方法[45],制订详细的利益冲突声明表,对每一位参与共识的专家,要求其如实公布所有可能的经济和非经济利益,并委托独立的第三方对利益冲突进行判断,从而确定参与共识专家的最终名单,并及时公布专家的利益冲突声明表。另一方面,共识后的推荐意见,在正式发表之前,仍需进一步送审指南制定小组之外的临床相关专家、指南使用者和其他利益相关方;评审人员名单、评审意见的处理方法、根据反馈修改完善最终推荐意见均需指南工作组预先设定,以便确保外审的有效性和独立性[46]。
2.4 推荐意见呈现的内容
指南中推荐意见呈现形式的多样性、内容准确性及完整性有利于指南使用者或研究者更加直观地查看针对特定临床问题的建议,同时有助于使用者了解推荐意见的制定过程及实施推荐意见时可能存在的问题等。多数指南制定机构均对推荐意见呈现的内容进行了阐述。其中 AAN[16]提供的推荐意见组成成分表格与 KHA-CARI[25]、纽约州立大学等[19]的推荐意见陈述清单、ESHRE[18]的原则有相似之处,均建议推荐意见应对干预措施的实施者或被实施者、干预措施具体内容、推荐意见的应用条件、干预措施的实施方式等方面进行描述。此外,IDSA[20]提供了推荐意见呈现模板,由背景(backgrounds)、临床问题(original clinical question)、推荐意见(original recommendation)、临时推荐意见(interrim recommendation)、投票(如果应用的话,if application)、证据总结(summary of the evidence)等组成。EtD 内容框架也明确指出指南工作组在对推荐意见进行总结时,要陈述强推荐或弱推荐的理由、实施推荐意见时的注意事项、监测和评估标准、推荐研究等方面的信息[47]。
现有的证据及推荐意见分级标准日渐完善,但证据到推荐意见转化的过程仍有许多问题,指南工作组在制定推荐意见时需注意以下几点:① 明确推荐意见制定时需要考虑的标准,并对每一个标准的内涵进行详细阐述;② 尽可能量化评估待考虑的标准;③ 尽可能借助于预先设计好的内容框架或辅助工具;④ 确定形成最终推荐意见的方法,并介绍达成共识的规则;⑤ 制定行之有效的方法严格管理共识阶段的利益冲突;⑥ 选择合适的评审人员,开展推荐意见外审并建立反馈机制;⑦ 运用适宜的图表等形式,清晰、透明、系统地呈现推荐意见的相关内容。
证据是循证临床实践指南的基础,但证据本身不能指导决策,推荐意见在证据应用到临床实践的过程中起到至关重要作用。目前,虽尚无完善的、严谨的证据到推荐意见形成的方法学,但部分组织提供了不同的内容框架或辅助工具指导推荐意见的制定,国内循证临床实践指南制定者可借鉴其经验,结合本国国情,构建本土化的推荐意见形成的方法学。
2011 年,美国医学科学院(institute of medicine,IOM)指出临床实践指南是针对患者特定的临床问题,基于系统评价形成的证据,对各种备选干预方式进行全面的利弊平衡分析,并提出最优指导意见[1]。该组织强调了基于证据制定临床实践指南的重要性。一些国际组织专门开发了指南手册,用以指导循证临床实践指南(evidence-based clinical practice guideline,E-CPG)的制定。我国也于 2016 年 1 月发布了国内首部“指南的指南”[2]。指南手册的发布对规范和严谨地制定 E-CPG 起到极大的促进作用,但研究显示现有的循证指南仍然存在一定的方法学缺陷,尤其在证据到推荐意见的转化过程缺乏透明性及清晰性[3-5]。然而证据是 E-CPG 的基础,推荐意见是 E-CPG 的核心内容,它们的概念、内涵的逐步发展及证据到推荐意见的转化过程对 E-CPG 推荐意见的制定有重要意义。本文旨在总结 E-CPG 推荐意见制定的方法,以期为我国 E-CPG 制定者提供可参考的建议。
1 证据及推荐意见分级的历史进展
自 20 世纪 60 年代,美国两位社会学家 Campbell 和 Stanley 首次引入证据分级概念后[6-8],随着循证医学和临床流行病学的逐步发展,证据的分级标准、证据与推荐意见的关系等概念和内涵也在持续不断地完善(表 1)。主要表现在以下几个方面:证据分级标准从单一因素考虑(试验设计)到多因素(研究质量、间接性和结果一致性等)综合评定;最高级别证据的定义标准从单个 RCT 到多个 RCT 的 Meta 分析;证据的来源愈发广泛,逐步纳入系统评价、动物研究和中医文献等;证据的分类从单一走向多样化(治疗、预防和经济学分析等);证据与推荐意见的关系从最初的相互独立、绝对对应(高质量证据的推荐强度也高),发展成相互影响又相互制约的关系(高质量证据的推荐强度不一定高)。

2 从证据到推荐意见的形成
2.1 制定推荐意见时考虑的标准
以往证据质量等级与推荐强度等级一一对应,如高质量证据常常意味着强推荐,即研究者在制定推荐级别时只考虑证据质量这一唯一因素。随后,越来越多的学者认识到此方法存在弊端,推荐意见的制定不再单一地依赖证据质量,各指南工作组仍需考虑患者的价值观和偏好、成本、利弊平衡、临床意义等因素(表 2)。目前多个学术组织制定了指南手册,其中对推荐意见在制定时需考虑因素的规定不完全相同。

2.1.1 “证据质量”、“证据体质量”的内涵有所不同 E-CPG 强调推荐意见的制定应着重考虑其收集的证据质量。证据质量是指对预测值的真实性有多大把握[31]。GRADE 工作组对不同级别的证据质量提出明确定义,如高质量证据,GRADE 工作组最初认为其是指进一步研究也不可能改变该疗效评估结果可信度的证据;随后,又将其定义为研究者非常确信真实的效应值接近效应估计的证据。而低质量证据,GRADE 工作组原先将其定义为进一步研究极有可能影响该疗效评估结果的可信度,且该评估结果很可能改变;随后,又将其解释为对效应估计值的确信程度有限:真实值可能与估计值不相同[32-34]。“证据质量”等级概念描述的具体化,方便研究者对证据质量的正确理解,并对证据进行质量评价和分级。
然而在不同组织或机构制定的指南手册或指南标准中,“证据质量”的内涵有所不同。一方面,如 ESHRE[18]、ASCO[26]、纽约州立大学等[19]认为证据质量既可以是单个或多个研究的质量,又可以是系统评价的质量。另一方面,有些组织虽以“证据体”为单位对证据进行质量分级,但对证据体质量的含义阐述不完全相同。GRADE 工作组将证据体(body of evidence)定义为系统评价的效应指标,且其质量是综合考虑系统评价纳入研究的偏倚风险、发表偏倚、不一致性及间接性等因素而评定的[35]。AAN[16]、KHA-CARI[25]、MINDS 项目组[21]等均应用 GRADE 系统对“证据体”进行质量评价。NHMRC[14]在其指南手册中也应用了“证据体”一词,但它认为“证据体”由证据基础(evidence base)、一致性(consistency)、临床意义(clinical impact)、普遍性(generalizability)、应用性(applicability)5 个要素构成,其中证据基础包括证据数量(quantity of evidence)、证据水平(level of evidence)以及证据质量(quality of evidence)。这与 GRADE 证据分级有一定的相似性,也有一些区别,其除了考虑研究结果间的一致性和纳入研究的质量等因素,也考虑了推荐意见在应用时需要评估的因素,如临床意义、普遍性、应用性(表 2)。
2.1.2 制定推荐意见时考虑的因素不完全相同 如表 2 所示,不同组织或机构在推荐意见制定时考虑的因素有相同也有不同。患者的价值观和意愿[15, 16, 19-22, 24, 25]、推荐意见实施时需要的成本或资源及实施后所带来的利弊[13, 15-22, 24, 25]、推荐意见应用时需要的临床条件与实践中具体临床环境的差距[14, 22-24, 27]是指南制定者常常考虑的因素。推荐意见制定时考虑的因素不同之处如:ASCO 是美国临床肿瘤协会组织,致力于通过研究、教育及推广最优质的病人治疗护理方案以应对肿瘤,在其指南制定手册中提及推荐意见制定时需关注肿瘤专家与患者的沟通方式这一主题[26];HICPAC[13]则认为其制定的推荐意见内容应与 FDA、EPA 的政策保持一致;NICE[30]注意社会价值观、伦理性对推荐意见的影响;而 WHO[22]、SIGN[24]在推荐意见制定时还考虑临床问题的优先性、推荐意见的可接受性及可行性等因素。
2.1.3 相同的因素在不同指南手册或标准中的阐述有所不同 虽然各组织或机构制定推荐意见时考虑的标准有诸多相同之处,但具有相同措辞的标准其含义又略有差异。比如:关于成本的含义,一般来说,成本即指推荐意见实施时需要的器械、药品、人员等物质或非物质成本,且其与干预效果的关系直接影响患者对推荐意见的选择。因此,指南制定者可从成本-效果分析结果[29]或将其与临床应用效果[30]结合等角度评估推荐意见。SIGN[24]进行成本分析时,特别强调了患者、卫生保健体系或医疗机构对成本的要求不同。然而,有些机构仅考虑纳入文献中提及的成本及成本效果问题,并未将“成本”作为推荐意见制定时必须评估的标准[27]。
普遍性和应用性是推荐意见制定时常考虑的因素,其含义相似,往往是指推荐意见在目标人群中可推广的程度及推荐意见在临床情境中的适应程度。NHMRC[14]认为“普遍性”是指证据中的研究人群及临床情境与指南的应用人群、推荐意见将被应用的临床环境的匹配程度;并将“应用性”解释为证据与其所在的国家卫生保健系统或推荐意见应用的临床情境的相关性,比如文化或组织基础等。而 BTS[27]、MoHM[28]、AAN[16]仅将普遍性或应用性作为推荐意见制定时考虑的标准,并未给予详细的解释。
针对价值观和偏好,不同组织设立该项推荐意见评估标准的出发点不同,大部分指南制定机构考虑的是患者或照顾者的价值观和偏好对推荐意见的影响[19-22, 25, 30],而有的组织考虑的是指南制定工作组对主要结局指标的价值观和偏好[13]。
2.1.4 制定推荐意见时相同含义的因素在不同组织间的分类不同 推荐意见需评估的因素中,有的本质上含义是相同的,但在不同指南手册中的分类或归属略有所差异。比如,WHO[22]、SIGN[24]不仅将利弊平衡、资源等单独作为推荐意见制定需评估的标准,也设立可接受性、可行性标准评估其对推荐意见产生的综合影响。其中,“可接受性”是评定相关利益人员如患者、指南使用者等对干预的利与弊、成本等的可接受程度。这与 IDSA[20]、Center MG[21]只独立考虑利弊平衡、成本和资源利用分别对推荐意见的影响不同。此外,“可行性”往往考虑推荐意见实施时可能遇到的障碍因素,如资源、法律、文化等,WHO[22]、SIGN[24]均综合考虑资源的可获取性、患者的价值观或偏好、法律等对推荐意见实施的影响,并将“可行性”单独作为一个评估标准。而部分组织在推荐意见评估标准清单中,提及患者的价值观或偏好、资源、法律及公平等,未综合考虑其对推荐意见实施的整体性影响(表 2)。
2.2 从证据到推荐意见的形成途径
证据到推荐意见形成的过程往往是复杂且繁琐的,少有指南系统地记录从证据到推荐意见制定的过程[36]。如何使推荐意见制定的过程更加系统、透明是国际指南制定机构、各学术组织一直探讨的问题。指南 2.0 清单明确提出了建议:制定推荐意见时需应用结构化分析框架和透明系统的过程综合推荐意见的影响因素;选择合适的模块总结影响推荐意见的因素;规划并分享共识会议中参与者制定推荐意见的具体细节;评估模版中影响推荐意见的因素等[37, 38]。
目前,各国际指南制定机构或学术组织根据推荐意见制定时需要考虑的因素,提供了不同的内容框架或辅助工具。比如,决策模型(USPSTF)[29]、FAME 框架(JBI)[23]、GRADE 框架(WHO)[22]、DECIDE EtD 框架(SIGN)[24]等。不同的内容框架均用文字、图形或表格等形式对推荐意见制定需要评估的因素进行相关陈述,以及介绍如何用该内容框架指导指南推荐意见的制定。但每一种内容框架又各具特色,如:DECIDE EtD 框架将推荐意见的制定过程分为三个步骤:构建临床问题、评估决策考虑标准、得出结论。其中,“构建临床问题”以 PICO 的模式呈现[39],并陈述该临床问题产生的主要背景、制定推荐意见的原因和指南制定者出于何种角度(政府或卫生部门/患者)制定推荐意见等;“评估决策考虑标准”包括对利弊平衡、可接受性和可行性等因素的评定;此外,“得出结论”是指指南制定者基于临床问题和决策考虑标准的评估结果,填写指南决策表,进而总结推荐意见并阐述强推荐或弱推荐的理由、实施推荐意见时的注意事项、监测和评估标准、推荐研究等信息[40]。
E-CPG 中的系统、透明的推荐意见制定过程,不仅需要内容框架作为指导,且需要相关表格、模板等不同的辅助工具[15, 16, 18-25, 29]。比如,MIND 项目组提供推荐意见提取表格、推荐意见强度投票表格、推荐意见呈现表格、推荐意见制定过程陈述表、证据及推荐意见总结表[21]。AAN[16]在考虑推荐意见是否适应临床情境的问题时,建议利用“决策树”或“因果路径”等演绎推理的方式先将证据与推荐意见联系起来,再进一步考虑干预措施的可得性及成本等问题,并提供结论和推荐意见构建工具、推荐意见主要评估因素陈述词表格。
2.3 形成最终推荐意见的方法
推荐意见制定过程需综合考虑多种因素,然而指南制定小组成员众多,包括相关领域专家、方法学专家、一线临床医生和患者代表等,如何得出一致性较高的决策意见,专家共识在这个过程中起到重要作用。专家共识包括正式、非正式两种方式。正式的专家共识方法包括德尔菲、名义群体法、共识形成会议法;非正式专家共识指没有正式的达成共识的程序和流程,专家们自由讨论,通过自由讨论达成对一个问题的共识[41]。各指南制定组织推荐意见达成共识的方式不一。循证指南制定中采用的是正式的专家共识方法。如 ACCF/AHA[15]、ASCO[26]均在指南手册中描述了达成正式共识的具体方法,其中,ACCF/AHA 应用的是共识形成会议法,通过组织会议、遴选会议成员、确定会议讨论的问题及正式投票等过程达成共识;ASCO 采用了改良的德尔菲法,借用 5 分或 7 分的利克特量表,并制定达成共识的规则,促使达成统一的推荐意见[42]。
此外,当意见不一致时,指南制定小组可采用 GRADE 网格(GRADE Grid)达成共识指南[43],比如,《万古霉素治疗药物监测指南》项目组基于 GRADE 网格,利用改良的德尔菲法,通过 3 轮调查就推荐意见达成共识,并制定了达成共识的规则:若除了“0”以外的任何一格票数超过 50%,则视为达成共识,可直接确定推荐意见的方向和强度;若“0”某一侧两格总数超过 70%,亦视为达成共识,可确定推荐方向,推荐强度则直接定为弱;其余情况视为未达成共识,推荐意见进入下一轮投票[44](表 3)。

同时注意,应用共识方法制定推荐意见时,可能存在以下两点问题:一方面,参与共识专家的利益冲突,对推荐意见的形成有直接的影响。为解决这一问题,指南工作组可按照国际指南协会(Guideline International Network)管理利益冲突的方法[45],制订详细的利益冲突声明表,对每一位参与共识的专家,要求其如实公布所有可能的经济和非经济利益,并委托独立的第三方对利益冲突进行判断,从而确定参与共识专家的最终名单,并及时公布专家的利益冲突声明表。另一方面,共识后的推荐意见,在正式发表之前,仍需进一步送审指南制定小组之外的临床相关专家、指南使用者和其他利益相关方;评审人员名单、评审意见的处理方法、根据反馈修改完善最终推荐意见均需指南工作组预先设定,以便确保外审的有效性和独立性[46]。
2.4 推荐意见呈现的内容
指南中推荐意见呈现形式的多样性、内容准确性及完整性有利于指南使用者或研究者更加直观地查看针对特定临床问题的建议,同时有助于使用者了解推荐意见的制定过程及实施推荐意见时可能存在的问题等。多数指南制定机构均对推荐意见呈现的内容进行了阐述。其中 AAN[16]提供的推荐意见组成成分表格与 KHA-CARI[25]、纽约州立大学等[19]的推荐意见陈述清单、ESHRE[18]的原则有相似之处,均建议推荐意见应对干预措施的实施者或被实施者、干预措施具体内容、推荐意见的应用条件、干预措施的实施方式等方面进行描述。此外,IDSA[20]提供了推荐意见呈现模板,由背景(backgrounds)、临床问题(original clinical question)、推荐意见(original recommendation)、临时推荐意见(interrim recommendation)、投票(如果应用的话,if application)、证据总结(summary of the evidence)等组成。EtD 内容框架也明确指出指南工作组在对推荐意见进行总结时,要陈述强推荐或弱推荐的理由、实施推荐意见时的注意事项、监测和评估标准、推荐研究等方面的信息[47]。
现有的证据及推荐意见分级标准日渐完善,但证据到推荐意见转化的过程仍有许多问题,指南工作组在制定推荐意见时需注意以下几点:① 明确推荐意见制定时需要考虑的标准,并对每一个标准的内涵进行详细阐述;② 尽可能量化评估待考虑的标准;③ 尽可能借助于预先设计好的内容框架或辅助工具;④ 确定形成最终推荐意见的方法,并介绍达成共识的规则;⑤ 制定行之有效的方法严格管理共识阶段的利益冲突;⑥ 选择合适的评审人员,开展推荐意见外审并建立反馈机制;⑦ 运用适宜的图表等形式,清晰、透明、系统地呈现推荐意见的相关内容。
证据是循证临床实践指南的基础,但证据本身不能指导决策,推荐意见在证据应用到临床实践的过程中起到至关重要作用。目前,虽尚无完善的、严谨的证据到推荐意见形成的方法学,但部分组织提供了不同的内容框架或辅助工具指导推荐意见的制定,国内循证临床实践指南制定者可借鉴其经验,结合本国国情,构建本土化的推荐意见形成的方法学。