循证临床实践指南推荐意见形成的方法分析_《中国循证医学杂志》

作者：

王云云 ¹ ,  靳英辉 ^2,3 , 陈耀龙 ^4,5 , 曾宪涛 ⁶ , 陈昊 ⁷ , 王利 ¹ , 陆翠 ⁸ ,  曹虹 ⁹

1. 天津中医药大学研究生院（天津 300193）;
2. 河南大学循证医学中心（河南 475000）;
3. 河南大学护理与健康学院（河南 475000）;
4. 兰州大学循证医学中心，兰州大学基础医学院（兰州 730000）;
5. 中国 GRADE 中心，兰州大学（兰州 730000）;
6. 武汉大学中南医院循证与转化医学中心（武汉 430071）;
7. 南京中医药大学第二临床医学院（南京 210023）;
8. 天津市泰达医院急诊科（天津 300193）;
9. 天津市天津医院骨内科（天津 300211）;

关键词：

循证临床实践指南证据推荐意见方法学

DOI：

10.7507/1672-2531.201612007

视频：

导出 下载 收藏 扫码 引用

摘要 全文 图表 视频 参考文献 施引文献 补充材料

循证临床实践指南的证据到推荐意见的转化往往是复杂且繁琐的。本文主要阐述两部分内容：首先介绍证据及推荐意见分级的演进过程；其次，根据目前已有的、具有代表性的指南手册，分析推荐意见制定时存在的问题，总结证据到推荐意见的形成途径，并陈述形成最终推荐意见的方法。目前，虽尚无完善的、严谨的方法学指导证据到推荐意见的转化，但部分组织针对推荐意见的制定提供了不同的内容框架或辅助工具，国内循证临床实践指南制定者可借鉴其经验，结合本国国情，构建本土化的形成推荐意见的方法。

引用本文： 王云云, 靳英辉, 陈耀龙, 曾宪涛, 陈昊, 王利, 陆翠, 曹虹. 循证临床实践指南推荐意见形成的方法分析. 中国循证医学杂志, 2017, 17(9): 1085-1092. doi: 10.7507/1672-2531.201612007 复制

2011 年，美国医学科学院（institute of medicine，IOM）指出临床实践指南是针对患者特定的临床问题，基于系统评价形成的证据，对各种备选干预方式进行全面的利弊平衡分析，并提出最优指导意见^[1]。该组织强调了基于证据制定临床实践指南的重要性。一些国际组织专门开发了指南手册，用以指导循证临床实践指南（evidence-based clinical practice guideline，E-CPG）的制定。我国也于 2016 年 1 月发布了国内首部“指南的指南”^[2]。指南手册的发布对规范和严谨地制定 E-CPG 起到极大的促进作用，但研究显示现有的循证指南仍然存在一定的方法学缺陷，尤其在证据到推荐意见的转化过程缺乏透明性及清晰性^[3-5]。然而证据是 E-CPG 的基础，推荐意见是 E-CPG 的核心内容，它们的概念、内涵的逐步发展及证据到推荐意见的转化过程对 E-CPG 推荐意见的制定有重要意义。本文旨在总结 E-CPG 推荐意见制定的方法，以期为我国 E-CPG 制定者提供可参考的建议。

1 证据及推荐意见分级的历史进展

自 20 世纪 60 年代，美国两位社会学家 Campbell 和 Stanley 首次引入证据分级概念后^[6-8]，随着循证医学和临床流行病学的逐步发展，证据的分级标准、证据与推荐意见的关系等概念和内涵也在持续不断地完善（表 1）。主要表现在以下几个方面：证据分级标准从单一因素考虑（试验设计）到多因素（研究质量、间接性和结果一致性等）综合评定；最高级别证据的定义标准从单个 RCT 到多个 RCT 的 Meta 分析；证据的来源愈发广泛，逐步纳入系统评价、动物研究和中医文献等；证据的分类从单一走向多样化（治疗、预防和经济学分析等）；证据与推荐意见的关系从最初的相互独立、绝对对应（高质量证据的推荐强度也高），发展成相互影响又相互制约的关系（高质量证据的推荐强度不一定高）。

表1 证据及推荐意见分级的历史进展

表选项

下载CSV

表1 证据及推荐意见分级的历史进展

标准	制作机构	特点	不足	证据的来源	证据/推荐意见
标准	制作机构	特点	不足	证据的来源	数量	呈现形式
CTFPH 证据分级及推荐强度 1979^[9]	CTFPHE （CTFPHC）	1. 首次对医学领域的研究证据进行分级，并给出推荐强度分级的标准；2. 首次基于试验设计对证据进行分级	1. 未将推荐意见与证据级别对应；2. 忽视了小样本低质量的 RCT、多个 RCT 间结果的不一致性、高质量的观察性研究对证据分级的影响	RCT、队列或病例-对照研究、非对照研究，基于临床研究、描述性研究或专家委员会的报告或权威专家的意见	3/5	Ⅰ、Ⅱ-1、Ⅱ-2、Ⅲ/A、B、C、D、E
David Sacket 证据分级及推荐强度 1986^[9]	David Sacket	1. 首次对Ⅰ级证据的 RCT 定义了质量标准；2. 将证据质量与推荐强度的等级一一对应	1. 未区分队列研究与病例-对照研究；2. 未纳入专家意见	RCT、同期对照试验、历史对照试验、系列病例报道	5/3	Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ/A、B、C
AHCPR 证据分级及推荐强度 1992^[9]	AHCPR（AHRQ）	首次将 Meta 分析列入证据的分级中，并将基于 RCT 的 Meta 分析作为最高级别的证据	1. 未考虑 Meta 分析的质量；2. 局限于治疗方面，不适用于预防、诊断等其他领域	RCT、Meta 分析、非随机对照试验、准试验性研究、非试验性研究（对照研究、相关性研究和病例研究）、专家委员会报告、权威意见或临床经验	4/3	Ⅰa、Ⅰb、Ⅱa、Ⅱb、Ⅲ、Ⅳ/A、B、C
NEEBGDP 证据等级及推荐强度 1996^[9]	NEEBGDP	将 RCT、Meta 分析和系统评价共同作为最高级别的证据	局限于治疗方面，不适用于预防、诊断等其他领域	RCT、Meta 分析或系统评价、队列或病例-对照研究、非对照研究或共识建议	3/3	Ⅰ、Ⅱ、Ⅲ/A、B、C
SIGN 证据分级及推荐强度 2001^[9]	SIGN	1. 对 RCT、Meta 分析或系统评价、病例-对照或队列研究均定义了质量标准，并进行了详细地划分；2. 考虑了病例-对照或队列研究的系统评价	同上	RCT、Meta 分析或系统评价、队列或病例-对照研究、非分析性研究（病例报告、系列病例分析）、专家意见	4/4	1++、1+、1-、2++、2+、2-、3、4/A、B、C、D
证据金字塔 2001^[9]	美国纽约州立大学下州医学中心	首次将动物研究和体外研究纳入证据分级系统	未考虑不同类型研究的质量	RCT、Meta 分析或系统评价、队列或病例-对照研究、病例报告、理论研究、动物研究、体外研究	9/–	–/–
GRADE 证据等级及推荐强度 2004^[9]	GRADE	1. 首次明确了证据质量和推荐强度的含义；2. 综合考虑研究设计、研究质量、研究结果的一致性及证据的直接性等因素对证据进行分级；3.分别从患者、医生、政策制定者的角度对推荐强度进行分级	仍以强调临床有效性证据为主，未包括生物医学领域的全部证据	RCT、Meta 分析或系统评价、观察性研究（队列或病例-对照研究）、系列病例研究、个案报道	4/2	⊕⊕⊕⊕/A、⊕⊕⊕○/B、⊕⊕○○/C、⊕○○○/D/↑↑/1、↑？/2、↓？/2、↓↓/1
中国循证医学中心的证据分级 2004^[9]	中国循证医学中心李幼平等	首次在专科医师分类研究中引入证据分级的理念	未考虑不同类型研究的质量	系统评价、官方指南、有确切研究方法的文献、综述、专家意见	5/–	A、B、C、D、E/–
兽医外科研究中的证据分级 2005^[9]	Aragon 等	将证据分级的概念引入兽医外科研究	同上	随机、盲法、安慰剂对照试验，有历史对照的临床研究，非对照的病例系列，专家意见，和/或生理学研究外推的证据	4/–	Ⅰ、Ⅱ、Ⅲ、Ⅳ/–
中国循证医学中心的证据分级 2006^[9]	中国循证医学中心李幼平等	首次对管理、教育等非医非药的研究证据进行分级	同上	系统评价、HTA、Meta 分析、政府及相关机构报告、有确切研究方法的文献、综述、专家意见	5/–	A、B、C、D、E/–
传统医学证据体的构成及证据分级的建议 2007^[10]	北京中医药大学循证医学中心	首次在中医药领域提出和应用证据分级理念，推荐强度同 GRADE	同上	RCT、队列或病例-对照研究、半随机对照试验、病例系列（历史对照、自身前后对照）、病例报告、史料记载	5/2	Ⅰa、Ⅰb、Ⅱa、Ⅱb、Ⅲa、Ⅲb、Ⅳ、Ⅴ/同 GRADE
牛津证据分级标准 2011^[11]	OCEBM	首次在证据分级的基础上提出了分类概念，包括诊断、预后、干预、危害四个方面	无经济学和决策分析方面的证据分级标准	随机或非随机样本调查性研究（或共识）、系统综述、病例系列研究、系统评价、诊断性试验、非连续性研究、病例-对照研究、基于机制的推理、队列研究、队列研究或随机试验的对照组、观察性研究、随访研究、病例-对照研究或历史性对照研究、RCT	5/–	Level1、Level2、Level3、Level4、Level5/–
中医文献证据分级标准 2013^[12]	南京中医药大学儿科汪受传等	将中医文献证据单独列出	未考虑不同类型研究的质量	随机研究、非随机同期对照研究、非随机历史对照研究和专家意见、病例报告、非对照研究和专家意见	5/–	Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ/–

2 从证据到推荐意见的形成

2.1 制定推荐意见时考虑的标准

以往证据质量等级与推荐强度等级一一对应，如高质量证据常常意味着强推荐，即研究者在制定推荐级别时只考虑证据质量这一唯一因素。随后，越来越多的学者认识到此方法存在弊端，推荐意见的制定不再单一地依赖证据质量，各指南工作组仍需考虑患者的价值观和偏好、成本、利弊平衡、临床意义等因素（表 2）。目前多个学术组织制定了指南手册，其中对推荐意见在制定时需考虑因素的规定不完全相同。

表2 指南手册中证据到推荐意见形成的方法

表选项

下载CSV

表2 指南手册中证据到推荐意见形成的方法

年份	国家	制定机构	考虑的标准	辅助工具	形成最终推荐意见的方法
2009	美国	HICPAC^[13]	证据质量、工作组对主要结局指标的偏好和价值观、主要结局指标的利弊平衡、推荐意见与 FDA、EPA 政策的一致性、有效性、安全性等	–	–
2009	澳大利亚	NHMRC^[14]	证据体：证据基础、一致性、临床意义、普遍性、应用性证据基础：证据的数量、证据的水平、证据质量	–	–
2010	美国	ACCF/AHA^[15]	证据质量、利弊、患者的偏好	专家解释	正式的共识（共识形成会议）
2011	美国	AAN^[16]	证据质量、利益和风险的相对价值、干预的可得性、干预的成本、干预替代方式潜在效果的可得性、患者偏好的可变性、干预在目标人群中的重要亚组人群中的应用效果、普遍性、干预效果的临床意义	结论和推荐意见构建工具、推荐意见组成成分表格、推荐意见主要评估因素陈述形式表格	–
2011	英国	BHIVA^[17]	证据质量、利弊平衡、成本	–	共识
2013	–	ESHRE^[18]	证据质量、可能的利与弊、潜在的成本等	5“W”原则	共识
2013	–	纽约州立大学、耶鲁大学医学院、美国亚历山大州美国耳鼻喉-头颈外科学会^[19]	证据质量及等级、利弊平衡、成本、患者的价值观和偏好	推荐意见陈述清单	共识
2013	美国	IDSA^[20]	证据质量、利弊平衡、患者的价值观及偏好、资源利用	推进意见呈现模板	共识或其他
2014	日本	Center MG^[21]	证据质量、利弊平衡、患者及照顾者的偏好、患者及照顾者价值观、患者的负担、成本和资源利用	推荐意见提取表格、推荐意见强度投票表格、推荐意见呈现表格、推荐意见制定过程陈述表、证据及推荐意见总结表	共识（正式或非正式）
2014	–	WHO^[22]	证据质量、患者的偏好及价值观、利弊平衡、资源、临床问题的优先性、公平性及人权、可接受性及可行性	GRADE framework、证据-推荐意见或决策表格	共识
2014	澳大利亚	JBI^[23]	可行性、适宜性、临床意义、有效性	FAME 框架	–
2015	英国	SIGN^[24]	证据质量、问题的优先性、利弊平衡、患者价值观和偏好、资源利用（成本）、公平性、可行性、可接受性	DECIDE EtD（the Evidence to Decision）frameworks	共识
2015	澳大利亚	KHA-CARI^[25]	利弊平衡、证据质量、患者的价值观和偏好、成本（资源消耗）	推荐意见陈述清单：Who When What Where How	共识
2016	美国	ASCO^[26]	证据质量、成本、健康的不一致性、与患者的沟通方式	–	正式的共识（改良的德尔菲）
2016	英国	BTS^[27]	证据体的数量及质量、证据在指南目标人群的应用性、证据在指南目标人群中应用的普遍性、支持推荐意见的证据的一致性、推荐意见在临床实践中对资源和临床操作专家的影响	–	共识（德尔菲或其他）
2015	马来西亚	MoHM^[28]	证据质量、证据的一致性、证据的普遍性、证据的临床意义	–	正式的共识
2015	美国	USPSTF^[29]	证据质量、成本、净效益的质量及大小、以患者为中心的健康效益和伤害	决策模型	共识
2017	英国	NICE^[30]	证据质量、干预的利弊、净健康效益和资源利用、成果-效果分析、临床效果、伦理问题、社会价值判断、公平性等	–	共识（正式或非正式）
HICPAC：美国医疗感染控制实践咨询委员会；FDA：美国食品药品监督管理局；EPA：环境保护局；ACCF/AHA：美国心脏学会基金会/美国心脏协会；AAN：美国神经病学学会；BHIVA：英国艾滋病学会；IDSA：美国传染病学会；ESHRE：欧洲人类生殖和组胚学会；Center MG：日本卫生保健质量委员会下属 MINDS 项目组；JBI：澳大利亚 Joanna Briggs 循证卫生保健中心；SIGN：苏格兰校级指南协作网；DECIDE：Developing and Evaluation Communication Strategies to Support Informed Decisions and Practice Based on Evidence；NHMRC：澳大利亚国家健康与医学研究理事会；KHA-CARI：澳大利亚肾脏健康组织-澳大利亚肾病指南委员会；ASCO：美国临床肿瘤学会；BTS：英国胸科学会保健委员会；MoHM：马来西亚卫生部；USPSTF：美国预防工作；NICE：英国国家卫生与临床优化研究所。

2.1.1 “证据质量”、“证据体质量”的内涵有所不同　E-CPG 强调推荐意见的制定应着重考虑其收集的证据质量。证据质量是指对预测值的真实性有多大把握^[31]。GRADE 工作组对不同级别的证据质量提出明确定义，如高质量证据，GRADE 工作组最初认为其是指进一步研究也不可能改变该疗效评估结果可信度的证据；随后，又将其定义为研究者非常确信真实的效应值接近效应估计的证据。而低质量证据，GRADE 工作组原先将其定义为进一步研究极有可能影响该疗效评估结果的可信度，且该评估结果很可能改变；随后，又将其解释为对效应估计值的确信程度有限：真实值可能与估计值不相同^[32-34]。“证据质量”等级概念描述的具体化，方便研究者对证据质量的正确理解，并对证据进行质量评价和分级。

然而在不同组织或机构制定的指南手册或指南标准中，“证据质量”的内涵有所不同。一方面，如 ESHRE^[18]、ASCO^[26]、纽约州立大学等^[19]认为证据质量既可以是单个或多个研究的质量，又可以是系统评价的质量。另一方面，有些组织虽以“证据体”为单位对证据进行质量分级，但对证据体质量的含义阐述不完全相同。GRADE 工作组将证据体（body of evidence）定义为系统评价的效应指标，且其质量是综合考虑系统评价纳入研究的偏倚风险、发表偏倚、不一致性及间接性等因素而评定的^[35]。AAN^[16]、KHA-CARI^[25]、MINDS 项目组^[21]等均应用 GRADE 系统对“证据体”进行质量评价。NHMRC^[14]在其指南手册中也应用了“证据体”一词，但它认为“证据体”由证据基础（evidence base）、一致性（consistency）、临床意义（clinical impact）、普遍性（generalizability）、应用性（applicability）5 个要素构成，其中证据基础包括证据数量（quantity of evidence）、证据水平（level of evidence）以及证据质量（quality of evidence）。这与 GRADE 证据分级有一定的相似性，也有一些区别，其除了考虑研究结果间的一致性和纳入研究的质量等因素，也考虑了推荐意见在应用时需要评估的因素，如临床意义、普遍性、应用性（表 2）。

2.1.2 制定推荐意见时考虑的因素不完全相同　如表 2 所示，不同组织或机构在推荐意见制定时考虑的因素有相同也有不同。患者的价值观和意愿^{[15, 16, 19-22, 24, 25]}、推荐意见实施时需要的成本或资源及实施后所带来的利弊^{[13, 15-22, 24, 25]}、推荐意见应用时需要的临床条件与实践中具体临床环境的差距^{[14, 22-24, 27]}是指南制定者常常考虑的因素。推荐意见制定时考虑的因素不同之处如：ASCO 是美国临床肿瘤协会组织，致力于通过研究、教育及推广最优质的病人治疗护理方案以应对肿瘤，在其指南制定手册中提及推荐意见制定时需关注肿瘤专家与患者的沟通方式这一主题^[26]；HICPAC^[13]则认为其制定的推荐意见内容应与 FDA、EPA 的政策保持一致；NICE^[30]注意社会价值观、伦理性对推荐意见的影响；而 WHO^[22]、SIGN^[24]在推荐意见制定时还考虑临床问题的优先性、推荐意见的可接受性及可行性等因素。

2.1.3 相同的因素在不同指南手册或标准中的阐述有所不同　虽然各组织或机构制定推荐意见时考虑的标准有诸多相同之处，但具有相同措辞的标准其含义又略有差异。比如：关于成本的含义，一般来说，成本即指推荐意见实施时需要的器械、药品、人员等物质或非物质成本，且其与干预效果的关系直接影响患者对推荐意见的选择。因此，指南制定者可从成本-效果分析结果^[29]或将其与临床应用效果^[30]结合等角度评估推荐意见。SIGN^[24]进行成本分析时，特别强调了患者、卫生保健体系或医疗机构对成本的要求不同。然而，有些机构仅考虑纳入文献中提及的成本及成本效果问题，并未将“成本”作为推荐意见制定时必须评估的标准^[27]。

普遍性和应用性是推荐意见制定时常考虑的因素，其含义相似，往往是指推荐意见在目标人群中可推广的程度及推荐意见在临床情境中的适应程度。NHMRC^[14]认为“普遍性”是指证据中的研究人群及临床情境与指南的应用人群、推荐意见将被应用的临床环境的匹配程度；并将“应用性”解释为证据与其所在的国家卫生保健系统或推荐意见应用的临床情境的相关性，比如文化或组织基础等。而 BTS^[27]、MoHM^[28]、AAN^[16]仅将普遍性或应用性作为推荐意见制定时考虑的标准，并未给予详细的解释。

针对价值观和偏好，不同组织设立该项推荐意见评估标准的出发点不同，大部分指南制定机构考虑的是患者或照顾者的价值观和偏好对推荐意见的影响^{[19-22, 25, 30]}，而有的组织考虑的是指南制定工作组对主要结局指标的价值观和偏好^[13]。

2.1.4 制定推荐意见时相同含义的因素在不同组织间的分类不同　推荐意见需评估的因素中，有的本质上含义是相同的，但在不同指南手册中的分类或归属略有所差异。比如，WHO^[22]、SIGN^[24]不仅将利弊平衡、资源等单独作为推荐意见制定需评估的标准，也设立可接受性、可行性标准评估其对推荐意见产生的综合影响。其中，“可接受性”是评定相关利益人员如患者、指南使用者等对干预的利与弊、成本等的可接受程度。这与 IDSA^[20]、Center MG^[21]只独立考虑利弊平衡、成本和资源利用分别对推荐意见的影响不同。此外，“可行性”往往考虑推荐意见实施时可能遇到的障碍因素，如资源、法律、文化等，WHO^[22]、SIGN^[24]均综合考虑资源的可获取性、患者的价值观或偏好、法律等对推荐意见实施的影响，并将“可行性”单独作为一个评估标准。而部分组织在推荐意见评估标准清单中，提及患者的价值观或偏好、资源、法律及公平等，未综合考虑其对推荐意见实施的整体性影响（表 2）。

2.2 从证据到推荐意见的形成途径

证据到推荐意见形成的过程往往是复杂且繁琐的，少有指南系统地记录从证据到推荐意见制定的过程^[36]。如何使推荐意见制定的过程更加系统、透明是国际指南制定机构、各学术组织一直探讨的问题。指南 2.0 清单明确提出了建议：制定推荐意见时需应用结构化分析框架和透明系统的过程综合推荐意见的影响因素；选择合适的模块总结影响推荐意见的因素；规划并分享共识会议中参与者制定推荐意见的具体细节；评估模版中影响推荐意见的因素等^{[37, 38]}。

目前，各国际指南制定机构或学术组织根据推荐意见制定时需要考虑的因素，提供了不同的内容框架或辅助工具。比如，决策模型（USPSTF）^[29]、FAME 框架（JBI）^[23]、GRADE 框架（WHO）^[22]、DECIDE EtD 框架（SIGN）^[24]等。不同的内容框架均用文字、图形或表格等形式对推荐意见制定需要评估的因素进行相关陈述，以及介绍如何用该内容框架指导指南推荐意见的制定。但每一种内容框架又各具特色，如：DECIDE EtD 框架将推荐意见的制定过程分为三个步骤：构建临床问题、评估决策考虑标准、得出结论。其中，“构建临床问题”以 PICO 的模式呈现^[39]，并陈述该临床问题产生的主要背景、制定推荐意见的原因和指南制定者出于何种角度（政府或卫生部门/患者）制定推荐意见等；“评估决策考虑标准”包括对利弊平衡、可接受性和可行性等因素的评定；此外，“得出结论”是指指南制定者基于临床问题和决策考虑标准的评估结果，填写指南决策表，进而总结推荐意见并阐述强推荐或弱推荐的理由、实施推荐意见时的注意事项、监测和评估标准、推荐研究等信息^[40]。

E-CPG 中的系统、透明的推荐意见制定过程，不仅需要内容框架作为指导，且需要相关表格、模板等不同的辅助工具^{[15, 16, 18-25, 29]}。比如，MIND 项目组提供推荐意见提取表格、推荐意见强度投票表格、推荐意见呈现表格、推荐意见制定过程陈述表、证据及推荐意见总结表^[21]。AAN^[16]在考虑推荐意见是否适应临床情境的问题时，建议利用“决策树”或“因果路径”等演绎推理的方式先将证据与推荐意见联系起来，再进一步考虑干预措施的可得性及成本等问题，并提供结论和推荐意见构建工具、推荐意见主要评估因素陈述词表格。

2.3 形成最终推荐意见的方法

推荐意见制定过程需综合考虑多种因素，然而指南制定小组成员众多，包括相关领域专家、方法学专家、一线临床医生和患者代表等，如何得出一致性较高的决策意见，专家共识在这个过程中起到重要作用。专家共识包括正式、非正式两种方式。正式的专家共识方法包括德尔菲、名义群体法、共识形成会议法；非正式专家共识指没有正式的达成共识的程序和流程，专家们自由讨论，通过自由讨论达成对一个问题的共识^[41]。各指南制定组织推荐意见达成共识的方式不一。循证指南制定中采用的是正式的专家共识方法。如 ACCF/AHA^[15]、ASCO^[26]均在指南手册中描述了达成正式共识的具体方法，其中，ACCF/AHA 应用的是共识形成会议法，通过组织会议、遴选会议成员、确定会议讨论的问题及正式投票等过程达成共识；ASCO 采用了改良的德尔菲法，借用 5 分或 7 分的利克特量表，并制定达成共识的规则，促使达成统一的推荐意见^[42]。

此外，当意见不一致时，指南制定小组可采用 GRADE 网格（GRADE Grid）达成共识指南^[43]，比如，《万古霉素治疗药物监测指南》项目组基于 GRADE 网格，利用改良的德尔菲法，通过 3 轮调查就推荐意见达成共识，并制定了达成共识的规则：若除了“0”以外的任何一格票数超过 50%，则视为达成共识，可直接确定推荐意见的方向和强度；若“0”某一侧两格总数超过 70%，亦视为达成共识，可确定推荐方向，推荐强度则直接定为弱；其余情况视为未达成共识，推荐意见进入下一轮投票^[44]（表 3）。

表3 中国万古霉素治疗药物监测指南共识表格

表选项

下载CSV

项目	等级分数
干预措施的利弊权衡	明显利大于弊	可能利大于弊	利弊相当或不确定	可能弊大于利	明显弊大于利
推荐意见	强推荐	弱推荐	无明确	弱不推荐	强不推荐
拟推荐意见

同时注意，应用共识方法制定推荐意见时，可能存在以下两点问题：一方面，参与共识专家的利益冲突，对推荐意见的形成有直接的影响。为解决这一问题，指南工作组可按照国际指南协会（Guideline International Network）管理利益冲突的方法^[45]，制订详细的利益冲突声明表，对每一位参与共识的专家，要求其如实公布所有可能的经济和非经济利益，并委托独立的第三方对利益冲突进行判断，从而确定参与共识专家的最终名单，并及时公布专家的利益冲突声明表。另一方面，共识后的推荐意见，在正式发表之前，仍需进一步送审指南制定小组之外的临床相关专家、指南使用者和其他利益相关方；评审人员名单、评审意见的处理方法、根据反馈修改完善最终推荐意见均需指南工作组预先设定，以便确保外审的有效性和独立性^[46]。

2.4 推荐意见呈现的内容

指南中推荐意见呈现形式的多样性、内容准确性及完整性有利于指南使用者或研究者更加直观地查看针对特定临床问题的建议，同时有助于使用者了解推荐意见的制定过程及实施推荐意见时可能存在的问题等。多数指南制定机构均对推荐意见呈现的内容进行了阐述。其中 AAN^[16]提供的推荐意见组成成分表格与 KHA-CARI^[25]、纽约州立大学等^[19]的推荐意见陈述清单、ESHRE^[18]的原则有相似之处，均建议推荐意见应对干预措施的实施者或被实施者、干预措施具体内容、推荐意见的应用条件、干预措施的实施方式等方面进行描述。此外，IDSA^[20]提供了推荐意见呈现模板，由背景（backgrounds）、临床问题（original clinical question）、推荐意见（original recommendation）、临时推荐意见（interrim recommendation）、投票（如果应用的话，if application）、证据总结（summary of the evidence）等组成。EtD 内容框架也明确指出指南工作组在对推荐意见进行总结时，要陈述强推荐或弱推荐的理由、实施推荐意见时的注意事项、监测和评估标准、推荐研究等方面的信息^[47]。

现有的证据及推荐意见分级标准日渐完善，但证据到推荐意见转化的过程仍有许多问题，指南工作组在制定推荐意见时需注意以下几点：① 明确推荐意见制定时需要考虑的标准，并对每一个标准的内涵进行详细阐述；② 尽可能量化评估待考虑的标准；③ 尽可能借助于预先设计好的内容框架或辅助工具；④ 确定形成最终推荐意见的方法，并介绍达成共识的规则；⑤ 制定行之有效的方法严格管理共识阶段的利益冲突；⑥ 选择合适的评审人员，开展推荐意见外审并建立反馈机制；⑦ 运用适宜的图表等形式，清晰、透明、系统地呈现推荐意见的相关内容。

证据是循证临床实践指南的基础，但证据本身不能指导决策，推荐意见在证据应用到临床实践的过程中起到至关重要作用。目前，虽尚无完善的、严谨的证据到推荐意见形成的方法学，但部分组织提供了不同的内容框架或辅助工具指导推荐意见的制定，国内循证临床实践指南制定者可借鉴其经验，结合本国国情，构建本土化的推荐意见形成的方法学。

1 证据及推荐意见分级的历史进展

表1 证据及推荐意见分级的历史进展

表选项

下载CSV

表1 证据及推荐意见分级的历史进展

标准	制作机构	特点	不足	证据的来源	证据/推荐意见
标准	制作机构	特点	不足	证据的来源	数量	呈现形式
CTFPH 证据分级及推荐强度 1979^[9]	CTFPHE （CTFPHC）	1. 首次对医学领域的研究证据进行分级，并给出推荐强度分级的标准；2. 首次基于试验设计对证据进行分级	1. 未将推荐意见与证据级别对应；2. 忽视了小样本低质量的 RCT、多个 RCT 间结果的不一致性、高质量的观察性研究对证据分级的影响	RCT、队列或病例-对照研究、非对照研究，基于临床研究、描述性研究或专家委员会的报告或权威专家的意见	3/5	Ⅰ、Ⅱ-1、Ⅱ-2、Ⅲ/A、B、C、D、E
David Sacket 证据分级及推荐强度 1986^[9]	David Sacket	1. 首次对Ⅰ级证据的 RCT 定义了质量标准；2. 将证据质量与推荐强度的等级一一对应	1. 未区分队列研究与病例-对照研究；2. 未纳入专家意见	RCT、同期对照试验、历史对照试验、系列病例报道	5/3	Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ/A、B、C
AHCPR 证据分级及推荐强度 1992^[9]	AHCPR（AHRQ）	首次将 Meta 分析列入证据的分级中，并将基于 RCT 的 Meta 分析作为最高级别的证据	1. 未考虑 Meta 分析的质量；2. 局限于治疗方面，不适用于预防、诊断等其他领域	RCT、Meta 分析、非随机对照试验、准试验性研究、非试验性研究（对照研究、相关性研究和病例研究）、专家委员会报告、权威意见或临床经验	4/3	Ⅰa、Ⅰb、Ⅱa、Ⅱb、Ⅲ、Ⅳ/A、B、C
NEEBGDP 证据等级及推荐强度 1996^[9]	NEEBGDP	将 RCT、Meta 分析和系统评价共同作为最高级别的证据	局限于治疗方面，不适用于预防、诊断等其他领域	RCT、Meta 分析或系统评价、队列或病例-对照研究、非对照研究或共识建议	3/3	Ⅰ、Ⅱ、Ⅲ/A、B、C
SIGN 证据分级及推荐强度 2001^[9]	SIGN	1. 对 RCT、Meta 分析或系统评价、病例-对照或队列研究均定义了质量标准，并进行了详细地划分；2. 考虑了病例-对照或队列研究的系统评价	同上	RCT、Meta 分析或系统评价、队列或病例-对照研究、非分析性研究（病例报告、系列病例分析）、专家意见	4/4	1++、1+、1-、2++、2+、2-、3、4/A、B、C、D
证据金字塔 2001^[9]	美国纽约州立大学下州医学中心	首次将动物研究和体外研究纳入证据分级系统	未考虑不同类型研究的质量	RCT、Meta 分析或系统评价、队列或病例-对照研究、病例报告、理论研究、动物研究、体外研究	9/–	–/–
GRADE 证据等级及推荐强度 2004^[9]	GRADE	1. 首次明确了证据质量和推荐强度的含义；2. 综合考虑研究设计、研究质量、研究结果的一致性及证据的直接性等因素对证据进行分级；3.分别从患者、医生、政策制定者的角度对推荐强度进行分级	仍以强调临床有效性证据为主，未包括生物医学领域的全部证据	RCT、Meta 分析或系统评价、观察性研究（队列或病例-对照研究）、系列病例研究、个案报道	4/2	⊕⊕⊕⊕/A、⊕⊕⊕○/B、⊕⊕○○/C、⊕○○○/D/↑↑/1、↑？/2、↓？/2、↓↓/1
中国循证医学中心的证据分级 2004^[9]	中国循证医学中心李幼平等	首次在专科医师分类研究中引入证据分级的理念	未考虑不同类型研究的质量	系统评价、官方指南、有确切研究方法的文献、综述、专家意见	5/–	A、B、C、D、E/–
兽医外科研究中的证据分级 2005^[9]	Aragon 等	将证据分级的概念引入兽医外科研究	同上	随机、盲法、安慰剂对照试验，有历史对照的临床研究，非对照的病例系列，专家意见，和/或生理学研究外推的证据	4/–	Ⅰ、Ⅱ、Ⅲ、Ⅳ/–
中国循证医学中心的证据分级 2006^[9]	中国循证医学中心李幼平等	首次对管理、教育等非医非药的研究证据进行分级	同上	系统评价、HTA、Meta 分析、政府及相关机构报告、有确切研究方法的文献、综述、专家意见	5/–	A、B、C、D、E/–
传统医学证据体的构成及证据分级的建议 2007^[10]	北京中医药大学循证医学中心	首次在中医药领域提出和应用证据分级理念，推荐强度同 GRADE	同上	RCT、队列或病例-对照研究、半随机对照试验、病例系列（历史对照、自身前后对照）、病例报告、史料记载	5/2	Ⅰa、Ⅰb、Ⅱa、Ⅱb、Ⅲa、Ⅲb、Ⅳ、Ⅴ/同 GRADE
牛津证据分级标准 2011^[11]	OCEBM	首次在证据分级的基础上提出了分类概念，包括诊断、预后、干预、危害四个方面	无经济学和决策分析方面的证据分级标准	随机或非随机样本调查性研究（或共识）、系统综述、病例系列研究、系统评价、诊断性试验、非连续性研究、病例-对照研究、基于机制的推理、队列研究、队列研究或随机试验的对照组、观察性研究、随访研究、病例-对照研究或历史性对照研究、RCT	5/–	Level1、Level2、Level3、Level4、Level5/–
中医文献证据分级标准 2013^[12]	南京中医药大学儿科汪受传等	将中医文献证据单独列出	未考虑不同类型研究的质量	随机研究、非随机同期对照研究、非随机历史对照研究和专家意见、病例报告、非对照研究和专家意见	5/–	Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ/–

2 从证据到推荐意见的形成

2.1 制定推荐意见时考虑的标准

表2 指南手册中证据到推荐意见形成的方法

表选项

下载CSV

表2 指南手册中证据到推荐意见形成的方法

年份	国家	制定机构	考虑的标准	辅助工具	形成最终推荐意见的方法
2009	美国	HICPAC^[13]	证据质量、工作组对主要结局指标的偏好和价值观、主要结局指标的利弊平衡、推荐意见与 FDA、EPA 政策的一致性、有效性、安全性等	–	–
2009	澳大利亚	NHMRC^[14]	证据体：证据基础、一致性、临床意义、普遍性、应用性证据基础：证据的数量、证据的水平、证据质量	–	–
2010	美国	ACCF/AHA^[15]	证据质量、利弊、患者的偏好	专家解释	正式的共识（共识形成会议）
2011	美国	AAN^[16]	证据质量、利益和风险的相对价值、干预的可得性、干预的成本、干预替代方式潜在效果的可得性、患者偏好的可变性、干预在目标人群中的重要亚组人群中的应用效果、普遍性、干预效果的临床意义	结论和推荐意见构建工具、推荐意见组成成分表格、推荐意见主要评估因素陈述形式表格	–
2011	英国	BHIVA^[17]	证据质量、利弊平衡、成本	–	共识
2013	–	ESHRE^[18]	证据质量、可能的利与弊、潜在的成本等	5“W”原则	共识
2013	–	纽约州立大学、耶鲁大学医学院、美国亚历山大州美国耳鼻喉-头颈外科学会^[19]	证据质量及等级、利弊平衡、成本、患者的价值观和偏好	推荐意见陈述清单	共识
2013	美国	IDSA^[20]	证据质量、利弊平衡、患者的价值观及偏好、资源利用	推进意见呈现模板	共识或其他
2014	日本	Center MG^[21]	证据质量、利弊平衡、患者及照顾者的偏好、患者及照顾者价值观、患者的负担、成本和资源利用	推荐意见提取表格、推荐意见强度投票表格、推荐意见呈现表格、推荐意见制定过程陈述表、证据及推荐意见总结表	共识（正式或非正式）
2014	–	WHO^[22]	证据质量、患者的偏好及价值观、利弊平衡、资源、临床问题的优先性、公平性及人权、可接受性及可行性	GRADE framework、证据-推荐意见或决策表格	共识
2014	澳大利亚	JBI^[23]	可行性、适宜性、临床意义、有效性	FAME 框架	–
2015	英国	SIGN^[24]	证据质量、问题的优先性、利弊平衡、患者价值观和偏好、资源利用（成本）、公平性、可行性、可接受性	DECIDE EtD（the Evidence to Decision）frameworks	共识
2015	澳大利亚	KHA-CARI^[25]	利弊平衡、证据质量、患者的价值观和偏好、成本（资源消耗）	推荐意见陈述清单：Who When What Where How	共识
2016	美国	ASCO^[26]	证据质量、成本、健康的不一致性、与患者的沟通方式	–	正式的共识（改良的德尔菲）
2016	英国	BTS^[27]	证据体的数量及质量、证据在指南目标人群的应用性、证据在指南目标人群中应用的普遍性、支持推荐意见的证据的一致性、推荐意见在临床实践中对资源和临床操作专家的影响	–	共识（德尔菲或其他）
2015	马来西亚	MoHM^[28]	证据质量、证据的一致性、证据的普遍性、证据的临床意义	–	正式的共识
2015	美国	USPSTF^[29]	证据质量、成本、净效益的质量及大小、以患者为中心的健康效益和伤害	决策模型	共识
2017	英国	NICE^[30]	证据质量、干预的利弊、净健康效益和资源利用、成果-效果分析、临床效果、伦理问题、社会价值判断、公平性等	–	共识（正式或非正式）
HICPAC：美国医疗感染控制实践咨询委员会；FDA：美国食品药品监督管理局；EPA：环境保护局；ACCF/AHA：美国心脏学会基金会/美国心脏协会；AAN：美国神经病学学会；BHIVA：英国艾滋病学会；IDSA：美国传染病学会；ESHRE：欧洲人类生殖和组胚学会；Center MG：日本卫生保健质量委员会下属 MINDS 项目组；JBI：澳大利亚 Joanna Briggs 循证卫生保健中心；SIGN：苏格兰校级指南协作网；DECIDE：Developing and Evaluation Communication Strategies to Support Informed Decisions and Practice Based on Evidence；NHMRC：澳大利亚国家健康与医学研究理事会；KHA-CARI：澳大利亚肾脏健康组织-澳大利亚肾病指南委员会；ASCO：美国临床肿瘤学会；BTS：英国胸科学会保健委员会；MoHM：马来西亚卫生部；USPSTF：美国预防工作；NICE：英国国家卫生与临床优化研究所。

2.2 从证据到推荐意见的形成途径

2.3 形成最终推荐意见的方法

表3 中国万古霉素治疗药物监测指南共识表格

表选项

下载CSV

项目	等级分数
干预措施的利弊权衡	明显利大于弊	可能利大于弊	利弊相当或不确定	可能弊大于利	明显弊大于利
推荐意见	强推荐	弱推荐	无明确	弱不推荐	强不推荐
拟推荐意见

2.4 推荐意见呈现的内容

表1 证据及推荐意见分级的历史进展

标准	制作机构	特点	不足	证据的来源	证据/推荐意见
标准	制作机构	特点	不足	证据的来源	数量	呈现形式
CTFPH 证据分级及推荐强度 1979^[9]	CTFPHE （CTFPHC）	1. 首次对医学领域的研究证据进行分级，并给出推荐强度分级的标准；2. 首次基于试验设计对证据进行分级	1. 未将推荐意见与证据级别对应；2. 忽视了小样本低质量的 RCT、多个 RCT 间结果的不一致性、高质量的观察性研究对证据分级的影响	RCT、队列或病例-对照研究、非对照研究，基于临床研究、描述性研究或专家委员会的报告或权威专家的意见	3/5	Ⅰ、Ⅱ-1、Ⅱ-2、Ⅲ/A、B、C、D、E
David Sacket 证据分级及推荐强度 1986^[9]	David Sacket	1. 首次对Ⅰ级证据的 RCT 定义了质量标准；2. 将证据质量与推荐强度的等级一一对应	1. 未区分队列研究与病例-对照研究；2. 未纳入专家意见	RCT、同期对照试验、历史对照试验、系列病例报道	5/3	Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ/A、B、C
AHCPR 证据分级及推荐强度 1992^[9]	AHCPR（AHRQ）	首次将 Meta 分析列入证据的分级中，并将基于 RCT 的 Meta 分析作为最高级别的证据	1. 未考虑 Meta 分析的质量；2. 局限于治疗方面，不适用于预防、诊断等其他领域	RCT、Meta 分析、非随机对照试验、准试验性研究、非试验性研究（对照研究、相关性研究和病例研究）、专家委员会报告、权威意见或临床经验	4/3	Ⅰa、Ⅰb、Ⅱa、Ⅱb、Ⅲ、Ⅳ/A、B、C
NEEBGDP 证据等级及推荐强度 1996^[9]	NEEBGDP	将 RCT、Meta 分析和系统评价共同作为最高级别的证据	局限于治疗方面，不适用于预防、诊断等其他领域	RCT、Meta 分析或系统评价、队列或病例-对照研究、非对照研究或共识建议	3/3	Ⅰ、Ⅱ、Ⅲ/A、B、C
SIGN 证据分级及推荐强度 2001^[9]	SIGN	1. 对 RCT、Meta 分析或系统评价、病例-对照或队列研究均定义了质量标准，并进行了详细地划分；2. 考虑了病例-对照或队列研究的系统评价	同上	RCT、Meta 分析或系统评价、队列或病例-对照研究、非分析性研究（病例报告、系列病例分析）、专家意见	4/4	1++、1+、1-、2++、2+、2-、3、4/A、B、C、D
证据金字塔 2001^[9]	美国纽约州立大学下州医学中心	首次将动物研究和体外研究纳入证据分级系统	未考虑不同类型研究的质量	RCT、Meta 分析或系统评价、队列或病例-对照研究、病例报告、理论研究、动物研究、体外研究	9/–	–/–
GRADE 证据等级及推荐强度 2004^[9]	GRADE	1. 首次明确了证据质量和推荐强度的含义；2. 综合考虑研究设计、研究质量、研究结果的一致性及证据的直接性等因素对证据进行分级；3.分别从患者、医生、政策制定者的角度对推荐强度进行分级	仍以强调临床有效性证据为主，未包括生物医学领域的全部证据	RCT、Meta 分析或系统评价、观察性研究（队列或病例-对照研究）、系列病例研究、个案报道	4/2	⊕⊕⊕⊕/A、⊕⊕⊕○/B、⊕⊕○○/C、⊕○○○/D/↑↑/1、↑？/2、↓？/2、↓↓/1
中国循证医学中心的证据分级 2004^[9]	中国循证医学中心李幼平等	首次在专科医师分类研究中引入证据分级的理念	未考虑不同类型研究的质量	系统评价、官方指南、有确切研究方法的文献、综述、专家意见	5/–	A、B、C、D、E/–
兽医外科研究中的证据分级 2005^[9]	Aragon 等	将证据分级的概念引入兽医外科研究	同上	随机、盲法、安慰剂对照试验，有历史对照的临床研究，非对照的病例系列，专家意见，和/或生理学研究外推的证据	4/–	Ⅰ、Ⅱ、Ⅲ、Ⅳ/–
中国循证医学中心的证据分级 2006^[9]	中国循证医学中心李幼平等	首次对管理、教育等非医非药的研究证据进行分级	同上	系统评价、HTA、Meta 分析、政府及相关机构报告、有确切研究方法的文献、综述、专家意见	5/–	A、B、C、D、E/–
传统医学证据体的构成及证据分级的建议 2007^[10]	北京中医药大学循证医学中心	首次在中医药领域提出和应用证据分级理念，推荐强度同 GRADE	同上	RCT、队列或病例-对照研究、半随机对照试验、病例系列（历史对照、自身前后对照）、病例报告、史料记载	5/2	Ⅰa、Ⅰb、Ⅱa、Ⅱb、Ⅲa、Ⅲb、Ⅳ、Ⅴ/同 GRADE
牛津证据分级标准 2011^[11]	OCEBM	首次在证据分级的基础上提出了分类概念，包括诊断、预后、干预、危害四个方面	无经济学和决策分析方面的证据分级标准	随机或非随机样本调查性研究（或共识）、系统综述、病例系列研究、系统评价、诊断性试验、非连续性研究、病例-对照研究、基于机制的推理、队列研究、队列研究或随机试验的对照组、观察性研究、随访研究、病例-对照研究或历史性对照研究、RCT	5/–	Level1、Level2、Level3、Level4、Level5/–
中医文献证据分级标准 2013^[12]	南京中医药大学儿科汪受传等	将中医文献证据单独列出	未考虑不同类型研究的质量	随机研究、非随机同期对照研究、非随机历史对照研究和专家意见、病例报告、非对照研究和专家意见	5/–	Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ/–

表选项

下载CSV

表2 指南手册中证据到推荐意见形成的方法

年份	国家	制定机构	考虑的标准	辅助工具	形成最终推荐意见的方法
2009	美国	HICPAC^[13]	证据质量、工作组对主要结局指标的偏好和价值观、主要结局指标的利弊平衡、推荐意见与 FDA、EPA 政策的一致性、有效性、安全性等	–	–
2009	澳大利亚	NHMRC^[14]	证据体：证据基础、一致性、临床意义、普遍性、应用性证据基础：证据的数量、证据的水平、证据质量	–	–
2010	美国	ACCF/AHA^[15]	证据质量、利弊、患者的偏好	专家解释	正式的共识（共识形成会议）
2011	美国	AAN^[16]	证据质量、利益和风险的相对价值、干预的可得性、干预的成本、干预替代方式潜在效果的可得性、患者偏好的可变性、干预在目标人群中的重要亚组人群中的应用效果、普遍性、干预效果的临床意义	结论和推荐意见构建工具、推荐意见组成成分表格、推荐意见主要评估因素陈述形式表格	–
2011	英国	BHIVA^[17]	证据质量、利弊平衡、成本	–	共识
2013	–	ESHRE^[18]	证据质量、可能的利与弊、潜在的成本等	5“W”原则	共识
2013	–	纽约州立大学、耶鲁大学医学院、美国亚历山大州美国耳鼻喉-头颈外科学会^[19]	证据质量及等级、利弊平衡、成本、患者的价值观和偏好	推荐意见陈述清单	共识
2013	美国	IDSA^[20]	证据质量、利弊平衡、患者的价值观及偏好、资源利用	推进意见呈现模板	共识或其他
2014	日本	Center MG^[21]	证据质量、利弊平衡、患者及照顾者的偏好、患者及照顾者价值观、患者的负担、成本和资源利用	推荐意见提取表格、推荐意见强度投票表格、推荐意见呈现表格、推荐意见制定过程陈述表、证据及推荐意见总结表	共识（正式或非正式）
2014	–	WHO^[22]	证据质量、患者的偏好及价值观、利弊平衡、资源、临床问题的优先性、公平性及人权、可接受性及可行性	GRADE framework、证据-推荐意见或决策表格	共识
2014	澳大利亚	JBI^[23]	可行性、适宜性、临床意义、有效性	FAME 框架	–
2015	英国	SIGN^[24]	证据质量、问题的优先性、利弊平衡、患者价值观和偏好、资源利用（成本）、公平性、可行性、可接受性	DECIDE EtD（the Evidence to Decision）frameworks	共识
2015	澳大利亚	KHA-CARI^[25]	利弊平衡、证据质量、患者的价值观和偏好、成本（资源消耗）	推荐意见陈述清单：Who When What Where How	共识
2016	美国	ASCO^[26]	证据质量、成本、健康的不一致性、与患者的沟通方式	–	正式的共识（改良的德尔菲）
2016	英国	BTS^[27]	证据体的数量及质量、证据在指南目标人群的应用性、证据在指南目标人群中应用的普遍性、支持推荐意见的证据的一致性、推荐意见在临床实践中对资源和临床操作专家的影响	–	共识（德尔菲或其他）
2015	马来西亚	MoHM^[28]	证据质量、证据的一致性、证据的普遍性、证据的临床意义	–	正式的共识
2015	美国	USPSTF^[29]	证据质量、成本、净效益的质量及大小、以患者为中心的健康效益和伤害	决策模型	共识
2017	英国	NICE^[30]	证据质量、干预的利弊、净健康效益和资源利用、成果-效果分析、临床效果、伦理问题、社会价值判断、公平性等	–	共识（正式或非正式）
HICPAC：美国医疗感染控制实践咨询委员会；FDA：美国食品药品监督管理局；EPA：环境保护局；ACCF/AHA：美国心脏学会基金会/美国心脏协会；AAN：美国神经病学学会；BHIVA：英国艾滋病学会；IDSA：美国传染病学会；ESHRE：欧洲人类生殖和组胚学会；Center MG：日本卫生保健质量委员会下属 MINDS 项目组；JBI：澳大利亚 Joanna Briggs 循证卫生保健中心；SIGN：苏格兰校级指南协作网；DECIDE：Developing and Evaluation Communication Strategies to Support Informed Decisions and Practice Based on Evidence；NHMRC：澳大利亚国家健康与医学研究理事会；KHA-CARI：澳大利亚肾脏健康组织-澳大利亚肾病指南委员会；ASCO：美国临床肿瘤学会；BTS：英国胸科学会保健委员会；MoHM：马来西亚卫生部；USPSTF：美国预防工作；NICE：英国国家卫生与临床优化研究所。

表选项

下载CSV

表3 中国万古霉素治疗药物监测指南共识表格

项目	等级分数
干预措施的利弊权衡	明显利大于弊	可能利大于弊	利弊相当或不确定	可能弊大于利	明显弊大于利
推荐意见	强推荐	弱推荐	无明确	弱不推荐	强不推荐
拟推荐意见

表选项

下载CSV

1.	IOM(Institute of Medicine). Clinical practice guidelines we can trust. Washington, DC: The National Academies Press, 2011.
2.	蒋朱明, 詹思延, 贾晓巍, 等. 制订/修订《临床诊疗指南》基本方法及程序. 中华医学杂志, 2016, 96(4): 250-253.
3.	王行环. 循证临床实践指南的研发与评价 (第一版). 北京: 中国协和医科大学出版社, 2016: 222-281.
4.	李楠, 姚亮, 吴琼芳, 等. 2012～2013 年中国大陆期刊发表临床实践指南质量评价. 中国循证医学杂志, 2015, 15(3): 259-263.
5.	Jin Y, Wang Y, Zhang Y, et al. Nursing practice guideline in China do need reform: a clinical appraisal using the AGREEⅡInstrument. Worldviews Evid Based Nurs, 2016, 13(2): 124-138.
6.	Glasziou P, Vandenbroucke JP, Chalmers I. Assessing the quality of research. BMJ, 2004, 328(7430): 39-41.
7.	Campbell DT, Stanley JC. Experimental and quasi-experimental designs for research. Chicago, IL: Rand McNally College, 1963.
8.	Chalmers I, Hedges L, Cooper H. A brief history of research synthesis. Evaluat Heal Profes, 2002, 25(1): 12-37.
9.	陈耀龙, 李幼平, 杜亮, 等. 医学研究中证据分级和推荐强度的演进. 中国循证医学杂志, 2008, 8(2): 127-133.
10.	刘建平. 传统医学证据体的构成及证据分级的建议. 中国中西医结合杂志, 2007, 27(12): 1061-1069.
11.	Available at: http://www.cebm.net/wp-content/uploads/2014/06/ CEBM-Levels-of-Evidence-2.1.pdf.
12.	汪受传, 陈争光, 徐珊, 等. 建立循证中医药临床实践指南证据分级体系的构想. 世界科学技术-中医药现代化, 2013, 15(7): 1488-1492.
13.	HICPAC. Updating the guideline methodology of the Healthcare Infection Control Practices Advisory Committee(HICPAC). 2009.
14.	Available at: https://www.nhmrc.gov.au/guidelines-publications/information-guideline-developers/resources-guideline-developers.
15.	ACCF/AHA. Methodology manual and policies from the ACCF/AHA task force on practice guidelines. Available at: http://assets.cardiosource.com/Methodology_Manual_for_ACC_AHA_Writing_Committees.pdf.
16.	AAN. Clinical practice guideline process manual. Available at: http://tools.aan.com/globals/axon/assets/9023.pdf.
17.	BHIVA. British HIV Association (BHIVA) guideline development manual. Available at: http://www.bhiva.org/ GuidelineDevelopmentManual.aspx.
18.	ESHRE. Mannual for ESHRE guidelines handbook. Avaliable at: https://www.eshre.eu/Guidelines-and-Legal/Guidelines/ Guideline-development-process.aspx.
19.	Rosenfeld RM, Shiffman RN, Robertson P. Clinical practice guideline development manual: a quality-driven approach for translating evidence into action. Otolaryngol Head Neck Surg, 2013, 148(Suppl 1): S1-S55.
20.	IDSA. Handbook on clinical practice guideline development. Available at: http://www.idsociety.org/uploadedFiles/ IDSA/Guidelines-Patient_Care/Guidelines_By_Others/IDSA%20 Handbook%20on%20CPG%20Development%20for%20Web%2010.13.pdf#search=%22Handbook on Clinical Practice Guideline Development%22.
21.	Center MG. Minds handbook for guidelines development. Available at: http://minds4.jcqhc.or.jp/minds/guideline/ pdf/MindsHB2014.pdf.
22.	WHO. WHO handbook for guideline development (2nd edition). Available at: http://www.who.int/publications/guidelines/ handbook_2nd_ed.pdf?ua=1.
23.	The Joanna Briggs Institute Levels of Evidence and Grade of Recommendation Working Party. Supporting ducument for the Joanna Briggs Institute levels of evidence and grade of recommendation. The Joanna Briggs Institute. Available at: http://joannabriggs.org/jbi-approach.html#tabbed-nav=Levels-of-evidenve.
24.	SIGN. SIGN 50: A guideline developer’s handbook. Available at: http://www.sign.ac.uk/assets/sign50_2015.pdf.
25.	ANZSN, KHA. KHA-CARI guidelines development manual. Available at: http://www.cari.org.au/docs/KHACARI_Guideline_ development_%20manual.pdf.
26.	Available at: https://pilotguidelines.atlassian.net/wiki/display/GW/ Guideline+Development+Process.
27.	BTS. British thoracic society standards of care committee guideline production manual(2016 version). Available at: https://www.brit-thoracic.org.uk/document-library/guidelines-and-quality-standards/guideline-production-documents/bts-guideline-production-manual-2016/.
28.	Ministry of Health Malaysia. Manual on development and implementation of evidence-based clinical practice guidelines. Putrajaya: MoH, 2015. Avaliable at: http://www.moh.gov.my/ english.php/pages/view/117.
29.	USPSTF. U.S. preventive services task force procedure manual. Available at: https://www.uspreventiveservicestaskforce.org/ Page/Name/procedure-manual.
30.	NICE. Developing NICE guidelines: the manual. Available at: https://www.nice.org.uk/process/pmg20/chapter/introduction-and-overview#updating-this-manual.
31.	AtkinsD, Best D, Briss PA, et al. Grading quality of evidence and strength of recommendations. BMJ, 2004, 328(7454): 1490-1494.
32.	Atkins D, Eccles M, Flottorp S, et al. Systems for grading the quality of evidence and the strength of recommendations I: critical appraisal of existing approaches. The GRADE Working Group. BMC Health Serv Res, 2004, 4(1): 38.
33.	Guyatt GH, Oxman AD, Vist GE, et al. GRADE: an emerging consensus on rating quality of evidence and strength of recommendation. BMJ, 2008, 336(7650): 924-926.
34.	曾宪涛, 冷卫东, 李胜, 等. 如何正确理解及使用 GRADE 系统. 中国循证医学杂志, 2011, 11(9): 985-990.
35.	Balshem H, Helf M, Schunemann, HJ, et al. GRADE: guidelines: 3. Rating the quality of evidence of evidence. J of Clinical Epidemiology, 2011, 64(4): 401-406.
36.	Neumann I, Brignardello-Petersen R, Wiercioch W, et al. The GRADE evidence-to-decision framework: a report of its testing and application in 15 international guideline panels. Implementation Science, 2015, 11(1): 1-8.
37.	Schünemann HJ, WierciochW, EtxeandiaI, et al. Guidelines 2.0: systematic development of a comprehensive checklist for a successful guideline enterprise. Recenti Progressi in Medicina, 2014, 186(3): 123-142.
38.	Holger, Schiinemann, Wojtek, et al. 指南 2.0: 为成功制定指南而系统研发的全面清单. 中国循证医学杂志, 2014, 14(9): 1135-1149.
39.	Richardson WS, Wilson MC, Nishikawa J, et al. The well-built clinical question: a key to evidence-based decisions. ACP J Club, 1995, 123(3): 12-13.
40.	Alonsocoello P, Schünemann HJ, Moberg J, et al. GRADE Evidence to Decision (EtD) frameworks: a systematic and transparent approach to making well informed healthcare choices. 1: Introduction. BMJ, 2016, 353: i2016.
41.	王小钦, 王吉耀. 循证临床实践指南的制定与实施 (第一版). 北京: 人民卫生出版社, 2016: 33-34.
42.	Loblaw DA, Prestrud AA, Somerfield MR, et al. American Society of Clinical Oncology Clinical Practice Guidelines: formal systematic review-based consensus methodology. J Clin Oncol, 2012, 30(25): 3136-3140.
43.	Jaeschke R, Guyatt GH, Dellinger P, et al. Use of GRADE grid to reach decisions on clinical practice guidelines when consensus is elusive. BMJ, 2008, 337(7665): a744.
44.	陈耀龙, 陈恳, 叶志康, 等. 中国万古霉素治疗药物监测指南的制定. 中国循证医学杂志, 2015, 15(2): 236-239.
45.	Schünemann HJ, Alansary LA, Forland F, et al. Guidelines International Network: principles for disclosure of interests and management of conflicts in guidelines. Ann Inter Med, 2015, 163(7): 548-553.
46.	陈恳, 王琪, 陈耀龙, 等. 《中国万古霉素治疗药物监测指南》推荐意见的外审调查. 中国循证医学杂志, 2015, 15(6): 719-722.
47.	Alonsocoello P, Oxman AD, Moberg J, et al. GRADE Evidence to Decision (EtD) frameworks: a systematic and transparent approach to making well informed healthcare choices. 2: Clinical practice guidelines. BMJ, 2016, 353: i2089.

1. IOM(Institute of Medicine). Clinical practice guidelines we can trust. Washington, DC: The National Academies Press, 2011.
2. 蒋朱明, 詹思延, 贾晓巍, 等. 制订/修订《临床诊疗指南》基本方法及程序. 中华医学杂志, 2016, 96(4): 250-253.
3. 王行环. 循证临床实践指南的研发与评价 (第一版). 北京: 中国协和医科大学出版社, 2016: 222-281.
4. 李楠, 姚亮, 吴琼芳, 等. 2012～2013 年中国大陆期刊发表临床实践指南质量评价. 中国循证医学杂志, 2015, 15(3): 259-263.
5. Jin Y, Wang Y, Zhang Y, et al. Nursing practice guideline in China do need reform: a clinical appraisal using the AGREEⅡInstrument. Worldviews Evid Based Nurs, 2016, 13(2): 124-138.
6. Glasziou P, Vandenbroucke JP, Chalmers I. Assessing the quality of research. BMJ, 2004, 328(7430): 39-41.
7. Campbell DT, Stanley JC. Experimental and quasi-experimental designs for research. Chicago, IL: Rand McNally College, 1963.
8. Chalmers I, Hedges L, Cooper H. A brief history of research synthesis. Evaluat Heal Profes, 2002, 25(1): 12-37.
9. 陈耀龙, 李幼平, 杜亮, 等. 医学研究中证据分级和推荐强度的演进. 中国循证医学杂志, 2008, 8(2): 127-133.
10. 刘建平. 传统医学证据体的构成及证据分级的建议. 中国中西医结合杂志, 2007, 27(12): 1061-1069.
11. Available at: http://www.cebm.net/wp-content/uploads/2014/06/ CEBM-Levels-of-Evidence-2.1.pdf.
12. 汪受传, 陈争光, 徐珊, 等. 建立循证中医药临床实践指南证据分级体系的构想. 世界科学技术-中医药现代化, 2013, 15(7): 1488-1492.
13. HICPAC. Updating the guideline methodology of the Healthcare Infection Control Practices Advisory Committee(HICPAC). 2009.
14. Available at: https://www.nhmrc.gov.au/guidelines-publications/information-guideline-developers/resources-guideline-developers.
15. ACCF/AHA. Methodology manual and policies from the ACCF/AHA task force on practice guidelines. Available at: http://assets.cardiosource.com/Methodology_Manual_for_ACC_AHA_Writing_Committees.pdf.
16. AAN. Clinical practice guideline process manual. Available at: http://tools.aan.com/globals/axon/assets/9023.pdf.
17. BHIVA. British HIV Association (BHIVA) guideline development manual. Available at: http://www.bhiva.org/ GuidelineDevelopmentManual.aspx.
18. ESHRE. Mannual for ESHRE guidelines handbook. Avaliable at: https://www.eshre.eu/Guidelines-and-Legal/Guidelines/ Guideline-development-process.aspx.
19. Rosenfeld RM, Shiffman RN, Robertson P. Clinical practice guideline development manual: a quality-driven approach for translating evidence into action. Otolaryngol Head Neck Surg, 2013, 148(Suppl 1): S1-S55.
20. IDSA. Handbook on clinical practice guideline development. Available at: http://www.idsociety.org/uploadedFiles/ IDSA/Guidelines-Patient_Care/Guidelines_By_Others/IDSA%20 Handbook%20on%20CPG%20Development%20for%20Web%2010.13.pdf#search=%22Handbook on Clinical Practice Guideline Development%22.
21. Center MG. Minds handbook for guidelines development. Available at: http://minds4.jcqhc.or.jp/minds/guideline/ pdf/MindsHB2014.pdf.
22. WHO. WHO handbook for guideline development (2nd edition). Available at: http://www.who.int/publications/guidelines/ handbook_2nd_ed.pdf?ua=1.
23. The Joanna Briggs Institute Levels of Evidence and Grade of Recommendation Working Party. Supporting ducument for the Joanna Briggs Institute levels of evidence and grade of recommendation. The Joanna Briggs Institute. Available at: http://joannabriggs.org/jbi-approach.html#tabbed-nav=Levels-of-evidenve.
24. SIGN. SIGN 50: A guideline developer’s handbook. Available at: http://www.sign.ac.uk/assets/sign50_2015.pdf.
25. ANZSN, KHA. KHA-CARI guidelines development manual. Available at: http://www.cari.org.au/docs/KHACARI_Guideline_ development_%20manual.pdf.
26. Available at: https://pilotguidelines.atlassian.net/wiki/display/GW/ Guideline+Development+Process.
27. BTS. British thoracic society standards of care committee guideline production manual(2016 version). Available at: https://www.brit-thoracic.org.uk/document-library/guidelines-and-quality-standards/guideline-production-documents/bts-guideline-production-manual-2016/.
28. Ministry of Health Malaysia. Manual on development and implementation of evidence-based clinical practice guidelines. Putrajaya: MoH, 2015. Avaliable at: http://www.moh.gov.my/ english.php/pages/view/117.
29. USPSTF. U.S. preventive services task force procedure manual. Available at: https://www.uspreventiveservicestaskforce.org/ Page/Name/procedure-manual.
30. NICE. Developing NICE guidelines: the manual. Available at: https://www.nice.org.uk/process/pmg20/chapter/introduction-and-overview#updating-this-manual.
31. AtkinsD, Best D, Briss PA, et al. Grading quality of evidence and strength of recommendations. BMJ, 2004, 328(7454): 1490-1494.
32. Atkins D, Eccles M, Flottorp S, et al. Systems for grading the quality of evidence and the strength of recommendations I: critical appraisal of existing approaches. The GRADE Working Group. BMC Health Serv Res, 2004, 4(1): 38.
33. Guyatt GH, Oxman AD, Vist GE, et al. GRADE: an emerging consensus on rating quality of evidence and strength of recommendation. BMJ, 2008, 336(7650): 924-926.
34. 曾宪涛, 冷卫东, 李胜, 等. 如何正确理解及使用 GRADE 系统. 中国循证医学杂志, 2011, 11(9): 985-990.
35. Balshem H, Helf M, Schunemann, HJ, et al. GRADE: guidelines: 3. Rating the quality of evidence of evidence. J of Clinical Epidemiology, 2011, 64(4): 401-406.
36. Neumann I, Brignardello-Petersen R, Wiercioch W, et al. The GRADE evidence-to-decision framework: a report of its testing and application in 15 international guideline panels. Implementation Science, 2015, 11(1): 1-8.
37. Schünemann HJ, WierciochW, EtxeandiaI, et al. Guidelines 2.0: systematic development of a comprehensive checklist for a successful guideline enterprise. Recenti Progressi in Medicina, 2014, 186(3): 123-142.
38. Holger, Schiinemann, Wojtek, et al. 指南 2.0: 为成功制定指南而系统研发的全面清单. 中国循证医学杂志, 2014, 14(9): 1135-1149.
39. Richardson WS, Wilson MC, Nishikawa J, et al. The well-built clinical question: a key to evidence-based decisions. ACP J Club, 1995, 123(3): 12-13.
40. Alonsocoello P, Schünemann HJ, Moberg J, et al. GRADE Evidence to Decision (EtD) frameworks: a systematic and transparent approach to making well informed healthcare choices. 1: Introduction. BMJ, 2016, 353: i2016.
41. 王小钦, 王吉耀. 循证临床实践指南的制定与实施 (第一版). 北京: 人民卫生出版社, 2016: 33-34.
42. Loblaw DA, Prestrud AA, Somerfield MR, et al. American Society of Clinical Oncology Clinical Practice Guidelines: formal systematic review-based consensus methodology. J Clin Oncol, 2012, 30(25): 3136-3140.
43. Jaeschke R, Guyatt GH, Dellinger P, et al. Use of GRADE grid to reach decisions on clinical practice guidelines when consensus is elusive. BMJ, 2008, 337(7665): a744.
44. 陈耀龙, 陈恳, 叶志康, 等. 中国万古霉素治疗药物监测指南的制定. 中国循证医学杂志, 2015, 15(2): 236-239.
45. Schünemann HJ, Alansary LA, Forland F, et al. Guidelines International Network: principles for disclosure of interests and management of conflicts in guidelines. Ann Inter Med, 2015, 163(7): 548-553.
46. 陈恳, 王琪, 陈耀龙, 等. 《中国万古霉素治疗药物监测指南》推荐意见的外审调查. 中国循证医学杂志, 2015, 15(6): 719-722.
47. Alonsocoello P, Oxman AD, Moberg J, et al. GRADE Evidence to Decision (EtD) frameworks: a systematic and transparent approach to making well informed healthcare choices. 2: Clinical practice guidelines. BMJ, 2016, 353: i2089.

《中国循证医学杂志》

循证临床实践指南推荐意见形成的方法分析

摘要 全文 图表 视频 参考文献 施引文献 补充材料

1 证据及推荐意见分级的历史进展

2 从证据到推荐意见的形成

2.1 制定推荐意见时考虑的标准

2.2 从证据到推荐意见的形成途径

2.3 形成最终推荐意见的方法

2.4 推荐意见呈现的内容

1 证据及推荐意见分级的历史进展

2 从证据到推荐意见的形成

2.1 制定推荐意见时考虑的标准

2.2 从证据到推荐意见的形成途径

2.3 形成最终推荐意见的方法

2.4 推荐意见呈现的内容

上一篇

下一篇

Format

Content

《中国循证医学杂志》

循证临床实践指南推荐意见形成的方法分析

摘要 全文 图表 视频 参考文献 施引文献 补充材料

1 证据及推荐意见分级的历史进展

2 从证据到推荐意见的形成

2.1 制定推荐意见时考虑的标准

2.2 从证据到推荐意见的形成途径

2.3 形成最终推荐意见的方法

2.4 推荐意见呈现的内容

1 证据及推荐意见分级的历史进展

2 从证据到推荐意见的形成

2.1 制定推荐意见时考虑的标准

2.2 从证据到推荐意见的形成途径

2.3 形成最终推荐意见的方法

2.4 推荐意见呈现的内容

上一篇

下一篇

Format

Content

摘要全文图表视频参考文献施引文献补充材料