引用本文: 陈耀龙, 周奇, 崔荣荣, 杨楠, 肖淑君, 商洪才. 基于AGREE Ⅱ的中医药临床指南质量评价. 中国循证医学杂志, 2016, 16(11): 1331-1337. doi: 10.7507/1672-2531.20160201 复制
1990年,美国医学研究所(Institute of Medicine,IOM)首次将临床实践指南(以下简称“临床指南”)定义为:系统开发的多组临床指导意见,以协助临床工作者和患者针对特定的临床问题快速做出最恰当的处理决定[1]。临床指南作为指导临床实践的纲领性文件,可以提高临床实践的质量[2],并且能减少卫生保健不公平性并改善医疗服务质量[3]。中医药是在维护健康以及预防、诊断、改善或治疗身心疾病方面使用的种种以不同文化所特有的理论、信仰和经验为基础的知识、技能和实践的总和[4, 5]。中医药临床指南也有自己的鲜明特点,主要包括以整体观理论体系为指导原则,在诊疗过程中重视辨证论治。近年来在“推进中医药标准化、规范化和国际化” [6]、制定中医药国际准则[5, 7]等政策的支持下,国家对制定高质量中医药临床指南越来越重视,且随着循证医学、系统评价和证据质量与推荐强度分级方法的快速发展,中医药临床指南制定的方法学取得了长足进步。目前国内已经出版和发表大量中医药临床指南,其方法学质量具体如何尚不清楚。AGREEⅡ是用于评价临床指南方法学质量的工具[8-10]。本研究旨在运用AGREEⅡ评价国内期刊发表及专著发表的中医药临床指南的方法学质量,为今后制定同类指南提供参考。
1 资料与方法
1.1 纳入与排除标准
1.1.1 纳入标准
①符合IOM对指南的定义[11, 12],即系统评价产生的证据以及对各种备选干预方式进行利弊评价之后提出的最优指导意见的文件;②推荐意见中报告中医药干预措施;③最新版的指南;④暂未发行正式版本的指南草案或试行版。
1.1.2 排除标准
①指南摘要;②重复指南;③国外指南的翻译版或改编版。
1.2 检索策略
本课题组采用统一制定的检索策略[13]分别检索CBM、CNKI、万方和维普4个中文数据库,搜集中医药临床指南,检索时间从各数据库建库时间到2015年12月。同时,手工检索Google、亚马逊和当当网获取以专著形式出版的中医药临床指南。此外,检索纳入中医药临床指南的参考文献,以补充获取相关文献。具体检索策略见表 1。

1.3 指南筛选及资料提取
由2位研究员独立筛选指南、提取资料,并交叉核对,如遇分歧,则咨询第三位研究员协助判断。指南筛选首先阅读文题和摘要,排除明显不相关的指南后,进一步阅读全文,以决定最终是否纳入。最后追溯确定纳入指南的参考文献,避免遗漏相关指南。提取指南信息包括:①发表年份;②制定机构;③应用领域;④是否有方法学家参与;⑤患者意愿、价值观和利益冲突。⑥指南推荐意见;⑦参考文献;⑧数据库检索和证据分级。
1.4 指南评价
运用AGREEⅡ对纳入的指南进行评价。每篇指南由4名研究员对其进行独立评价,AGREEⅡ一共分为6个领域,包含23条评分项。每条评分项的最低分为1分,最高分为7分。得分越高表明指南越符合该条目的要求。每篇指南各领域最终得分的计算公式如下:各领域得分=(实际分-最低分)/(最高分-最低分)。在进行正式评分之前,经过两次预试验,计算组内相关系数(interclass correlation coefficient,ICC)值验证一致性,确保每名研究人员对每个条目的理解基本一致。
1.5 质量控制
在正式评分之前,所有研究人员共同学习AGREEⅡ评分条目并进行了一次预试验(计算机随机选取10篇指南),确保每名研究人员对每个条目的理解基本一致。并运用SPSS 19.0软件计算组内相关系数ICC值验证一致性[14, 15],只有当ICC值不低于0.8时,才进行正式试验。
1.6 统计分析
AGREEⅡ各领域最终得分为纳入指南在各个领域得分的平均数。所得数据运用Excel 2013进行整理。计量资料结果用平均值±标准差表示,预试验结果运用SPSS 19.0统计软件计算组内相关系数ICC值验证一致性[9, 10]。此外因为本研究纳入的是总体样本,因此不进行统计推断。
2 结果
2.1 纳入指南基本特征
共纳入115篇中医药临床指南(期刊发表 87篇,专著出版28篇),具体筛选流程见图 1。近58%(67篇)的中医药指南在2011年发表(图 2)。整体来看115篇中医药临床指南呈现以下特点:①在应用类别方面以诊疗指南为主,占85%(98篇),其次是防治类指南(6%/7篇)和治疗类指南(4%/4篇)(图 3);②参与指南制定的单位主要是学会(59%/68篇)和中国中医科学院(24%/28篇),此外卫生和计划生育委员会(前卫生部)、协会以及医院也都参与了指南的制定,分别占2%(2篇)、4%(4篇)和9%(10篇)(图 4);③制定方法学方面,26%(30篇)的指南提及应用了循证方法制定指南;④基金或项目资助方面,71%(82篇)的指南报告了受资助情况;⑤指南更新方面,有31%(36篇)的指南报告了将在未来2~5年进行更新;⑥数据库检索方面,30%(35篇)的指南清楚描述了检索数据库、检索词及检索时间;⑦利益声明方面,15%(17篇)的指南报告了利益冲突声明。



注:综合表示该指南包含上述几个类别中至少2个方面。

注:综合表示该指南制定机构包含上述几个类别中至少2个方面。
2.2 AGREEⅡ评分结果
4名研究人员运用AGREEⅡ对纳入中医临床指南独立进行评价,预试验结果ICC值为0.89[95%CI(0.87,0.91)],说明4名研究人员对评分条目的理解达成了一致。6个领域得分的具体分布情况见表 2。

2.2.1 范围和目的
此领域评价指南对总目的、所涵盖的卫生问题及所应用的人群阐述是否清晰。指南清晰地描述了范围和目的,将有利于临床医生对指南的选择和获取[16]。本研究该领域得分最高,但报告内容仍不够详细。
2.2.2 参与人员
此领域评价指南制定小组的人员构成情况。参与人员的构成是指南制定严谨和适用于临床实践的先决条件[16]。本研究该领域得分较低,大部分指南报告制定组构成,但均未报告患者和方法学家的参与。
2.2.3 制定的严谨性
此领域评价指南制定小组在指南的制定过程中对方法学的把握和要求。指南制定的严谨性是影响指南质量的重要内容[16]。本研究该领域得分很低,大部分指南未系统和评价检索相关证据,推荐意见形成也缺少证据支持。
2.2.4 表达的明晰性
此领域评价指南对推荐意见的表述是否清晰明了。清晰地描述推荐意见有利于使用者对指南的理解和使用,从而促进指南的传播与推广[16]。本研究该领域为得分第二的领域,6篇指南对推荐意见单独总结或使用特殊字体。
2.2.5 应用性
此领域评价指南在临床实践过程中的适应性和可行性。应用性的高低影响到使用者对指南的选择与使用,同时对指南的推广和传播也起到关键性的作用[16]。本研究该领域得分最低,且所有指南得分均小于25%,均未详细报告指南的应用情况。
2.2.6 编辑独立性
此领域评价指南在制定过程中是否受到利益因素的影响,反映了指南的可信度[16]。本研究该领域得分很低,仅有3篇指南进行利益声明。
2.3 不同类别下中医药临床指南的AGREEⅡ得分
不同分类标准(包括中医药临床指南的制定单位、类型、发表期刊、资助情况、是否提及循证制定以及年份的分布)下各类指南的AGREEⅡ得分见表 3。结果显示:在不同制定单位和不同类型指南中指南得分差异较大,中医科学院和学会制定的中医药临床指南的质量普遍高于其他机构制定的中医药临床指南。从指南类型看,除了最后一个领域(编辑独立性)外,防治类型中医药临床指南的AGREEⅡ得分均高于其他类型中医药临床指南。CSCD期刊发表的中医药临床指南AGREEⅡ得分普遍高于非CSCD期刊发表的中医药临床指南。报告受资助的中医药临床指南AGREEⅡ得分普遍高于未报告资助情况的中医药临床指南(不包括领域二:参与人员)。提及运用循证方法制定的中医药临床指南普遍高于未提及循证制定的中医药指南。

3 讨论
3.1 中医药临床指南整体质量情况
从AGREEⅡ评分来看,目前我国中医药质量不高,其中“范围和目的”、“表达的明晰性”两个领域AGREEⅡ得分相对较高,其余4个领域得分均非常低,“应用性”和“编辑独立性”领域甚至低于10%。与国际指南比较[17],中医药临床指南与国际临床指南AGREEⅡ得分平均水平相差较远(图 5)。与国内指南的平均得分相比[13],本次评价的中医药指南AGREEⅡ得分更高。一方面可能是循证医学在国内不断发展,本土化的中医药研究不断积累,在一定程度上为中医药临床指南的制定提供了良好的证据基础[18-20],另一方面可能是国内非中医药指南基数较大,质量参差不齐,影响国内指南的整体质量。

但2011年后,指南的发表数量骤减,指南的质量整体下降,并且不断波动,但处在一定范围内,表明中医药指南仍需要进一步提升。包括中医药指南在内的国内指南仍以共识性指南为主,未采用循证指南的方法学制定[21]。为了提高中医药指南的质量,2013年中国中医科学院出版了中医临床指南手册[22]。2016年,首届“传统医学(中医药)指南与标准国际研讨会暨2016年中医药指南方法学与GRADE培训班”在广州举行,这将进一步促进中医学指南方法学的发展和推广,为中医药指南制定人员提供指导。
3.2 影响中医药临床指南的因素
从表 3可以看出,中医药临床指南的证据质量与多种因素相关。从指南制定机构看,由学会主导制定的中医药临床指南,其方法学质量相对较高,可能与其可支配的与指南制定相关的资源较其他机构更多有关(例如,能召集更多相关专业和领域的专家参与指南制定小组)。从指南发表的期刊类别看,CSCD期刊发表的中医药临床指南的方法学质量明显高于非CSCD期刊,可能是CSCD期刊同行评审流程更加严格,对文章的科学性和透明性要求更高[23, 24]。从中医药临床指南受资助的情况来看,获得资助的中医药临床指南的方法学质量更高,虽然资金资助可以招募更多的专业人员参与指南的制定,然而不透明的资助也可能对指南的质量带来负面影响[25, 26],如指南制定小组成员中,因为有人接受了药厂的非公开资助,形成具有误导性的推荐意见。此外,基于循证方法制定的中医药临床指南,其指南制定的流程更加透明和科学,因此其方法学质量相对非循证方法制定的中医药临床指南更高。
3.3 研究局限性
本研究的局限性包括:目前缺乏针对临床指南的报告规范,用于表达“指南”含有的词汇可能有多种,本研究仅通过“指引”和“指南”两个关键词进行检索,可能存在一定的漏检。虽然对研究人员进行了AGREEⅡ工具使用的培训并进行了预试验,但不排除因个人理解的差异影响打分结果的精确性的可能。
3.4 小结
临床指南作为指导医务工作者进行医疗决策的参考依据,对改善患者临床结果,提高医疗服务质量具有重要意义[1, 3]。因此其制定方法也应该科学、严谨和规范。应用循证医学的理念和方法制定指南是指南制定的趋势所在。中医药要走向标准化和国际化,其临床指南的制定也应该采用国际通用的标准。目前中医药临床指南的整体方法学质量较差,虽领先中国平均水平,但与国际平均水平还存在较大差距,主要体现在指南编辑的独立性、制定严谨性以及指南制定小组的多学科组成不足。国内中医药临床指南制定者在制定指南过程中,虽然开始尝试运用国际标准化的方法制定指南,然而在指南制定更多的细节上还存在一定问题,应该基于机构化的问题进行系统的检索、评价和综合。更重要还要考虑到推荐措施的成本、使用环境以及患者的偏好与价值观,在此基础上,进一步增加中医药临床指南制定过程的透明性和独立性[27, 28]。
1990年,美国医学研究所(Institute of Medicine,IOM)首次将临床实践指南(以下简称“临床指南”)定义为:系统开发的多组临床指导意见,以协助临床工作者和患者针对特定的临床问题快速做出最恰当的处理决定[1]。临床指南作为指导临床实践的纲领性文件,可以提高临床实践的质量[2],并且能减少卫生保健不公平性并改善医疗服务质量[3]。中医药是在维护健康以及预防、诊断、改善或治疗身心疾病方面使用的种种以不同文化所特有的理论、信仰和经验为基础的知识、技能和实践的总和[4, 5]。中医药临床指南也有自己的鲜明特点,主要包括以整体观理论体系为指导原则,在诊疗过程中重视辨证论治。近年来在“推进中医药标准化、规范化和国际化” [6]、制定中医药国际准则[5, 7]等政策的支持下,国家对制定高质量中医药临床指南越来越重视,且随着循证医学、系统评价和证据质量与推荐强度分级方法的快速发展,中医药临床指南制定的方法学取得了长足进步。目前国内已经出版和发表大量中医药临床指南,其方法学质量具体如何尚不清楚。AGREEⅡ是用于评价临床指南方法学质量的工具[8-10]。本研究旨在运用AGREEⅡ评价国内期刊发表及专著发表的中医药临床指南的方法学质量,为今后制定同类指南提供参考。
1 资料与方法
1.1 纳入与排除标准
1.1.1 纳入标准
①符合IOM对指南的定义[11, 12],即系统评价产生的证据以及对各种备选干预方式进行利弊评价之后提出的最优指导意见的文件;②推荐意见中报告中医药干预措施;③最新版的指南;④暂未发行正式版本的指南草案或试行版。
1.1.2 排除标准
①指南摘要;②重复指南;③国外指南的翻译版或改编版。
1.2 检索策略
本课题组采用统一制定的检索策略[13]分别检索CBM、CNKI、万方和维普4个中文数据库,搜集中医药临床指南,检索时间从各数据库建库时间到2015年12月。同时,手工检索Google、亚马逊和当当网获取以专著形式出版的中医药临床指南。此外,检索纳入中医药临床指南的参考文献,以补充获取相关文献。具体检索策略见表 1。

1.3 指南筛选及资料提取
由2位研究员独立筛选指南、提取资料,并交叉核对,如遇分歧,则咨询第三位研究员协助判断。指南筛选首先阅读文题和摘要,排除明显不相关的指南后,进一步阅读全文,以决定最终是否纳入。最后追溯确定纳入指南的参考文献,避免遗漏相关指南。提取指南信息包括:①发表年份;②制定机构;③应用领域;④是否有方法学家参与;⑤患者意愿、价值观和利益冲突。⑥指南推荐意见;⑦参考文献;⑧数据库检索和证据分级。
1.4 指南评价
运用AGREEⅡ对纳入的指南进行评价。每篇指南由4名研究员对其进行独立评价,AGREEⅡ一共分为6个领域,包含23条评分项。每条评分项的最低分为1分,最高分为7分。得分越高表明指南越符合该条目的要求。每篇指南各领域最终得分的计算公式如下:各领域得分=(实际分-最低分)/(最高分-最低分)。在进行正式评分之前,经过两次预试验,计算组内相关系数(interclass correlation coefficient,ICC)值验证一致性,确保每名研究人员对每个条目的理解基本一致。
1.5 质量控制
在正式评分之前,所有研究人员共同学习AGREEⅡ评分条目并进行了一次预试验(计算机随机选取10篇指南),确保每名研究人员对每个条目的理解基本一致。并运用SPSS 19.0软件计算组内相关系数ICC值验证一致性[14, 15],只有当ICC值不低于0.8时,才进行正式试验。
1.6 统计分析
AGREEⅡ各领域最终得分为纳入指南在各个领域得分的平均数。所得数据运用Excel 2013进行整理。计量资料结果用平均值±标准差表示,预试验结果运用SPSS 19.0统计软件计算组内相关系数ICC值验证一致性[9, 10]。此外因为本研究纳入的是总体样本,因此不进行统计推断。
2 结果
2.1 纳入指南基本特征
共纳入115篇中医药临床指南(期刊发表 87篇,专著出版28篇),具体筛选流程见图 1。近58%(67篇)的中医药指南在2011年发表(图 2)。整体来看115篇中医药临床指南呈现以下特点:①在应用类别方面以诊疗指南为主,占85%(98篇),其次是防治类指南(6%/7篇)和治疗类指南(4%/4篇)(图 3);②参与指南制定的单位主要是学会(59%/68篇)和中国中医科学院(24%/28篇),此外卫生和计划生育委员会(前卫生部)、协会以及医院也都参与了指南的制定,分别占2%(2篇)、4%(4篇)和9%(10篇)(图 4);③制定方法学方面,26%(30篇)的指南提及应用了循证方法制定指南;④基金或项目资助方面,71%(82篇)的指南报告了受资助情况;⑤指南更新方面,有31%(36篇)的指南报告了将在未来2~5年进行更新;⑥数据库检索方面,30%(35篇)的指南清楚描述了检索数据库、检索词及检索时间;⑦利益声明方面,15%(17篇)的指南报告了利益冲突声明。



注:综合表示该指南包含上述几个类别中至少2个方面。

注:综合表示该指南制定机构包含上述几个类别中至少2个方面。
2.2 AGREEⅡ评分结果
4名研究人员运用AGREEⅡ对纳入中医临床指南独立进行评价,预试验结果ICC值为0.89[95%CI(0.87,0.91)],说明4名研究人员对评分条目的理解达成了一致。6个领域得分的具体分布情况见表 2。

2.2.1 范围和目的
此领域评价指南对总目的、所涵盖的卫生问题及所应用的人群阐述是否清晰。指南清晰地描述了范围和目的,将有利于临床医生对指南的选择和获取[16]。本研究该领域得分最高,但报告内容仍不够详细。
2.2.2 参与人员
此领域评价指南制定小组的人员构成情况。参与人员的构成是指南制定严谨和适用于临床实践的先决条件[16]。本研究该领域得分较低,大部分指南报告制定组构成,但均未报告患者和方法学家的参与。
2.2.3 制定的严谨性
此领域评价指南制定小组在指南的制定过程中对方法学的把握和要求。指南制定的严谨性是影响指南质量的重要内容[16]。本研究该领域得分很低,大部分指南未系统和评价检索相关证据,推荐意见形成也缺少证据支持。
2.2.4 表达的明晰性
此领域评价指南对推荐意见的表述是否清晰明了。清晰地描述推荐意见有利于使用者对指南的理解和使用,从而促进指南的传播与推广[16]。本研究该领域为得分第二的领域,6篇指南对推荐意见单独总结或使用特殊字体。
2.2.5 应用性
此领域评价指南在临床实践过程中的适应性和可行性。应用性的高低影响到使用者对指南的选择与使用,同时对指南的推广和传播也起到关键性的作用[16]。本研究该领域得分最低,且所有指南得分均小于25%,均未详细报告指南的应用情况。
2.2.6 编辑独立性
此领域评价指南在制定过程中是否受到利益因素的影响,反映了指南的可信度[16]。本研究该领域得分很低,仅有3篇指南进行利益声明。
2.3 不同类别下中医药临床指南的AGREEⅡ得分
不同分类标准(包括中医药临床指南的制定单位、类型、发表期刊、资助情况、是否提及循证制定以及年份的分布)下各类指南的AGREEⅡ得分见表 3。结果显示:在不同制定单位和不同类型指南中指南得分差异较大,中医科学院和学会制定的中医药临床指南的质量普遍高于其他机构制定的中医药临床指南。从指南类型看,除了最后一个领域(编辑独立性)外,防治类型中医药临床指南的AGREEⅡ得分均高于其他类型中医药临床指南。CSCD期刊发表的中医药临床指南AGREEⅡ得分普遍高于非CSCD期刊发表的中医药临床指南。报告受资助的中医药临床指南AGREEⅡ得分普遍高于未报告资助情况的中医药临床指南(不包括领域二:参与人员)。提及运用循证方法制定的中医药临床指南普遍高于未提及循证制定的中医药指南。

3 讨论
3.1 中医药临床指南整体质量情况
从AGREEⅡ评分来看,目前我国中医药质量不高,其中“范围和目的”、“表达的明晰性”两个领域AGREEⅡ得分相对较高,其余4个领域得分均非常低,“应用性”和“编辑独立性”领域甚至低于10%。与国际指南比较[17],中医药临床指南与国际临床指南AGREEⅡ得分平均水平相差较远(图 5)。与国内指南的平均得分相比[13],本次评价的中医药指南AGREEⅡ得分更高。一方面可能是循证医学在国内不断发展,本土化的中医药研究不断积累,在一定程度上为中医药临床指南的制定提供了良好的证据基础[18-20],另一方面可能是国内非中医药指南基数较大,质量参差不齐,影响国内指南的整体质量。

但2011年后,指南的发表数量骤减,指南的质量整体下降,并且不断波动,但处在一定范围内,表明中医药指南仍需要进一步提升。包括中医药指南在内的国内指南仍以共识性指南为主,未采用循证指南的方法学制定[21]。为了提高中医药指南的质量,2013年中国中医科学院出版了中医临床指南手册[22]。2016年,首届“传统医学(中医药)指南与标准国际研讨会暨2016年中医药指南方法学与GRADE培训班”在广州举行,这将进一步促进中医学指南方法学的发展和推广,为中医药指南制定人员提供指导。
3.2 影响中医药临床指南的因素
从表 3可以看出,中医药临床指南的证据质量与多种因素相关。从指南制定机构看,由学会主导制定的中医药临床指南,其方法学质量相对较高,可能与其可支配的与指南制定相关的资源较其他机构更多有关(例如,能召集更多相关专业和领域的专家参与指南制定小组)。从指南发表的期刊类别看,CSCD期刊发表的中医药临床指南的方法学质量明显高于非CSCD期刊,可能是CSCD期刊同行评审流程更加严格,对文章的科学性和透明性要求更高[23, 24]。从中医药临床指南受资助的情况来看,获得资助的中医药临床指南的方法学质量更高,虽然资金资助可以招募更多的专业人员参与指南的制定,然而不透明的资助也可能对指南的质量带来负面影响[25, 26],如指南制定小组成员中,因为有人接受了药厂的非公开资助,形成具有误导性的推荐意见。此外,基于循证方法制定的中医药临床指南,其指南制定的流程更加透明和科学,因此其方法学质量相对非循证方法制定的中医药临床指南更高。
3.3 研究局限性
本研究的局限性包括:目前缺乏针对临床指南的报告规范,用于表达“指南”含有的词汇可能有多种,本研究仅通过“指引”和“指南”两个关键词进行检索,可能存在一定的漏检。虽然对研究人员进行了AGREEⅡ工具使用的培训并进行了预试验,但不排除因个人理解的差异影响打分结果的精确性的可能。
3.4 小结
临床指南作为指导医务工作者进行医疗决策的参考依据,对改善患者临床结果,提高医疗服务质量具有重要意义[1, 3]。因此其制定方法也应该科学、严谨和规范。应用循证医学的理念和方法制定指南是指南制定的趋势所在。中医药要走向标准化和国际化,其临床指南的制定也应该采用国际通用的标准。目前中医药临床指南的整体方法学质量较差,虽领先中国平均水平,但与国际平均水平还存在较大差距,主要体现在指南编辑的独立性、制定严谨性以及指南制定小组的多学科组成不足。国内中医药临床指南制定者在制定指南过程中,虽然开始尝试运用国际标准化的方法制定指南,然而在指南制定更多的细节上还存在一定问题,应该基于机构化的问题进行系统的检索、评价和综合。更重要还要考虑到推荐措施的成本、使用环境以及患者的偏好与价值观,在此基础上,进一步增加中医药临床指南制定过程的透明性和独立性[27, 28]。