引用本文: 张明妍, 杨丰文, 李越, 刘玉, 赵梦瑜, 郑文科, 张俊华. 《中国中西医结合杂志》刊载中医药随机对照试验报告质量的研究. 中国循证医学杂志, 2017, 17(3): 357-363. doi: 10.7507/1672-2531.201611085 复制
随机对照试验(RCT)是评价干预措施临床作用的首选设计类型,但临床试验的价值不仅在研究设计的科学、合理、可行,也取决于研究过程的质量控制,还依赖于研究结果清晰、透明的报告。临床试验报告规范 CONSORT 工作组 Moher 教授介绍“整个医学都有赖于临床试验报告的透明化”[1]。只有作者对研究的设计、实施和分析做出全面而准确的描述时,才能将研究结果客观清晰的呈献给读者,才能成为供决策参考的证据。自 1996 年 CONSORT 声明发布以来,对临床研究的报告和质量提升起到了极大的推动作用。
李廷谦等[2]2005 年采用 CONSORT(2001 版)清单对《中国中西医结合杂志》以往发表的 1 288 篇 RCT 研究进行了报告质量评价,结果发现不少问题:如随机分配部分采用就诊顺序、出生日期等半随机方式,分配隐藏、盲法采用率过低,部分诊断标准为自拟,忽视伦理要求等,这也突出反应了中医药临床研究在方法学质量和研究报告当时的状况。随着循证医学发展,临床医生及相关科研工作者更加重视临床研究的方法学质量和规范报告。本研究以 CONSORT(2010 版)清单为工具,结合医学伦理学要求,评价《中国中西医结合杂志》2014 年全年刊登的 RCT,分析中医药临床研究质量现况,并将其与 10 年前研究结果对比,分析 10 年来中医药 RCT 质量变化情况。
1 资料与方法
1.1 纳入与排除标准
1.1.1 研究设计 随机对照临床试验。
1.1.2 干预措施 中医药相关疗法,如中药汤剂、中成药、穴位治疗(针刺、艾灸、埋线、电刺激、药物敷贴或穴位注射等)、推拿按摩及中医综合疗法等。疾病类型、对照措施及结局指标不做限制。
1.1.3 排除标准 无法提取数据的文献,摘要等。
1.2 文献检索
计算机检索 CNKI 数据库,获取《中国中西医结合杂志》2014 年共 12 期文献目录和全文。检索策略为“期刊-期刊导航-中国中西医结合杂志-2014 年”。
1.3 资料提取与报告质量评价
由 2 名研究者逐篇阅读文献,筛选文献,提取资料。如有分歧,经讨论解决。按照事先制定的数据提取表提取资料,提取内容包括:纳入研究的基本特征,如姓名、出版时间等;报告规范评价的指标。采用 CONSORT(2010 版)评价纳入研究报告质量[3]。对研究伦理学相关内容进行评价,包括方案的伦理审批、患者知情同意和研究方案注册 3 个条目。
1.4 统计分析
采用 SPSS 软件对 2004 年与 2014 年符合条目要求的研究数量占各组总研究数量百分率的比值 RR 值进行统计分析。计数资料组间比较采用χ2 检验,检验水准为α=0.05。
2 结果
2.1 《中国中西医结合杂志》2014 年刊登 RCT 的情况
2014 年《中国中西医结合杂志》共刊登 317 篇论文,其中 80 篇为中医药 RCT,占发表论文总数的 25.24%。中医临床随机对照试验的干预措施主要为4类:中成药、中药汤剂、针灸和中医综合疗法。80 篇 RCT 中中药汤剂 33 篇,中成药 34 篇,针灸 11 篇,中医综合疗法 2 篇。文献筛选流程及结果见图 1。

2.2 CONSORT 2010 清单评价结果
采用 CONSORT 2010 清单评价纳入 RCT 的报告质量,详细结果见表 1。根据符合清单条目要求的研究数量及百分比,将报告质量分为高中低三级:80% 以上研究符合报告要求的属于报告质量高;50%~80% 为中等报告质量;<50% 为报告质量低,其中<10% 属于报告质量很低。

80 篇 RCT 中,报告质量高的条目有:摘要、受试者、随机序列、知情同意;报告质量中等的条目有:引言、干预措施、危害、资助;其余条目报告质量较差。其中文题、试验设计、结局指标、样本量、随机方法类型、分配隐藏、盲法、纳入分析的例数、结局与估计值、推广性、解释、试验注册与试验方案的条目报告质量很低(<10%)。
2.3 分类评价结果
根据清单各条目的类型和不同作用,将 25 个条目分为三类:规范性条目、方法学条目和提示性条目。对于提示性条目,如果研究不涉及相关内容,则无需报告,此类条目则不能评价报告情况的优劣。从方法学相关条目的报告情况,可以分析研究的方法学质量。而规范性条目主要反映了研究报告的清晰度和规范性。
2.3.1 规范性条目 ① 文题和摘要:文题是否标引为随机临床试验,影响研究的检索和识别。80 篇 RCT 中仅 8 篇可通过文题识别为随机临床试验,提示中医药 RCT 研究报告题目还需要规范和重视。摘要多以目的、方法、结果、结论四段式结构组成,很少报告设计类型。② 试验设计:2010 版 CONSORT 清单中增加对试验设计的评价,评价显示有 16 篇文献描述了试验设计类型,11 篇说明受试者分配入各组的比例,既报告设计类型又报告样本分配比例的仅4篇。③ 受试者:研究多采用西医诊断标准,忽视中医诊断标准,33 篇(41.25%)无中医诊断标准。④ 干预措施:57 个研究详细描述各组干预措施的细节,包括时间和具体实施。但也存在问题:中药方剂配伍缺乏具体剂量;西医治疗方法笼统、西药有名称无剂量,如 13 个 RCT 中只说明“常规治疗”或“基础治疗”,但无具体方案。⑤ 结局指标:临床研究对预先设定的主要和次要结局指标应该完整报告,并提供详细的信息,如测量方法,测量时点等。纳入研究中仅 9 篇报告充分,13 篇运用“治疗前后”模糊介绍测量时点。此外,有 13 篇 RCT 中存在结局指标前后不一致情况,均未作变动说明。⑥ 样本量:仅 6 个 RCT 描述如何确定样本量,其余研究未交待样本量确定依据。⑦ 流程图:CONSORT 声明极力推荐使用病例流程图。纳入的 80 篇研究全部以文字描述,没有 1 个使用流程图,此项内容报告需要加强。有 3 个研究报告了病例脱落和剔除信息,仅报告病例脱落的有 32 篇,有 1 篇报告了病例剔除,报告情况较差。⑧ 基线资料:为更好地评估组间均衡性,基线资料的报告很重要,但有 39 个研究未采用表格报告基线数据。⑨ 局限性、可推广性、解释:讨论部分应该围绕研究的不足、存在的偏倚及影响结果的其他因素进行描述,这对判断该研究结果的价值非常重要。然而纳入研究多从研究领域的机制理论方面讨论,而非本研究的方法学及质量控制;多夸赞自己的研究,较少分析自身研究的局限性和不足,仅 16 篇有简单描述样本量少、研究时间较短等内容。可推广性报告仅 1 篇,多数研究用“……证明疗效较好,值得进一步推广”一句话概括,没有结合证据的内部真实性和可及性进行分析。结合当前其他研究证据对结果进行“解释”也很重要,但仅有 2 篇文献报告了相关信息。对纳入研究讨论部分的分析,发现研究者对这 3 个条目的理解存在偏差,需要相关培训。⑩ 注册:临床试验注册并公开研究方案是临床试验透明化的重要环节,许多国际学术期刊拒绝没有注册的研究发表。但纳入研究中没有文章提供试验注册或方案获取方式的信息,有些试验可能已经注册,但在文章中没有报告。⑪ 资助:超半数(54 项)的研究有资助,且多为纵向资金(50 项),一定程度上说明中医药 RCT 的质量已得到提高。
2.3.2 方法学条目 随机序列的产生、分配隐藏方法与实施办法、盲法及纳入分析的病例等 5 个条目与研究的偏倚控制密切相关,其报告情况能够反应出方法学实施的质量。① 纳入的研究中,77 个研究(96%)报告了随机序列的产生方法,其中 63 篇(82%)采用随机数字表法,有 5 篇采用半随机方法分组,如就诊顺序、日期单双号等。随机分配类型描述较少,5 篇提到运用分层随机。② 对分配隐藏机制,仅 7 篇有报告,多采用不透光的密封信封方式。③ 有 3 篇对实施过程进行说明。这是普遍存在的问题,PubMed 收录的全部随机临床试验报告中只有 18% 报告了分配隐藏机制[4]。④ 纳入研究中有 12 篇运用盲法,仅 3 篇描述了实施过程。在使用双盲、安慰剂、模拟剂的研究中,有 9 个研究从组成、包装、外观、口味等方面描述干预措施的相似性。⑤ 有 36 个研究简单报告了病例脱离或剔除,但仅有 8 个研究在数据分析时报告了减员情况及影响。对病例脱离原因分析和数据集的划分还是薄弱环节。
2.3.3 提示性条目 3b、6b、7b、11b、14b、17b、18 与 24 共 8 个条目属于提示性条目,通常带“必要时”“如果”“是否有更改”等字样。这些条目不报告不代表报告质量低。如纳入文献中无试验方法改变的说明、无中期分析和中止的试验、无试验中断或停止的报告,这些内容在多中心、大样本、长时程的试验中多会涉及,小样本短期试验可能不涉及。辅助分析、附加分析及校正分析也需要根据具体研究数据情况而定,不是必须报告内容。
2.4 RCTs 报告质量变化分析
2.4.1 报告质量变化 2005 年李廷谦教授团队用 CONSORT 2001 清单对 1999 年到 2004 年《中国中西医结合杂志》发表的 RCTs 进行了质量评价。以此为参照,本研究对比分析 RCT 报告质量的变化。结果见表 2。

因 CONSORT 清单的更新,2010 版与 2001 版在统计学方法、结果和估计值、基线资料及讨论等条目有显著不同,故仅对 14 个条目进行比较分析。根据表 2 数据显示,除了流程图一直没有得到应用,其余 13 项结果较 10 年前均有显著改善,差异具有统计学意义,说明中医药临床 RCT 报告质量有了提升。主要变化有:① 结构式摘要使用增加了 54%,研究背景、目的阐释的更加明确化;② 对受试者诊断标准报告有提升,研究者减少采用自拟标准,并且对纳入、排除标准与诊断标准同样重视,有助于提高受试者纳入的一致性;③ 研究者开始重视样本量计算的报告,但报告质量依然很低(<10%);④ 受试者招募和随访都有增加,其中随访记录增加近 26%;⑤ 干预措施、疗效评价指标已不再采用自拟标准,国际化学术认可增强。研究者重视广泛性认同的主、次结局指标使用;⑥ 部分研究开始采用意向性分析(ITT),这是一项进步;⑦ 资助相关信息报告增加了 54%,且多为省级或国家科技资助项目。综上,10 年来中医药 RCT 的报告质量已经取得了长足进步,但还有很大提升的空间。
2.4.2 方法学质量变化比较 与 10 年前研究相比,RCT 随机、分配隐藏、盲法的报告质量显著提高,其差异有统计学意义,结果见表 3。

2.4.3 伦理学执行情况比较 临床研究对受试者权益的保护是重要的内容。方案的审批,患者知情同意的获取以及研究方案注册等条目反映伦理相关内容执行情况。从表 4 数据对比可以看出,中医药 RCTs 伦理审批从无到有,报告率达 25%;患者知情同意受到重视,91% 以上的 RCT 报告了受试者知情同意情况。但是,临床研究注册仍然被忽视,虽然 2004 年以后出台了临床试验方案注册的要求,CONSORT 2010 清单中增加了“试验注册”相关内容,但仍无研究提供试验注册和方案获取方式等信息。

3 讨论
循证医学在中国的普及推广对我国临床研究尤其是中医药临床研究产生了重大指导价值[5-7]。本研究结果表明:与 10 年前相比,《中国中西医结合杂志》发表的中医药临床随机对照试验报告质量、方法学质量与伦理学情况均取得了进步。与其他研究结果一致[8-12],本研究提示当前中医药 RCT 质量总体还不高,仍然较大的提升空间。这其中主要问题包括试验设计、结局指标、样本量、随机化、盲法、流程图、结局和估计值、试验注册部分报告不完整、不规范等。中医药研究领域 RCT 质量 10 年间虽有较大进步,但整体质量依然较低,主要原因可能有:研究者对临床研究相关知识了解不够,需要加强技术培训;期刊对 CONSORT 清单的重视不够,对发表文章的报告质量审查力度不够。
使用 CONSORT 2010 清单评价 RCT 报告质量需要注意以下几方面内容:首先,为保证对清单条目的正确理解和运用,需要对评价者进行培训,并进行一致性检验,同时要实施 2 名以上评价员独立评价,以减少主观判断带来的偏倚。其次,根据清单条目属性分类区别分析。CONSORT 2010 虽有 25 个主条目,但有的条目下面有子条目,共计37 个条目,大体分为三类:规范性条目、方法学条目及提示性条目。规范性条目是每个研究都应该报告的条目;方法学条目可用作评价方法学质量,能够反应研究偏倚控制的情况;而提示性条目不是必要性条目,在研究中因具体情况而定,不报告不代表报告质量低,因此不能用作评价质量。第三,认真分析,做好备注。一个条目包含多项细节内容,大部分报告存在报告不完整等问题,这些不等同于未报告,需要详细记录,并分析相关原因。如 6a“完整而准确地说明预先设定的主要和次要结局指标,包括它们是在何时、如何测评的”,某些研究可能说明主次结局指标但未说明时间或(与)方法,所以在用其评价 RCT 的报告质量时要认真分析每一条内容并详细备注。
本研究存在一定的局限性。首先,纳入 RCT 仅 80 个,代表性可能不够。后续我们将增加期刊和年份,更全面的评价中医药随机对照临床试验的发展状况和存在问题。其次,由于十年前的调查研究以 CONSORT 2001 清单进行评价,本研究采用更新版 CONSORT 2010。由于两个版本存在一定的变化,本研究无法将所有条目进行比较。第三,因有文章对相关信息的报告不完全或漏报,可能会影响评价员的判断。
随着循证医学的发展,报告质量及方法学质量的提高能够提升研究结果的实用性、可比性和透明度,从而使单个研究数据的价值得到充分利用,更好地为医疗卫生决策的制定起到辅助作用。CONSORT 系列报告规范,包括草药、针灸扩展版发布[13-15],从出口把关,为提高中医药临床试验报告质量提供了参照和依据。然而,中医药临床研究质量提升需要从多个环节下功夫,多处着力解决瓶颈问题。一方面,中文期刊杂志要修订、完善稿约,加强对审稿规范的要求,同意对审稿人、编委进行相关技术和培训。一方面,要对临床研究者、医生、医学生加强培训,传播 RCT 方法学和报告相关技术要求,形成规范意识和质量意识。同时,充分发挥中国医学循证医学中心及各分中心的技术优势,整合优势资源,做好普及和培训工作。随着循证医学临床方法学的推广,中医药临床研究人员技能的提升,中医药临床研究质量会大幅提升,为中医药临床疗效提供高质量证据。
随机对照试验(RCT)是评价干预措施临床作用的首选设计类型,但临床试验的价值不仅在研究设计的科学、合理、可行,也取决于研究过程的质量控制,还依赖于研究结果清晰、透明的报告。临床试验报告规范 CONSORT 工作组 Moher 教授介绍“整个医学都有赖于临床试验报告的透明化”[1]。只有作者对研究的设计、实施和分析做出全面而准确的描述时,才能将研究结果客观清晰的呈献给读者,才能成为供决策参考的证据。自 1996 年 CONSORT 声明发布以来,对临床研究的报告和质量提升起到了极大的推动作用。
李廷谦等[2]2005 年采用 CONSORT(2001 版)清单对《中国中西医结合杂志》以往发表的 1 288 篇 RCT 研究进行了报告质量评价,结果发现不少问题:如随机分配部分采用就诊顺序、出生日期等半随机方式,分配隐藏、盲法采用率过低,部分诊断标准为自拟,忽视伦理要求等,这也突出反应了中医药临床研究在方法学质量和研究报告当时的状况。随着循证医学发展,临床医生及相关科研工作者更加重视临床研究的方法学质量和规范报告。本研究以 CONSORT(2010 版)清单为工具,结合医学伦理学要求,评价《中国中西医结合杂志》2014 年全年刊登的 RCT,分析中医药临床研究质量现况,并将其与 10 年前研究结果对比,分析 10 年来中医药 RCT 质量变化情况。
1 资料与方法
1.1 纳入与排除标准
1.1.1 研究设计 随机对照临床试验。
1.1.2 干预措施 中医药相关疗法,如中药汤剂、中成药、穴位治疗(针刺、艾灸、埋线、电刺激、药物敷贴或穴位注射等)、推拿按摩及中医综合疗法等。疾病类型、对照措施及结局指标不做限制。
1.1.3 排除标准 无法提取数据的文献,摘要等。
1.2 文献检索
计算机检索 CNKI 数据库,获取《中国中西医结合杂志》2014 年共 12 期文献目录和全文。检索策略为“期刊-期刊导航-中国中西医结合杂志-2014 年”。
1.3 资料提取与报告质量评价
由 2 名研究者逐篇阅读文献,筛选文献,提取资料。如有分歧,经讨论解决。按照事先制定的数据提取表提取资料,提取内容包括:纳入研究的基本特征,如姓名、出版时间等;报告规范评价的指标。采用 CONSORT(2010 版)评价纳入研究报告质量[3]。对研究伦理学相关内容进行评价,包括方案的伦理审批、患者知情同意和研究方案注册 3 个条目。
1.4 统计分析
采用 SPSS 软件对 2004 年与 2014 年符合条目要求的研究数量占各组总研究数量百分率的比值 RR 值进行统计分析。计数资料组间比较采用χ2 检验,检验水准为α=0.05。
2 结果
2.1 《中国中西医结合杂志》2014 年刊登 RCT 的情况
2014 年《中国中西医结合杂志》共刊登 317 篇论文,其中 80 篇为中医药 RCT,占发表论文总数的 25.24%。中医临床随机对照试验的干预措施主要为4类:中成药、中药汤剂、针灸和中医综合疗法。80 篇 RCT 中中药汤剂 33 篇,中成药 34 篇,针灸 11 篇,中医综合疗法 2 篇。文献筛选流程及结果见图 1。

2.2 CONSORT 2010 清单评价结果
采用 CONSORT 2010 清单评价纳入 RCT 的报告质量,详细结果见表 1。根据符合清单条目要求的研究数量及百分比,将报告质量分为高中低三级:80% 以上研究符合报告要求的属于报告质量高;50%~80% 为中等报告质量;<50% 为报告质量低,其中<10% 属于报告质量很低。

80 篇 RCT 中,报告质量高的条目有:摘要、受试者、随机序列、知情同意;报告质量中等的条目有:引言、干预措施、危害、资助;其余条目报告质量较差。其中文题、试验设计、结局指标、样本量、随机方法类型、分配隐藏、盲法、纳入分析的例数、结局与估计值、推广性、解释、试验注册与试验方案的条目报告质量很低(<10%)。
2.3 分类评价结果
根据清单各条目的类型和不同作用,将 25 个条目分为三类:规范性条目、方法学条目和提示性条目。对于提示性条目,如果研究不涉及相关内容,则无需报告,此类条目则不能评价报告情况的优劣。从方法学相关条目的报告情况,可以分析研究的方法学质量。而规范性条目主要反映了研究报告的清晰度和规范性。
2.3.1 规范性条目 ① 文题和摘要:文题是否标引为随机临床试验,影响研究的检索和识别。80 篇 RCT 中仅 8 篇可通过文题识别为随机临床试验,提示中医药 RCT 研究报告题目还需要规范和重视。摘要多以目的、方法、结果、结论四段式结构组成,很少报告设计类型。② 试验设计:2010 版 CONSORT 清单中增加对试验设计的评价,评价显示有 16 篇文献描述了试验设计类型,11 篇说明受试者分配入各组的比例,既报告设计类型又报告样本分配比例的仅4篇。③ 受试者:研究多采用西医诊断标准,忽视中医诊断标准,33 篇(41.25%)无中医诊断标准。④ 干预措施:57 个研究详细描述各组干预措施的细节,包括时间和具体实施。但也存在问题:中药方剂配伍缺乏具体剂量;西医治疗方法笼统、西药有名称无剂量,如 13 个 RCT 中只说明“常规治疗”或“基础治疗”,但无具体方案。⑤ 结局指标:临床研究对预先设定的主要和次要结局指标应该完整报告,并提供详细的信息,如测量方法,测量时点等。纳入研究中仅 9 篇报告充分,13 篇运用“治疗前后”模糊介绍测量时点。此外,有 13 篇 RCT 中存在结局指标前后不一致情况,均未作变动说明。⑥ 样本量:仅 6 个 RCT 描述如何确定样本量,其余研究未交待样本量确定依据。⑦ 流程图:CONSORT 声明极力推荐使用病例流程图。纳入的 80 篇研究全部以文字描述,没有 1 个使用流程图,此项内容报告需要加强。有 3 个研究报告了病例脱落和剔除信息,仅报告病例脱落的有 32 篇,有 1 篇报告了病例剔除,报告情况较差。⑧ 基线资料:为更好地评估组间均衡性,基线资料的报告很重要,但有 39 个研究未采用表格报告基线数据。⑨ 局限性、可推广性、解释:讨论部分应该围绕研究的不足、存在的偏倚及影响结果的其他因素进行描述,这对判断该研究结果的价值非常重要。然而纳入研究多从研究领域的机制理论方面讨论,而非本研究的方法学及质量控制;多夸赞自己的研究,较少分析自身研究的局限性和不足,仅 16 篇有简单描述样本量少、研究时间较短等内容。可推广性报告仅 1 篇,多数研究用“……证明疗效较好,值得进一步推广”一句话概括,没有结合证据的内部真实性和可及性进行分析。结合当前其他研究证据对结果进行“解释”也很重要,但仅有 2 篇文献报告了相关信息。对纳入研究讨论部分的分析,发现研究者对这 3 个条目的理解存在偏差,需要相关培训。⑩ 注册:临床试验注册并公开研究方案是临床试验透明化的重要环节,许多国际学术期刊拒绝没有注册的研究发表。但纳入研究中没有文章提供试验注册或方案获取方式的信息,有些试验可能已经注册,但在文章中没有报告。⑪ 资助:超半数(54 项)的研究有资助,且多为纵向资金(50 项),一定程度上说明中医药 RCT 的质量已得到提高。
2.3.2 方法学条目 随机序列的产生、分配隐藏方法与实施办法、盲法及纳入分析的病例等 5 个条目与研究的偏倚控制密切相关,其报告情况能够反应出方法学实施的质量。① 纳入的研究中,77 个研究(96%)报告了随机序列的产生方法,其中 63 篇(82%)采用随机数字表法,有 5 篇采用半随机方法分组,如就诊顺序、日期单双号等。随机分配类型描述较少,5 篇提到运用分层随机。② 对分配隐藏机制,仅 7 篇有报告,多采用不透光的密封信封方式。③ 有 3 篇对实施过程进行说明。这是普遍存在的问题,PubMed 收录的全部随机临床试验报告中只有 18% 报告了分配隐藏机制[4]。④ 纳入研究中有 12 篇运用盲法,仅 3 篇描述了实施过程。在使用双盲、安慰剂、模拟剂的研究中,有 9 个研究从组成、包装、外观、口味等方面描述干预措施的相似性。⑤ 有 36 个研究简单报告了病例脱离或剔除,但仅有 8 个研究在数据分析时报告了减员情况及影响。对病例脱离原因分析和数据集的划分还是薄弱环节。
2.3.3 提示性条目 3b、6b、7b、11b、14b、17b、18 与 24 共 8 个条目属于提示性条目,通常带“必要时”“如果”“是否有更改”等字样。这些条目不报告不代表报告质量低。如纳入文献中无试验方法改变的说明、无中期分析和中止的试验、无试验中断或停止的报告,这些内容在多中心、大样本、长时程的试验中多会涉及,小样本短期试验可能不涉及。辅助分析、附加分析及校正分析也需要根据具体研究数据情况而定,不是必须报告内容。
2.4 RCTs 报告质量变化分析
2.4.1 报告质量变化 2005 年李廷谦教授团队用 CONSORT 2001 清单对 1999 年到 2004 年《中国中西医结合杂志》发表的 RCTs 进行了质量评价。以此为参照,本研究对比分析 RCT 报告质量的变化。结果见表 2。

因 CONSORT 清单的更新,2010 版与 2001 版在统计学方法、结果和估计值、基线资料及讨论等条目有显著不同,故仅对 14 个条目进行比较分析。根据表 2 数据显示,除了流程图一直没有得到应用,其余 13 项结果较 10 年前均有显著改善,差异具有统计学意义,说明中医药临床 RCT 报告质量有了提升。主要变化有:① 结构式摘要使用增加了 54%,研究背景、目的阐释的更加明确化;② 对受试者诊断标准报告有提升,研究者减少采用自拟标准,并且对纳入、排除标准与诊断标准同样重视,有助于提高受试者纳入的一致性;③ 研究者开始重视样本量计算的报告,但报告质量依然很低(<10%);④ 受试者招募和随访都有增加,其中随访记录增加近 26%;⑤ 干预措施、疗效评价指标已不再采用自拟标准,国际化学术认可增强。研究者重视广泛性认同的主、次结局指标使用;⑥ 部分研究开始采用意向性分析(ITT),这是一项进步;⑦ 资助相关信息报告增加了 54%,且多为省级或国家科技资助项目。综上,10 年来中医药 RCT 的报告质量已经取得了长足进步,但还有很大提升的空间。
2.4.2 方法学质量变化比较 与 10 年前研究相比,RCT 随机、分配隐藏、盲法的报告质量显著提高,其差异有统计学意义,结果见表 3。

2.4.3 伦理学执行情况比较 临床研究对受试者权益的保护是重要的内容。方案的审批,患者知情同意的获取以及研究方案注册等条目反映伦理相关内容执行情况。从表 4 数据对比可以看出,中医药 RCTs 伦理审批从无到有,报告率达 25%;患者知情同意受到重视,91% 以上的 RCT 报告了受试者知情同意情况。但是,临床研究注册仍然被忽视,虽然 2004 年以后出台了临床试验方案注册的要求,CONSORT 2010 清单中增加了“试验注册”相关内容,但仍无研究提供试验注册和方案获取方式等信息。

3 讨论
循证医学在中国的普及推广对我国临床研究尤其是中医药临床研究产生了重大指导价值[5-7]。本研究结果表明:与 10 年前相比,《中国中西医结合杂志》发表的中医药临床随机对照试验报告质量、方法学质量与伦理学情况均取得了进步。与其他研究结果一致[8-12],本研究提示当前中医药 RCT 质量总体还不高,仍然较大的提升空间。这其中主要问题包括试验设计、结局指标、样本量、随机化、盲法、流程图、结局和估计值、试验注册部分报告不完整、不规范等。中医药研究领域 RCT 质量 10 年间虽有较大进步,但整体质量依然较低,主要原因可能有:研究者对临床研究相关知识了解不够,需要加强技术培训;期刊对 CONSORT 清单的重视不够,对发表文章的报告质量审查力度不够。
使用 CONSORT 2010 清单评价 RCT 报告质量需要注意以下几方面内容:首先,为保证对清单条目的正确理解和运用,需要对评价者进行培训,并进行一致性检验,同时要实施 2 名以上评价员独立评价,以减少主观判断带来的偏倚。其次,根据清单条目属性分类区别分析。CONSORT 2010 虽有 25 个主条目,但有的条目下面有子条目,共计37 个条目,大体分为三类:规范性条目、方法学条目及提示性条目。规范性条目是每个研究都应该报告的条目;方法学条目可用作评价方法学质量,能够反应研究偏倚控制的情况;而提示性条目不是必要性条目,在研究中因具体情况而定,不报告不代表报告质量低,因此不能用作评价质量。第三,认真分析,做好备注。一个条目包含多项细节内容,大部分报告存在报告不完整等问题,这些不等同于未报告,需要详细记录,并分析相关原因。如 6a“完整而准确地说明预先设定的主要和次要结局指标,包括它们是在何时、如何测评的”,某些研究可能说明主次结局指标但未说明时间或(与)方法,所以在用其评价 RCT 的报告质量时要认真分析每一条内容并详细备注。
本研究存在一定的局限性。首先,纳入 RCT 仅 80 个,代表性可能不够。后续我们将增加期刊和年份,更全面的评价中医药随机对照临床试验的发展状况和存在问题。其次,由于十年前的调查研究以 CONSORT 2001 清单进行评价,本研究采用更新版 CONSORT 2010。由于两个版本存在一定的变化,本研究无法将所有条目进行比较。第三,因有文章对相关信息的报告不完全或漏报,可能会影响评价员的判断。
随着循证医学的发展,报告质量及方法学质量的提高能够提升研究结果的实用性、可比性和透明度,从而使单个研究数据的价值得到充分利用,更好地为医疗卫生决策的制定起到辅助作用。CONSORT 系列报告规范,包括草药、针灸扩展版发布[13-15],从出口把关,为提高中医药临床试验报告质量提供了参照和依据。然而,中医药临床研究质量提升需要从多个环节下功夫,多处着力解决瓶颈问题。一方面,中文期刊杂志要修订、完善稿约,加强对审稿规范的要求,同意对审稿人、编委进行相关技术和培训。一方面,要对临床研究者、医生、医学生加强培训,传播 RCT 方法学和报告相关技术要求,形成规范意识和质量意识。同时,充分发挥中国医学循证医学中心及各分中心的技术优势,整合优势资源,做好普及和培训工作。随着循证医学临床方法学的推广,中医药临床研究人员技能的提升,中医药临床研究质量会大幅提升,为中医药临床疗效提供高质量证据。