引用本文: 辛沂青, 陈泽, 吴云云, 刘宇晨, 陈辉焕, 唐纯志, 陆丽明. 针刺治疗干眼症随机对照试验的报告质量评价. 中国循证医学杂志, 2020, 20(10): 1199-1207. doi: 10.7507/1672-2531.202003044 复制
干眼症是指各种原因引起与眼部不适相关的泪膜和眼表面异常的一种疾病,其病因可能是全身性疾病,例如干燥综合征,也可是局部眼部病变导致的泪膜异常改变或泪液动力学异常改变[1]。干眼症患者主诉为眼部异物感、畏光流泪、视力减退等,严重影响患者的生活工作及学习。全球干眼症的发病率约为 5.5%~33.7%[2],其中欧美国家约为 11.0%~28.7%,亚洲其他国家约为 17%~34%[3],中国发病率约为 21%~30%[4]。当前干眼症最常用的一线治疗方式是使用人工泪液或通过配戴贴近脸部且包覆眼周的眼镜以减少泪液蒸发,继发性干眼病则可通过停用药品和干预影响因素缓解病情。其药物治疗主要使用含有环孢素或类固醇成分的眼药水[5],必要时联合抗炎药物,但效果不尽如人意。
针刺是目前治疗干眼症的方法之一。随着中医药发展,大量关于针刺治疗干眼症的随机对照试验(randomized controlled trail,RCT)已经发表,然而相关 RCT 报告水平参差不齐,为后续相关研究造成一定不便。1996 年发表的 CONSORT 声明[6],以促进研究人员对 RCT 报告质量做出评价和解释为目的,为作者、同行评论员和编辑提供了改进 RCT 报告的指导,帮助他们明确具有潜在偏倚结果的报告,更新的最新版本为 CONSORT 声明 2010。在 CONSORT 声明 2010 基础上开发的针刺临床试验干预措施报告标准(standards for reporting interventions in clinical trials of acupuncture,STRICTA)[7],可协助作者对针刺 RCT 进行完整报告,并协助审稿专家和读者更好理解和评价针刺 RCT 报告内容。本文将结合以上两种评价工具对针刺治疗干眼症 RCT 的完整性和透明度进行报告质量评价,以期为后续相关 RCT 报告提供参考。
1 资料与方法
1.1 纳入与排除标准
1.1.1 研究类型
RCT。
1.1.2 研究对象
诊断明确的干眼症患者。
1.1.3 干预措施
试验组:以各种针刺方法及特种针法为主,包括针刺结合其他非药物疗法;对照组:非针刺治疗手段,包括药物治疗、手术等。
1.1.4 结局指标
报告干眼症症状改善等主、次要结局指标。
1.1.5 排除标准
① 治疗组干预手段除针刺外,还包含药物治疗;② 以另一种针刺方法为对照的试验;③ 重复发表的文献,如用双语种发表,仅纳入中文版本;④ 无法获取全文的文献。
1.2 文献检索策略
计算机检索 CNKI、VIP、CBM、WanFang Data、PubMed、EMbase 和 The Cochrane Library 数据库,搜集国内外针刺治疗干眼症的 RCT,检索时限均为建库至 2020 年 2 月。同时检索谷歌学术、百度学术等网站,以补充获取相关文献。中文检索词包括:干眼症、干眼、针刺、针灸、针、干燥综合征、随机对照试验等;英文检索词包括:dry eye syndromes,xerophthalmia,acupuncture,randomized controlled trails,RCT 等。以 PubMed 为例,具体检索策略见框 1。

1.3 文献筛选和资料提取
由 2 名研究者独立筛选文献、提取资料并交叉核对。如有分歧,则通过讨论或与第三方协商解决。文献筛选时首先将检索文献题目导入 Note Express V3.X 查重后,阅读文题,在排除明显不相关的文献后,进一步阅读摘要和全文以确定是否纳入。如有需要,通过邮件、电话联系原始研究作者获取未确定但对本研究非常重要的信息。资料提取内容包括:作者、发表年份、干预手段及 CONSORT 2010 声明、STRICTA 标准条目相关信息。
1.4 纳入研究的报告质量评价
CONSORT 2010 声明评价条目分为文题摘要、引言、方法、结论、讨论以及其他信息6 大部分,包括 24 项内容、37 个条目;STRICTA 评价条目是在 CONSORT 声明的基础上专门为针刺这一干预手段制定的评价工具,包含 6 大部分:针刺原理、针刺细节、治疗方案、辅助干预措施、治疗师背景以及对照或对照干预。两种评价工具均以“报告”或“未报告”作为最终评价结果。部分条目具有“适用性”条件,条目适用评价时纳入质量总体分析,不适用则可不于结论处做讨论。如有报告条目为“是”,未报告条目为“否”。为保证评价一致性,由 2 名评价人员在正式评价之前进行两轮预试验,预评价周期 12 天。预评价结果显示第一轮 CONSORT 评价 Kappa 值(K=0.46)及 STRICTA 评价Kappa 值(K=0.50)均较低,表明 2 名评价员对条目认知差异较大,将分歧交由第三方专家判断;经培训后,第二轮 CONSORT 评价 Kappa 值(K=0.80)及 STRICTA 评价 Kappa 值(K=0.85)为优良,表明不同研究者判断的一致性良好,可以进行正式评价。对仍存在争议的细节提交第三方裁决。
1.5 统计分析
运用 SPSS 25.0 软件计算两种评价工具预试验一致性的 Kappa 值。运用 Excel 2019 计算纳入 RCT 在 CONSORT 及 STRICTA 工具各领域得分及其报告率,包括中、英文献各条目的百分比呈现、2010 年前后中、英文献各条目报告率及对比、占样本比例、条目总报告率。
2 结果
2.1 文献筛选流程及结果
初检共获得相关文献 1 105 篇,经逐层筛选,最终纳入 77 个 RCT[8-84],包括中文文献 69 篇[8-76],英文文献 8 篇[77-84]。文献筛选流程及结果见图 1。

*所检索的数据库及检出文献数具体如下:CNKI(
2.2 纳入研究的基本情况
纳入的 77 个 RCT[8-84]中,发表时间从 2004 年~2019 年,发表国家涵盖中国、韩国和瑞典。文献发表数量总体随时间而呈上升趋势,说明近年来探讨针刺治疗干眼症的相关研究的热度逐渐上升,见图 2。发表时间分析显示 16 年间年发文量为 4.8 篇;69 篇中文文献[8-76]中有 12 篇[8-19]发表于 2010 年以前,57 篇[20-76]发表于 2010 年(含)以后;8 篇[77-84]英文文献中有 3 篇[82-84]发表于 2010 年以前,5 篇[77-83]发表于 2010 年(含)以后;2018 年是发表文献较多的一年,共 13 篇,除 2005、2008 及 2011 年发文量较低(分别为 1、0、2)之外,其余年份年发文量在平均发表量上下浮动(表 1)。


2.3 CONSORT 评价结果
2010 年后发表的 57 篇中文文献[20-76]所有条目平均报告率为 43.1%。条目 1a、6b、7a、7b、8a、8b、9、10、11a、11b、12b、13b、14b、15、17b、18、19、20,23、24、25 占中文文献自身报告比例不足 50%。其中条目 6b、11b、17b、24 报告率为 0,分别属于“方法学-结局指标”、“方法学-盲法”、“结果-结局和估计值”及“其他信息-试验方案”这 4 部分;条目 10、12b、14b、18 仅 1 篇文献报告,分别属于“方法-实施”、“结果-招募受试者”及“结果-辅助分析”;条目 9“分配隐藏机制”仅有 2 篇文献报告[47, 66],报告率仅为 3.5%;条目 1a、7a、7b、11a、12b、23 报告比例 5.3%,其余条目报告率介于 5.3%~38.6% 之间(表 2)。在报告率大于 50% 的条目中,条目 5“详细描述各组干预措施的细节使他人能够重复,包括它们实际上是在何时、何地实施的”、6a“完整而确切地说明预先设定的主要和次要结局指标,包括他们实际上是在何时、何地测评的”、16“纳入分析的例数”、17a“各组每一项的主要和次要结局指标的结果,效应估计值及其精确性”报告率达 100% 为最高,其余条目报告率介于 64.9%~98.2% 之间(表 2)。

2010 年以后的 5 篇英文文献[77-83]所有条目平均报告率为 66.5%。条目 3b、6b、7a、7b、14b、17b、19、24 报告率不足 50%。其中条目 3b“试验开始后对试验方法所做的重要改变,并说明原因”、6b“试验开始后对结局指标是否存在任何更改,并说明原因”、7b“必要时,解释中期分析或试验中止原则”、14b“为什么试验中断或停止”、17b“对应二分类结局,建议同时提供相对效应值和绝对效应值”报告率为 0;其余条目的报告率介于 20%~40% 之间(表 2)。在报告率大于 50% 的条目中,1b、2a、2b、3a、4a、4b、6a、12a、14a、16、17a、22 报告率达 100%,其余条目报告率介于 60%~80% 之间。
英文文献的平均报告率(66.5%)大于中文文献(43.1%),其中差距较大的有条目 1a、3b、7a、8a、8b、9、10、11a、11b、12b、13b、15、18、23 及 25,上述条目英文文献报告率与中文文献报告率差值均大于 25%(表 2)。
2.4 STRICTA 评价结果
2010 年以后的 57 篇中文文献[20-76]所有条目平均报告率为 63.5%。条目 1c、2a、4a、4b、5 报告率不足 50%,具体报告率分别为 22.8%、35.1%、35.1%、1.8%、1.8%;条目 4b“治疗场所和相关信息”及条目 5“对参与研究的针灸师的描述”仅 1 篇文献[57]报告;仅条目 1a 报告率 100%。
2010 年以后的 5 篇英文文献[77-83]所有条目平均报告率为 69.4%。条目 1c“说明治疗改变”、2a“每一受试对象每个治疗单元用针的数目”、2g“针具类型”、4a“附加干预细节”、4b“治疗场所及相关信息”、5“针灸师描述”报告率分别为 20%、40%、20%、20% 不足 50%;条目 1a、2b、2f、3a、3b、6a、6b 报告率达 100%,其余条目报告率介于 60%~80% 之间。中英文献差异较大的条目主要是 2g“针具类型”、4b“治疗场所和相关信息,包括对治疗师的操作指南及给患者的信息和解释”及条目 5“对参与研究的针灸师的描述”(表 3)。

3 讨论
随着中医药被越来越多的人所接受,众多传统治疗方式、用药的科学性和有效性得以通过现代研究予以验证。其中,RCT 作为医学研究疗效评测的传统金标准[85],其设计的科学性及试验过程的严谨性和透明性是引导试验结果最终向临床决策转化的关键。本研究根据 CONSORT 声明和 STRICTA 标准主要针对 2010 年后发表的针刺治疗干眼症的国内外 RCT 进行报告质量评价,对比并探讨纳入 RCT 存在的报告问题,以便为后期针刺干预干眼症 RCT 研究的开展提供一定参考。综合最终评价结果,现主要存在以下问题。
3.1 按照 CONSORT 标准
中文文献 CONSORT 条目的报告率低于英文文献(分别为 41.4% 和 56.4%),拉低中文文献报告率的条目主要集中在方法学、结果及其他信息三方面。其中在方法学部分的报告上缺失信息较多,对 RCT 的方法描述完整度较为欠缺。具体条目包括:3b“试验开始后对试验方法所作的重要改变及原因”、6b“试验开始后对结局指标是否有任何更改及原因”、7a“如何确定样本量”、7b“必要时,解释中期分析和试验中止原则”、9“分配隐藏机制”、10“随机方法的实施”、11a“如果实施了盲法,分配干预措施之后对谁设盲以及如何实施”、11b“如有必要,描述干预措施的相似之处”、12b“附加分析的方法,诸如亚组分析和校正分析”。在以上方法学条目中,3b、6b 报告率较低主要是由于纳入中文 RCT 普遍没有发表 RCT 方案,无法比较方案和 RCT 实施中的差异。条目 7b、11b 为“必要时”报告条目,2010 年后 62 篇文献仅 3 篇中文、3 篇英文文献 RCT 符合其报告“必要”条件,其余文献包括 2010 年之前发表的 15 篇文献均不满足必要报告条件。结合 3b、6b、7b 条目,说明在时间节点 2010 年前后,针刺治疗干眼症 RCT 仍未建立临床试验完整和透明化理念,对 RCT 方案和 RCT 分析方法仍缺乏全面认识。
本研究纳入的文献对方法学部分的试验方法与结局指标方面大多仅简单描述其核心内容,对于试验初始阶段的设计、试验开始后对试验方法与结局指标的更改等情况鲜见报告,使得读者不能确定该研究中是否存在试验方案与结局指标的更改以及对存在的更改是否如实报告等问题。在实际情况中,试验开始后可能因课题经费、受试者招募等问题的出现进而需要调整检查项目、干预措施、受试者合格标准,亦可能出现主次要结局指标的更改等情况。在今后的科研工作中,研究者应该如实报告此类问题,同时,严格遵守并报告临床试验注册规范及执行情况亦能帮助研究者提高试验设计的规范化程度及报告透明度。此外,与之关系较为密切的是 STRICTA 评分中条目 1c“说明何种治疗发生了改变”,也呈低报告率,仅有 20% 的英文文献和 22.8% 的中文文献进行了报告。两部分得分均较低说明了纳入文献都缺乏对试验过程中重要数据、干预措施等数据改变的解释性说明。虽然其原因可能是由于针刺干预手段的特殊性引起的,即针刺试验过程较少有结局指标、干预措施的变化或较强副作用的出现。但上述条目仍在 RCT 的报告中有着重要作用,完整地对其报告能使读者更加明确试验的完整性、连贯性以及试验数据的可靠性。
62 篇文献整体上对于方法学中 7a、9、10、11a 四个条目报告率较低,英文文献中该四个条目报告率均在 40% 以上。而中文文献则低于 6%,表明中文文献普遍缺乏“样本量”、“分配隐藏机制”、“盲法”及对其两者具体实施细节的描述。中文文献在条目 7a(5.3%)、条目 9(3.5%)、条目 10(1.8%)及条目 11a(5.3%)上报告缺失颇多,导致其试验质量受到质疑,故研究者在今后的研究中应该多加注意完善这些方面的汇报。
在其他信息方面,包含 2010 年以前发表的 69 篇中文文献普遍缺乏试验注册信息及试验方案获取的相关信息,大部分中文文献描述了试验资金来源后没有提供可追查源头的途径,部分文章仅在原文中说明注册机构,但未提供临床试验注册号;英文文献中仅 1 篇韩国的研究提供了完整的试验相关信息,其余 7 篇文章(5 篇来自中国)亦缺乏相关数据。推测该现象主要与试验机构及文献质量有关,大部分文献的试验机构为地级市医院,少有省级、国家级试验中心参与,其文章质量不高,因此对 RCT 流程把控要求较低,导致上述条目内容报告的缺失。目前国外优秀医学杂志对于涉及人体的临床试验均要求提供临床试验注册相关信息,国内近年来对临床试验的要求也逐渐完善,但在期刊发表时对于临床试验注册方面仍缺乏强制性规范,国内的研究人员对于临床试验注册的知晓度仍然较低[86]。
采用 CONSORT 2010 分别对 2010 年前后国内外发表的针刺治疗干眼症相关临床研究进行评估,我们发现:2010 年以后英文文献各条目平均报告率比 2010 年之前的文献高出 26.8%,而中文文献仅高出 5.9%。由此不难推断,在 2010 年 CONSORT 标准更新后,英文文献的报告规范化程度大幅提高,而中文文献的规范化报告程度仍不明显。这提示国内的研究者和科技期刊应该重视 CONSORT 标准等临床试验报告规范,并在科研设计、实施以及报告过程中合理运用。
3.2 按照 STRICTA 标准
中英文献 STRICTA 报告率总体较为接近,中文平均报告率 61.9%,英文平均报告率 66.9%,两者差别较 CONSORT 较小。结合 2010 年前发表文献,在 STRICTA 标准更新后,中英文文献各 STRICTA 标准条目平均报告率均有所提高,但两者差距不明显。表明中英文文献报告中对于针刺干预手段的描述差距不大,相关原因可能是针灸的相关研究多由中文语境人群为主进行开展,相关操作规范也较为统一,因此在这方面中英文文献报告均较规范。但 57 篇中文文献普遍缺乏条目 4b“治疗场所和相关信息,包括对治疗师的操作指南、以及给患者的信息和解释”及“对参与研究的针灸师的描述(资质或从业部门、从事针刺实践时间、其它相关经历)”;8 篇英文文献中也仅有 2 篇进行了完整报告,均来自韩国。大部分文章在“试验背景”部分仅报告了试验实施的机构,但缺乏对具体环境、病人获得的关于治疗和对照干预措施相关信息的报告,因此得分较低。这可能是由于国内研究对针灸治疗较为熟悉,往往忽略了其他相关细节的描述;国内的研究者对针灸治疗的实施者缺乏具体报道,仅有部分文献简单描述操作者为同一医师,仅有 1 篇中文文献描述了针灸医师的资质。而针灸作为一种依赖于人工操作的治疗方式,在报道相关临床治疗时,应该对针灸师的专业、资质等情况进行更具体的描述,同时在设计临床试验的时候,研究者也应该充分考虑不同资质的针灸师对于试验结果可能的影响。英文文献普遍缺乏条目 2g“针具类型(直径、长度和生产厂家或材质)”的描写。值得注意的是,由于传统针刺的效果主要通过穴位、手法等实现,而所选针具的直径、长度等也会在一定程度上影响疗效,因此有必要在报告针刺干预手段时清晰报告针具的型号、材质等相关信息,保证后续试验的可重复性。
综上所述,国内外针刺治疗干眼症 RCT 的报告质量普遍较低,亟需参照 CONSORT 声明 2010 版和 STRICTA 2010 等标准进一步提高相关研究报告质量。
干眼症是指各种原因引起与眼部不适相关的泪膜和眼表面异常的一种疾病,其病因可能是全身性疾病,例如干燥综合征,也可是局部眼部病变导致的泪膜异常改变或泪液动力学异常改变[1]。干眼症患者主诉为眼部异物感、畏光流泪、视力减退等,严重影响患者的生活工作及学习。全球干眼症的发病率约为 5.5%~33.7%[2],其中欧美国家约为 11.0%~28.7%,亚洲其他国家约为 17%~34%[3],中国发病率约为 21%~30%[4]。当前干眼症最常用的一线治疗方式是使用人工泪液或通过配戴贴近脸部且包覆眼周的眼镜以减少泪液蒸发,继发性干眼病则可通过停用药品和干预影响因素缓解病情。其药物治疗主要使用含有环孢素或类固醇成分的眼药水[5],必要时联合抗炎药物,但效果不尽如人意。
针刺是目前治疗干眼症的方法之一。随着中医药发展,大量关于针刺治疗干眼症的随机对照试验(randomized controlled trail,RCT)已经发表,然而相关 RCT 报告水平参差不齐,为后续相关研究造成一定不便。1996 年发表的 CONSORT 声明[6],以促进研究人员对 RCT 报告质量做出评价和解释为目的,为作者、同行评论员和编辑提供了改进 RCT 报告的指导,帮助他们明确具有潜在偏倚结果的报告,更新的最新版本为 CONSORT 声明 2010。在 CONSORT 声明 2010 基础上开发的针刺临床试验干预措施报告标准(standards for reporting interventions in clinical trials of acupuncture,STRICTA)[7],可协助作者对针刺 RCT 进行完整报告,并协助审稿专家和读者更好理解和评价针刺 RCT 报告内容。本文将结合以上两种评价工具对针刺治疗干眼症 RCT 的完整性和透明度进行报告质量评价,以期为后续相关 RCT 报告提供参考。
1 资料与方法
1.1 纳入与排除标准
1.1.1 研究类型
RCT。
1.1.2 研究对象
诊断明确的干眼症患者。
1.1.3 干预措施
试验组:以各种针刺方法及特种针法为主,包括针刺结合其他非药物疗法;对照组:非针刺治疗手段,包括药物治疗、手术等。
1.1.4 结局指标
报告干眼症症状改善等主、次要结局指标。
1.1.5 排除标准
① 治疗组干预手段除针刺外,还包含药物治疗;② 以另一种针刺方法为对照的试验;③ 重复发表的文献,如用双语种发表,仅纳入中文版本;④ 无法获取全文的文献。
1.2 文献检索策略
计算机检索 CNKI、VIP、CBM、WanFang Data、PubMed、EMbase 和 The Cochrane Library 数据库,搜集国内外针刺治疗干眼症的 RCT,检索时限均为建库至 2020 年 2 月。同时检索谷歌学术、百度学术等网站,以补充获取相关文献。中文检索词包括:干眼症、干眼、针刺、针灸、针、干燥综合征、随机对照试验等;英文检索词包括:dry eye syndromes,xerophthalmia,acupuncture,randomized controlled trails,RCT 等。以 PubMed 为例,具体检索策略见框 1。

1.3 文献筛选和资料提取
由 2 名研究者独立筛选文献、提取资料并交叉核对。如有分歧,则通过讨论或与第三方协商解决。文献筛选时首先将检索文献题目导入 Note Express V3.X 查重后,阅读文题,在排除明显不相关的文献后,进一步阅读摘要和全文以确定是否纳入。如有需要,通过邮件、电话联系原始研究作者获取未确定但对本研究非常重要的信息。资料提取内容包括:作者、发表年份、干预手段及 CONSORT 2010 声明、STRICTA 标准条目相关信息。
1.4 纳入研究的报告质量评价
CONSORT 2010 声明评价条目分为文题摘要、引言、方法、结论、讨论以及其他信息6 大部分,包括 24 项内容、37 个条目;STRICTA 评价条目是在 CONSORT 声明的基础上专门为针刺这一干预手段制定的评价工具,包含 6 大部分:针刺原理、针刺细节、治疗方案、辅助干预措施、治疗师背景以及对照或对照干预。两种评价工具均以“报告”或“未报告”作为最终评价结果。部分条目具有“适用性”条件,条目适用评价时纳入质量总体分析,不适用则可不于结论处做讨论。如有报告条目为“是”,未报告条目为“否”。为保证评价一致性,由 2 名评价人员在正式评价之前进行两轮预试验,预评价周期 12 天。预评价结果显示第一轮 CONSORT 评价 Kappa 值(K=0.46)及 STRICTA 评价Kappa 值(K=0.50)均较低,表明 2 名评价员对条目认知差异较大,将分歧交由第三方专家判断;经培训后,第二轮 CONSORT 评价 Kappa 值(K=0.80)及 STRICTA 评价 Kappa 值(K=0.85)为优良,表明不同研究者判断的一致性良好,可以进行正式评价。对仍存在争议的细节提交第三方裁决。
1.5 统计分析
运用 SPSS 25.0 软件计算两种评价工具预试验一致性的 Kappa 值。运用 Excel 2019 计算纳入 RCT 在 CONSORT 及 STRICTA 工具各领域得分及其报告率,包括中、英文献各条目的百分比呈现、2010 年前后中、英文献各条目报告率及对比、占样本比例、条目总报告率。
2 结果
2.1 文献筛选流程及结果
初检共获得相关文献 1 105 篇,经逐层筛选,最终纳入 77 个 RCT[8-84],包括中文文献 69 篇[8-76],英文文献 8 篇[77-84]。文献筛选流程及结果见图 1。

*所检索的数据库及检出文献数具体如下:CNKI(
2.2 纳入研究的基本情况
纳入的 77 个 RCT[8-84]中,发表时间从 2004 年~2019 年,发表国家涵盖中国、韩国和瑞典。文献发表数量总体随时间而呈上升趋势,说明近年来探讨针刺治疗干眼症的相关研究的热度逐渐上升,见图 2。发表时间分析显示 16 年间年发文量为 4.8 篇;69 篇中文文献[8-76]中有 12 篇[8-19]发表于 2010 年以前,57 篇[20-76]发表于 2010 年(含)以后;8 篇[77-84]英文文献中有 3 篇[82-84]发表于 2010 年以前,5 篇[77-83]发表于 2010 年(含)以后;2018 年是发表文献较多的一年,共 13 篇,除 2005、2008 及 2011 年发文量较低(分别为 1、0、2)之外,其余年份年发文量在平均发表量上下浮动(表 1)。


2.3 CONSORT 评价结果
2010 年后发表的 57 篇中文文献[20-76]所有条目平均报告率为 43.1%。条目 1a、6b、7a、7b、8a、8b、9、10、11a、11b、12b、13b、14b、15、17b、18、19、20,23、24、25 占中文文献自身报告比例不足 50%。其中条目 6b、11b、17b、24 报告率为 0,分别属于“方法学-结局指标”、“方法学-盲法”、“结果-结局和估计值”及“其他信息-试验方案”这 4 部分;条目 10、12b、14b、18 仅 1 篇文献报告,分别属于“方法-实施”、“结果-招募受试者”及“结果-辅助分析”;条目 9“分配隐藏机制”仅有 2 篇文献报告[47, 66],报告率仅为 3.5%;条目 1a、7a、7b、11a、12b、23 报告比例 5.3%,其余条目报告率介于 5.3%~38.6% 之间(表 2)。在报告率大于 50% 的条目中,条目 5“详细描述各组干预措施的细节使他人能够重复,包括它们实际上是在何时、何地实施的”、6a“完整而确切地说明预先设定的主要和次要结局指标,包括他们实际上是在何时、何地测评的”、16“纳入分析的例数”、17a“各组每一项的主要和次要结局指标的结果,效应估计值及其精确性”报告率达 100% 为最高,其余条目报告率介于 64.9%~98.2% 之间(表 2)。

2010 年以后的 5 篇英文文献[77-83]所有条目平均报告率为 66.5%。条目 3b、6b、7a、7b、14b、17b、19、24 报告率不足 50%。其中条目 3b“试验开始后对试验方法所做的重要改变,并说明原因”、6b“试验开始后对结局指标是否存在任何更改,并说明原因”、7b“必要时,解释中期分析或试验中止原则”、14b“为什么试验中断或停止”、17b“对应二分类结局,建议同时提供相对效应值和绝对效应值”报告率为 0;其余条目的报告率介于 20%~40% 之间(表 2)。在报告率大于 50% 的条目中,1b、2a、2b、3a、4a、4b、6a、12a、14a、16、17a、22 报告率达 100%,其余条目报告率介于 60%~80% 之间。
英文文献的平均报告率(66.5%)大于中文文献(43.1%),其中差距较大的有条目 1a、3b、7a、8a、8b、9、10、11a、11b、12b、13b、15、18、23 及 25,上述条目英文文献报告率与中文文献报告率差值均大于 25%(表 2)。
2.4 STRICTA 评价结果
2010 年以后的 57 篇中文文献[20-76]所有条目平均报告率为 63.5%。条目 1c、2a、4a、4b、5 报告率不足 50%,具体报告率分别为 22.8%、35.1%、35.1%、1.8%、1.8%;条目 4b“治疗场所和相关信息”及条目 5“对参与研究的针灸师的描述”仅 1 篇文献[57]报告;仅条目 1a 报告率 100%。
2010 年以后的 5 篇英文文献[77-83]所有条目平均报告率为 69.4%。条目 1c“说明治疗改变”、2a“每一受试对象每个治疗单元用针的数目”、2g“针具类型”、4a“附加干预细节”、4b“治疗场所及相关信息”、5“针灸师描述”报告率分别为 20%、40%、20%、20% 不足 50%;条目 1a、2b、2f、3a、3b、6a、6b 报告率达 100%,其余条目报告率介于 60%~80% 之间。中英文献差异较大的条目主要是 2g“针具类型”、4b“治疗场所和相关信息,包括对治疗师的操作指南及给患者的信息和解释”及条目 5“对参与研究的针灸师的描述”(表 3)。

3 讨论
随着中医药被越来越多的人所接受,众多传统治疗方式、用药的科学性和有效性得以通过现代研究予以验证。其中,RCT 作为医学研究疗效评测的传统金标准[85],其设计的科学性及试验过程的严谨性和透明性是引导试验结果最终向临床决策转化的关键。本研究根据 CONSORT 声明和 STRICTA 标准主要针对 2010 年后发表的针刺治疗干眼症的国内外 RCT 进行报告质量评价,对比并探讨纳入 RCT 存在的报告问题,以便为后期针刺干预干眼症 RCT 研究的开展提供一定参考。综合最终评价结果,现主要存在以下问题。
3.1 按照 CONSORT 标准
中文文献 CONSORT 条目的报告率低于英文文献(分别为 41.4% 和 56.4%),拉低中文文献报告率的条目主要集中在方法学、结果及其他信息三方面。其中在方法学部分的报告上缺失信息较多,对 RCT 的方法描述完整度较为欠缺。具体条目包括:3b“试验开始后对试验方法所作的重要改变及原因”、6b“试验开始后对结局指标是否有任何更改及原因”、7a“如何确定样本量”、7b“必要时,解释中期分析和试验中止原则”、9“分配隐藏机制”、10“随机方法的实施”、11a“如果实施了盲法,分配干预措施之后对谁设盲以及如何实施”、11b“如有必要,描述干预措施的相似之处”、12b“附加分析的方法,诸如亚组分析和校正分析”。在以上方法学条目中,3b、6b 报告率较低主要是由于纳入中文 RCT 普遍没有发表 RCT 方案,无法比较方案和 RCT 实施中的差异。条目 7b、11b 为“必要时”报告条目,2010 年后 62 篇文献仅 3 篇中文、3 篇英文文献 RCT 符合其报告“必要”条件,其余文献包括 2010 年之前发表的 15 篇文献均不满足必要报告条件。结合 3b、6b、7b 条目,说明在时间节点 2010 年前后,针刺治疗干眼症 RCT 仍未建立临床试验完整和透明化理念,对 RCT 方案和 RCT 分析方法仍缺乏全面认识。
本研究纳入的文献对方法学部分的试验方法与结局指标方面大多仅简单描述其核心内容,对于试验初始阶段的设计、试验开始后对试验方法与结局指标的更改等情况鲜见报告,使得读者不能确定该研究中是否存在试验方案与结局指标的更改以及对存在的更改是否如实报告等问题。在实际情况中,试验开始后可能因课题经费、受试者招募等问题的出现进而需要调整检查项目、干预措施、受试者合格标准,亦可能出现主次要结局指标的更改等情况。在今后的科研工作中,研究者应该如实报告此类问题,同时,严格遵守并报告临床试验注册规范及执行情况亦能帮助研究者提高试验设计的规范化程度及报告透明度。此外,与之关系较为密切的是 STRICTA 评分中条目 1c“说明何种治疗发生了改变”,也呈低报告率,仅有 20% 的英文文献和 22.8% 的中文文献进行了报告。两部分得分均较低说明了纳入文献都缺乏对试验过程中重要数据、干预措施等数据改变的解释性说明。虽然其原因可能是由于针刺干预手段的特殊性引起的,即针刺试验过程较少有结局指标、干预措施的变化或较强副作用的出现。但上述条目仍在 RCT 的报告中有着重要作用,完整地对其报告能使读者更加明确试验的完整性、连贯性以及试验数据的可靠性。
62 篇文献整体上对于方法学中 7a、9、10、11a 四个条目报告率较低,英文文献中该四个条目报告率均在 40% 以上。而中文文献则低于 6%,表明中文文献普遍缺乏“样本量”、“分配隐藏机制”、“盲法”及对其两者具体实施细节的描述。中文文献在条目 7a(5.3%)、条目 9(3.5%)、条目 10(1.8%)及条目 11a(5.3%)上报告缺失颇多,导致其试验质量受到质疑,故研究者在今后的研究中应该多加注意完善这些方面的汇报。
在其他信息方面,包含 2010 年以前发表的 69 篇中文文献普遍缺乏试验注册信息及试验方案获取的相关信息,大部分中文文献描述了试验资金来源后没有提供可追查源头的途径,部分文章仅在原文中说明注册机构,但未提供临床试验注册号;英文文献中仅 1 篇韩国的研究提供了完整的试验相关信息,其余 7 篇文章(5 篇来自中国)亦缺乏相关数据。推测该现象主要与试验机构及文献质量有关,大部分文献的试验机构为地级市医院,少有省级、国家级试验中心参与,其文章质量不高,因此对 RCT 流程把控要求较低,导致上述条目内容报告的缺失。目前国外优秀医学杂志对于涉及人体的临床试验均要求提供临床试验注册相关信息,国内近年来对临床试验的要求也逐渐完善,但在期刊发表时对于临床试验注册方面仍缺乏强制性规范,国内的研究人员对于临床试验注册的知晓度仍然较低[86]。
采用 CONSORT 2010 分别对 2010 年前后国内外发表的针刺治疗干眼症相关临床研究进行评估,我们发现:2010 年以后英文文献各条目平均报告率比 2010 年之前的文献高出 26.8%,而中文文献仅高出 5.9%。由此不难推断,在 2010 年 CONSORT 标准更新后,英文文献的报告规范化程度大幅提高,而中文文献的规范化报告程度仍不明显。这提示国内的研究者和科技期刊应该重视 CONSORT 标准等临床试验报告规范,并在科研设计、实施以及报告过程中合理运用。
3.2 按照 STRICTA 标准
中英文献 STRICTA 报告率总体较为接近,中文平均报告率 61.9%,英文平均报告率 66.9%,两者差别较 CONSORT 较小。结合 2010 年前发表文献,在 STRICTA 标准更新后,中英文文献各 STRICTA 标准条目平均报告率均有所提高,但两者差距不明显。表明中英文文献报告中对于针刺干预手段的描述差距不大,相关原因可能是针灸的相关研究多由中文语境人群为主进行开展,相关操作规范也较为统一,因此在这方面中英文文献报告均较规范。但 57 篇中文文献普遍缺乏条目 4b“治疗场所和相关信息,包括对治疗师的操作指南、以及给患者的信息和解释”及“对参与研究的针灸师的描述(资质或从业部门、从事针刺实践时间、其它相关经历)”;8 篇英文文献中也仅有 2 篇进行了完整报告,均来自韩国。大部分文章在“试验背景”部分仅报告了试验实施的机构,但缺乏对具体环境、病人获得的关于治疗和对照干预措施相关信息的报告,因此得分较低。这可能是由于国内研究对针灸治疗较为熟悉,往往忽略了其他相关细节的描述;国内的研究者对针灸治疗的实施者缺乏具体报道,仅有部分文献简单描述操作者为同一医师,仅有 1 篇中文文献描述了针灸医师的资质。而针灸作为一种依赖于人工操作的治疗方式,在报道相关临床治疗时,应该对针灸师的专业、资质等情况进行更具体的描述,同时在设计临床试验的时候,研究者也应该充分考虑不同资质的针灸师对于试验结果可能的影响。英文文献普遍缺乏条目 2g“针具类型(直径、长度和生产厂家或材质)”的描写。值得注意的是,由于传统针刺的效果主要通过穴位、手法等实现,而所选针具的直径、长度等也会在一定程度上影响疗效,因此有必要在报告针刺干预手段时清晰报告针具的型号、材质等相关信息,保证后续试验的可重复性。
综上所述,国内外针刺治疗干眼症 RCT 的报告质量普遍较低,亟需参照 CONSORT 声明 2010 版和 STRICTA 2010 等标准进一步提高相关研究报告质量。