临床实践指南是指导临床医生进行临床诊疗的声明性文件,其制订质量在一定程度上影响了临床决策,而临床问题构建是指南制订中的首要关键环节[1,2]。临床问题构建的方法目前仍是一个不成熟的领域[3],指南制订者和指南方法学研究者将更多的精力倾注于采用各种方法进行问题优先性选择[4-8],却时常忽略一个重要的点,即在优先性选择之前,应当确保尽可能全面地收集临床问题和观点。如何构建考虑得更全面的临床问题清单,需要兼顾临床医生不同的临床经验、实践背景、价值观等[9-13],例如,在膝骨关节炎指南制订中,需要考虑疾病相关的临床医生如针灸医生、推拿医生、骨科医生等的价值观、临床资历和学术背景等,并且还需要考虑医生对众多干预措施的使用情况和偏好[14],而如何去评估及应用各种“不同”所带来的差异,是一个值得探究的科学问题。
根据前期的文献探究[15],变异性在指南临床问题构建中的应用较多[16,17],但是较为局限,多用于确定共识组专家意见的一致性程度,通常追求变异度低,然而,对于其特性的全面理解及变异性内在机制和原因的探讨不足。变异性是一个由多种原因导致的综合概念,常用变异性系数(coefficient variation,CV)表示。变异性大小反应的是共性和个性问题,变异性大,说明被调查者之间的分歧较大,个性特征突出;而变异性小说明被调查者之间分歧较小,共性特征更为明显。
本研究针对临床问题构建中的变异性,在膝骨关节炎指南制订实例中进行了探索,使用CV对其进行量化,并探究不同调研结果中变异性的内在机制,为指南制订者提供参考[15]。
1 方法
1.1 膝骨关节炎指南的临床问题构建
经过前期的文献检索、专家定性访谈、焦点小组讨论等,同时,结合病例引导式临床问题构建的方式,请临床医生回忆实践中的真实病例,并基于其中的决策难点提出临床问题。最后由主席及多位临床专家讨论形成了初步的临床问题清单。共包含14个临床问题,均采用PICO(population, intervention, comparator, outcome)格式构建[18],保证其结构合理及表述规范[19]。本研究中的临床调研将在此14个临床问题基础上进行(表1)。

1.2 临床问卷的设计和发放
根据前期的文献梳理和3位主席及临床专家的讨论,将14个临床问题分为4个小主题:① 无手术指征;② 有修复性手术指征;③ 有重建性手术指征但保守治疗;④ 重建性手术术后康复期。并且界定每个小主题下的临床问题采用一套结局。
采用9分制对临床问题和结局重要性进行评分,分值越高代表重要性程度越大。针对临床问题,7~9分代表临床问题为高优先级;4~6分为中优先级;1~3分为低优先级。针对结局,7~9分代表非常重要;4~6分代表重要但不优先;1~3分代表不重要。对临床问题进行评分时,设置了6个标准辅助临床医生进行判断[5,6],同时,请临床医生根据经验判断问题的答案(图1)。

通过问卷星发放问卷,拟在全国30个省、市、自治区范围内调研200~500名不同经验和资格的临床医生,并确保每个省份均有针灸科、推拿科、骨科医生参与。在多学科共识组(共25位,包括20位临床专家、1位护理学专家、3位方法学专家、1位卫生经济学专家)中发放相同问卷。收集两者结果后举行面对面共识会议,在共识会议中,呈现临床调研和共识组关于临床问题和结局重要性评分、CV的结果,并提醒专家注意辅助判断临床问题的6个标准。在共识会议结束后,再次发放问卷并收集结果(图2)。

1.3 数据整理及分析
计算临床问题和结局重要性评分的均值和CV,并分析判断临床问题重要性的6个标准的变异性,同时,分析了临床医生根据经验所判断的问题答案。通过IBM SPSS Statistics和Microsoft Excel完成了汇总分析。
2 结果
2.1 问卷结果的基本信息
共收集医生问卷356份,中医医师占71.6%(255名);针灸科、推拿科、骨科医生问卷比例约为1∶1∶1(105∶123∶122);98.9%(352名)的医生对膝骨关节炎熟悉;总体来讲,90%(320名)的临床医生对各项中医干预措施是熟悉的,并且针灸医生和推拿医生对中医干预措施的熟悉程度高于骨科医师;95%(338名)的临床医生对于西医非手术治疗熟悉,对手术治疗熟悉的医师少于70%且以骨科医师为主。共识组第一轮收集问卷22份,第二轮收集问卷21份。
2.2 重要性评分的变异性分析
临床调研中,不论所有临床问题总体重要性评分大小,CV均大于25%。共识组第一轮调研中,CV与临床调研结果差别较小。有3个临床问题(Q8、Q12、Q14)CV小于25%,其中,后两者为高优先级临床问题(总体重要性评分≥7分)。经过面对面共识会议讨论后,共识组第二轮调研结果发生较大变化,一方面,相比于共识组第一轮结果,除临床问题Q5,所有临床问题CV都变小,高优先级临床问题CV小于25%,而CV大于25%的临床问题为低优先级(表2)。

根据不同标准判断某一个临床问题的重要性评分的CV,从总体上看,不论重要性评分的高低,临床调研中,CV多在40%以上,而在共识组两轮调查中CV基本均在40%以下(表3)。

2.3 结局重要性评分的变异性分析
不同小主题下结局重要性评分的变异情况基本一致,以无手术指征患者为例,临床调研中结局的重要性评分和变异性与共识组第一轮调研差别较小,非常重要结局CV小于30%,而重要但不优先结局变异系数多在30%以上。然而,在共识组第二轮调研中,非常重要结局变异性均小于20%,重要但不优先结局CV集中于30%左右。需要强调的是,结局的重要性等级程度越高,其CV呈现出越小的趋势(表4)。

2.4 基于临床经验的临床问题答案
总体上,临床调研和共识组两轮调查的结果基本一致。无论患者是否具备手术指征,在涉及不同干预措施之间的对比时,相比于单独的中医治疗或西医治疗,至少80%的临床医生或共识组专家倾向于选择联合治疗作为问题答案。在中医治疗与西医治疗(或不治疗)相比时(Q1、Q2、Q12),50%左右临床医生或专家选择中医治疗,20%选择中医联合西医治疗。
针对有修复性手术指征的患者,修复性手术治疗中医治疗或中医联合西医治疗的对比中(Q6、Q7),临床调研中仅有10%左右的医生选择手术治疗作为答案,其中,选择中医相关治疗的多为针灸和推拿医生,骨科医生中选择手术治疗或中医治疗的比例差别不大;值得注意的是共识组中医治疗与手术治疗(Q6)的选择较为分散,多数专家认为无法直接判断,需视情况而定。
针对涉及针灸和推拿的对比(Q5、Q10),针灸医生和推拿医生均更倾向于选择自身专业相关的干预措施,骨科医生的选择较为多元化,选择散布于针灸、推拿、两者疗效相当或不确定的选项。
3 讨论
本研究共收集了356份临床调研问卷,并在共识组中收集了两轮问卷。发现在临床问题和结局重要性评分、辅助判断临床问题重要性评分的6个标准以及基于临床经验的临床问题答案这4个方面,两个不同数据来源的变异性相关的调研结果存在差异。
临床调研与共识组第一轮调研结果的差异较小,两者的临床问题重要性评分CV偏大,显示被调查对象之间分歧偏大。相对于临床调研和第一轮结果,共识组第二轮结果的临床问题重要性评分CV明显变小,说明专家间共识程度高,分歧较小。临床调研的目的在于通过大范围的调查获取尽可能全面的临床问题和优先性选择观点,因此,变异性大符合全面性获取观点的预期。因为共识组的构建强调多学科、多价值观的异质性,以求考虑到指南制订中尽可能全面的观点,因此共识组第一轮结果的CV大,恰恰从侧面佐证了共识组构建的合理性。共识组第二轮结果是在获取之前的结果以及进行了面对面讨论之后所形成的共识性意见,因此,其共识程度相比于临床调研结果以及共识组第一轮结果应当更高,所以CV小。
总体上,无论哪种来源的调研结果,尤其是共识组对临床问题和结局的重要性评分中,高优先级的临床问题和重要的结局往往呈现出更小的变异性,与之相反的是,重要性评分偏低的临床问题和结局呈现出CV越大的趋势。这一结果说明越重要的临床问题和结局,临床医生和专家意见更容易达成共识。
在对基于临床经验的问题答案的分析中,无论患者是否具备手术指征,在涉及不同干预措施之间的对比时,联合治疗相比于单独的中医治疗或西医治疗更容易被选为问题答案,而在中医治疗与手术治疗(或西医治疗或不治疗)相比时,中医治疗更多地被确定为答案,且以针灸和推拿医生较多。同时,三个专业的医生更倾向于选择自身专业相关的干预措施,以针灸和推拿医生为甚。这一结果主要体现了临床医生实践背景的变异性,而实践背景的变异性在三轮调查中的结果基本一致,表明临床问题构建中尽可能全面地考虑了实践所带来的这种不可避免且合理的观点异质性,保证纳入更全面的观点。
临床问题的构建需要把握一定的原则,首先要确保尽可能全面地纳入不同的观点,因此要确保变异性较大,临床调研结果符合此点;同时,也需要在全面的观点中进行优先选择并达成共识,此时变异性应当较小,以达到共识结果的一致性,共识组第二轮结果证明了此点。本研究在临床调研中尽可能纳入不同的临床经验和资历的医生,而共识组中的专家以具有丰富经验的专家为主,两者之间的价值观存在差异,基于6个标准判断临床问题重要性的结果(临床调研和共识组第一轮结果不同)可以从侧面印证这一点。
通过梳理国内外文献发现,临床问题构建的研究较多集中于问题构建的流程步骤[20-22]、优先性选择[23]、临床问题结构化[24]等方面,对于构建过程中所需要考虑的异质性和一致性考虑较少,关于其量化研究和实证研究更少。本研究是第一个将不同原因导致的变异性和一致性在临床问题构建中进行考虑的研究,并进行了实例研究和分析,从实证的角度解释了临床问题构建过程中不同价值观、实践背景、临床经验所导致的变异性的内在机制。
本研究发现,较少存在变异性很大(CV>50%)的临床问题或结局,这一点与既往的理论性文献存在一定差异[18]。可能由于本指南所涉及的膝骨关节炎这一疾病较常见、临床诊疗流程相对其他疾病成熟所致,未来针对其他疾病的指南制订应当进行更多的实例研究以探究变异性的量化应用。另外,由于文章篇幅的限制以及不能将数据全部呈现,本研究仅能以距离形式呈现部分数据,但呈现的距离在本研究中具有普遍性,能够代表所有临床问题的数据展示结果。虽然本研究有理论和实践基础,并进行了实例探索,但并未对变异性应用的效果和实施过程进行深入的评价,未来需要更多的实例研究,并将实例研究与变异性评价的方法学研究同步进行,以制定评价标准和流程。
变异性的量化应用研究具有切实的方法学价值,能够辅助临床问题的优先性选择,并针对其中的价值观差异、临床经验差异、实践背景差异等内在机制进行深入探讨,有利于指南制订过程中充分考虑不同因素的影响,制订出更高质量的指南。
临床实践指南是指导临床医生进行临床诊疗的声明性文件,其制订质量在一定程度上影响了临床决策,而临床问题构建是指南制订中的首要关键环节[1,2]。临床问题构建的方法目前仍是一个不成熟的领域[3],指南制订者和指南方法学研究者将更多的精力倾注于采用各种方法进行问题优先性选择[4-8],却时常忽略一个重要的点,即在优先性选择之前,应当确保尽可能全面地收集临床问题和观点。如何构建考虑得更全面的临床问题清单,需要兼顾临床医生不同的临床经验、实践背景、价值观等[9-13],例如,在膝骨关节炎指南制订中,需要考虑疾病相关的临床医生如针灸医生、推拿医生、骨科医生等的价值观、临床资历和学术背景等,并且还需要考虑医生对众多干预措施的使用情况和偏好[14],而如何去评估及应用各种“不同”所带来的差异,是一个值得探究的科学问题。
根据前期的文献探究[15],变异性在指南临床问题构建中的应用较多[16,17],但是较为局限,多用于确定共识组专家意见的一致性程度,通常追求变异度低,然而,对于其特性的全面理解及变异性内在机制和原因的探讨不足。变异性是一个由多种原因导致的综合概念,常用变异性系数(coefficient variation,CV)表示。变异性大小反应的是共性和个性问题,变异性大,说明被调查者之间的分歧较大,个性特征突出;而变异性小说明被调查者之间分歧较小,共性特征更为明显。
本研究针对临床问题构建中的变异性,在膝骨关节炎指南制订实例中进行了探索,使用CV对其进行量化,并探究不同调研结果中变异性的内在机制,为指南制订者提供参考[15]。
1 方法
1.1 膝骨关节炎指南的临床问题构建
经过前期的文献检索、专家定性访谈、焦点小组讨论等,同时,结合病例引导式临床问题构建的方式,请临床医生回忆实践中的真实病例,并基于其中的决策难点提出临床问题。最后由主席及多位临床专家讨论形成了初步的临床问题清单。共包含14个临床问题,均采用PICO(population, intervention, comparator, outcome)格式构建[18],保证其结构合理及表述规范[19]。本研究中的临床调研将在此14个临床问题基础上进行(表1)。

1.2 临床问卷的设计和发放
根据前期的文献梳理和3位主席及临床专家的讨论,将14个临床问题分为4个小主题:① 无手术指征;② 有修复性手术指征;③ 有重建性手术指征但保守治疗;④ 重建性手术术后康复期。并且界定每个小主题下的临床问题采用一套结局。
采用9分制对临床问题和结局重要性进行评分,分值越高代表重要性程度越大。针对临床问题,7~9分代表临床问题为高优先级;4~6分为中优先级;1~3分为低优先级。针对结局,7~9分代表非常重要;4~6分代表重要但不优先;1~3分代表不重要。对临床问题进行评分时,设置了6个标准辅助临床医生进行判断[5,6],同时,请临床医生根据经验判断问题的答案(图1)。

通过问卷星发放问卷,拟在全国30个省、市、自治区范围内调研200~500名不同经验和资格的临床医生,并确保每个省份均有针灸科、推拿科、骨科医生参与。在多学科共识组(共25位,包括20位临床专家、1位护理学专家、3位方法学专家、1位卫生经济学专家)中发放相同问卷。收集两者结果后举行面对面共识会议,在共识会议中,呈现临床调研和共识组关于临床问题和结局重要性评分、CV的结果,并提醒专家注意辅助判断临床问题的6个标准。在共识会议结束后,再次发放问卷并收集结果(图2)。

1.3 数据整理及分析
计算临床问题和结局重要性评分的均值和CV,并分析判断临床问题重要性的6个标准的变异性,同时,分析了临床医生根据经验所判断的问题答案。通过IBM SPSS Statistics和Microsoft Excel完成了汇总分析。
2 结果
2.1 问卷结果的基本信息
共收集医生问卷356份,中医医师占71.6%(255名);针灸科、推拿科、骨科医生问卷比例约为1∶1∶1(105∶123∶122);98.9%(352名)的医生对膝骨关节炎熟悉;总体来讲,90%(320名)的临床医生对各项中医干预措施是熟悉的,并且针灸医生和推拿医生对中医干预措施的熟悉程度高于骨科医师;95%(338名)的临床医生对于西医非手术治疗熟悉,对手术治疗熟悉的医师少于70%且以骨科医师为主。共识组第一轮收集问卷22份,第二轮收集问卷21份。
2.2 重要性评分的变异性分析
临床调研中,不论所有临床问题总体重要性评分大小,CV均大于25%。共识组第一轮调研中,CV与临床调研结果差别较小。有3个临床问题(Q8、Q12、Q14)CV小于25%,其中,后两者为高优先级临床问题(总体重要性评分≥7分)。经过面对面共识会议讨论后,共识组第二轮调研结果发生较大变化,一方面,相比于共识组第一轮结果,除临床问题Q5,所有临床问题CV都变小,高优先级临床问题CV小于25%,而CV大于25%的临床问题为低优先级(表2)。

根据不同标准判断某一个临床问题的重要性评分的CV,从总体上看,不论重要性评分的高低,临床调研中,CV多在40%以上,而在共识组两轮调查中CV基本均在40%以下(表3)。

2.3 结局重要性评分的变异性分析
不同小主题下结局重要性评分的变异情况基本一致,以无手术指征患者为例,临床调研中结局的重要性评分和变异性与共识组第一轮调研差别较小,非常重要结局CV小于30%,而重要但不优先结局变异系数多在30%以上。然而,在共识组第二轮调研中,非常重要结局变异性均小于20%,重要但不优先结局CV集中于30%左右。需要强调的是,结局的重要性等级程度越高,其CV呈现出越小的趋势(表4)。

2.4 基于临床经验的临床问题答案
总体上,临床调研和共识组两轮调查的结果基本一致。无论患者是否具备手术指征,在涉及不同干预措施之间的对比时,相比于单独的中医治疗或西医治疗,至少80%的临床医生或共识组专家倾向于选择联合治疗作为问题答案。在中医治疗与西医治疗(或不治疗)相比时(Q1、Q2、Q12),50%左右临床医生或专家选择中医治疗,20%选择中医联合西医治疗。
针对有修复性手术指征的患者,修复性手术治疗中医治疗或中医联合西医治疗的对比中(Q6、Q7),临床调研中仅有10%左右的医生选择手术治疗作为答案,其中,选择中医相关治疗的多为针灸和推拿医生,骨科医生中选择手术治疗或中医治疗的比例差别不大;值得注意的是共识组中医治疗与手术治疗(Q6)的选择较为分散,多数专家认为无法直接判断,需视情况而定。
针对涉及针灸和推拿的对比(Q5、Q10),针灸医生和推拿医生均更倾向于选择自身专业相关的干预措施,骨科医生的选择较为多元化,选择散布于针灸、推拿、两者疗效相当或不确定的选项。
3 讨论
本研究共收集了356份临床调研问卷,并在共识组中收集了两轮问卷。发现在临床问题和结局重要性评分、辅助判断临床问题重要性评分的6个标准以及基于临床经验的临床问题答案这4个方面,两个不同数据来源的变异性相关的调研结果存在差异。
临床调研与共识组第一轮调研结果的差异较小,两者的临床问题重要性评分CV偏大,显示被调查对象之间分歧偏大。相对于临床调研和第一轮结果,共识组第二轮结果的临床问题重要性评分CV明显变小,说明专家间共识程度高,分歧较小。临床调研的目的在于通过大范围的调查获取尽可能全面的临床问题和优先性选择观点,因此,变异性大符合全面性获取观点的预期。因为共识组的构建强调多学科、多价值观的异质性,以求考虑到指南制订中尽可能全面的观点,因此共识组第一轮结果的CV大,恰恰从侧面佐证了共识组构建的合理性。共识组第二轮结果是在获取之前的结果以及进行了面对面讨论之后所形成的共识性意见,因此,其共识程度相比于临床调研结果以及共识组第一轮结果应当更高,所以CV小。
总体上,无论哪种来源的调研结果,尤其是共识组对临床问题和结局的重要性评分中,高优先级的临床问题和重要的结局往往呈现出更小的变异性,与之相反的是,重要性评分偏低的临床问题和结局呈现出CV越大的趋势。这一结果说明越重要的临床问题和结局,临床医生和专家意见更容易达成共识。
在对基于临床经验的问题答案的分析中,无论患者是否具备手术指征,在涉及不同干预措施之间的对比时,联合治疗相比于单独的中医治疗或西医治疗更容易被选为问题答案,而在中医治疗与手术治疗(或西医治疗或不治疗)相比时,中医治疗更多地被确定为答案,且以针灸和推拿医生较多。同时,三个专业的医生更倾向于选择自身专业相关的干预措施,以针灸和推拿医生为甚。这一结果主要体现了临床医生实践背景的变异性,而实践背景的变异性在三轮调查中的结果基本一致,表明临床问题构建中尽可能全面地考虑了实践所带来的这种不可避免且合理的观点异质性,保证纳入更全面的观点。
临床问题的构建需要把握一定的原则,首先要确保尽可能全面地纳入不同的观点,因此要确保变异性较大,临床调研结果符合此点;同时,也需要在全面的观点中进行优先选择并达成共识,此时变异性应当较小,以达到共识结果的一致性,共识组第二轮结果证明了此点。本研究在临床调研中尽可能纳入不同的临床经验和资历的医生,而共识组中的专家以具有丰富经验的专家为主,两者之间的价值观存在差异,基于6个标准判断临床问题重要性的结果(临床调研和共识组第一轮结果不同)可以从侧面印证这一点。
通过梳理国内外文献发现,临床问题构建的研究较多集中于问题构建的流程步骤[20-22]、优先性选择[23]、临床问题结构化[24]等方面,对于构建过程中所需要考虑的异质性和一致性考虑较少,关于其量化研究和实证研究更少。本研究是第一个将不同原因导致的变异性和一致性在临床问题构建中进行考虑的研究,并进行了实例研究和分析,从实证的角度解释了临床问题构建过程中不同价值观、实践背景、临床经验所导致的变异性的内在机制。
本研究发现,较少存在变异性很大(CV>50%)的临床问题或结局,这一点与既往的理论性文献存在一定差异[18]。可能由于本指南所涉及的膝骨关节炎这一疾病较常见、临床诊疗流程相对其他疾病成熟所致,未来针对其他疾病的指南制订应当进行更多的实例研究以探究变异性的量化应用。另外,由于文章篇幅的限制以及不能将数据全部呈现,本研究仅能以距离形式呈现部分数据,但呈现的距离在本研究中具有普遍性,能够代表所有临床问题的数据展示结果。虽然本研究有理论和实践基础,并进行了实例探索,但并未对变异性应用的效果和实施过程进行深入的评价,未来需要更多的实例研究,并将实例研究与变异性评价的方法学研究同步进行,以制定评价标准和流程。
变异性的量化应用研究具有切实的方法学价值,能够辅助临床问题的优先性选择,并针对其中的价值观差异、临床经验差异、实践背景差异等内在机制进行深入探讨,有利于指南制订过程中充分考虑不同因素的影响,制订出更高质量的指南。