我国基于疾病诊断相关分组的医疗服务绩效综合评价方法的系统评价_《华西医学》

作者：

 郑雪 , 陈平 , 邓清华 , 王苑 , 李璐

西南医科大学附属医院质量控制部（四川泸州 646000）;

关键词：

综合评价方法绩效评价疾病诊断相关分组系统评价

DOI：

10.7507/1002-0179.201911133

视频：

导出 下载 收藏 扫码 引用

摘要 全文 图表 视频 参考文献 施引文献 补充材料

目的系统评价我国基于疾病诊断相关分组（diagnosis-related group，DRG）进行住院服务绩效综合评价的研究方法，为后续相关方法的改进与完善提供参考。方法检索中国知网、万方、维普和 PubMed 数据库，检索时间从建库至 2019 年 5 月，获取基于 DRG 进行综合绩效评价的研究。由 2 名研究者独立筛选文献并提取综合评价方法相关资料，定性分析并描述综合评价方法在基于 DRG 的医疗服务绩效评价中的运用情况。结果系统评价共纳入 24 篇文献，各研究基于评价目的对 DRG 指标的选用有所不同。8 篇文献通过德尔菲法、专家讨论法、Saaty 法或其他方法确定了指标权重。9 篇研究使用秩和比法、7 篇研究使用逼近理想解排序法、9 篇研究使用综合指数法进行绩效评价，层次分析法、组合评价法亦有应用。结论纳入研究基于 DRG，对医疗服务绩效评价指标选用、权重确定、综合评价值计算进行了不同程度的探索，后续研究应着重于权重的科学使用，深入探索组合评价法，并注重信息源的质量和评价结果的科学应用。

引用本文： 郑雪, 陈平, 邓清华, 王苑, 李璐. 我国基于疾病诊断相关分组的医疗服务绩效综合评价方法的系统评价. 华西医学, 2019, 34(12): 1384-1389. doi: 10.7507/1002-0179.201911133 复制

疾病诊断相关分组（diagnosis-related group，DRG）以诊断和/或操作为主要分组依据，将临床诊疗过程和医疗资源消耗相似的病例分到同一组中^[1]，是一种重要的医疗管理工具，广泛应用于医疗支付、绩效评估、质量控制等多个领域^[2]。在中国内地，北京是首个成功将 DRG 本土化（2008 年）并将其应用到医疗保险支付和绩效评价实践中的城市^[3]。北京版 DRG 分组平台通过统一的标准计算出能力、效率、质量指标以实现医院、科室、医师之间的比较。随着北京版 DRG 的推广，许多学者基于分组平台计算出 DRG 相关指标数据，对不同地区、不同专科的医疗服务绩效进行了评价，但大多数研究仅停留在对指标或维度进行单项评价的阶段，仅有少部分研究使用了综合评价方法对评价单位作出了整体性的优劣评判。“综合评价”是针对多属性的复杂综合体，采用一定的方法，对评价单位作出整体性的评价，帮助提高决策的科学性的评价方法^[4]。本研究旨在系统评价国内运用 DRG 相关指标对医疗服务绩效进行综合评价的研究方法，分析指标的运用、权重的设定、综合评价方法，为后续相关研究综合评价方法的改进提供参考。现报告如下。

1 资料与方法

1.1 纳入与排除标准

1.1.1 纳入标准

① 研究对象：中国内地（不含我国香港、澳门、台湾地区）的医院集合、医院、临床科室、医师组、医师；② 研究内容：DRG 相关指标；③ 研究设计方法：综合评价方法；④ 评价内容：医疗服务绩效；⑤ 研究类型：定量研究。

1.1.2 排除标准

① 仅对 DRG 指标进行单项评价的文献；② 未确切交代综合评价值计算方法的文献；③ 未给出明确的综合评价结果的文献；④ 综述、新闻、评论、报告等。

1.2 检索策略

数据源包括中国知网、万方、维普和 PubMed 数据库。以“DGR”“诊断相关分组”“病例组合”“绩效”“评价”评估”等为关键词进行检索，检索时间从各数据库建库至 2019 年 5 月。此外，对纳入文献引文进行检索。以万方为例，具体检索策略见框 1。

图选项

下载全尺寸图像

下载幻灯片

1.3 文献资料提取

由 2 名研究人员独立完成文献筛选和资料提取工作，如遇分歧，则双方讨论或加入第三人协助判断，直至达成统一意见。提取的资料包括：① 文章基本信息：题名、第一作者、文献来源、发表时间；② 数据信息：数据来源、分组器版本、评价专科、评价层面；③ 评价方法：评价指标、权重确定方法、综合评价方法。其中评价指标主要包括医疗服务能力、医疗服务效率、医疗质量和安全 3 个维度（表 1），各指标具体计算方法参照文献[3]。

表1 基于 DRG 进行医疗服务绩效评估指标

表选项

下载CSV

评价维度与指标	评价内容
医疗服务能力
DRG 组数	收治病例所覆盖疾病类型的范围
DRG 总权重数	对病例进行风险调整后的住院服务总产出
病例组合指数	反映收治病例的整体技术难度
医疗服务效率
费用消耗指数	治疗同类疾病所消耗的费用
时间消耗指数	治疗同类疾病所消耗的时间
医疗质量与安全
低风险组死亡率	疾病本身导致死亡概率极低的病例死亡率

1.4 文献质量评价

由 2 名研究者分别独立采用 CASP（Critical Appraisal Skills Programme）研究工具^[5]对纳入文献的质量进行评价，包括：研究目的、研究方法、研究设计、研究对象的选择、资料收集、研究者与参与者关系、伦理考量、数据分析、研究结果和研究价值。对于分歧则加入第三人共同讨论解决。

1.5 研究方法

采用定性分析的方法，描述我国基于 DRG 的医疗服务绩效综合评价方法，涵盖指标的选用、权重的使用、综合评价方法（包含指标预处理方法和综合评价值计算方法）。

2 结果

2.1 文献检索结果

根据检索策略共获得 678 篇文献，剔重后获得 282 篇文献，通过层层筛选最终确定纳入 24 篇综合评价文献^[6-29]。文献检索流程及结果见图 1。

图1 文献筛选流程及结果

^*所检索的数据库及检出文献数具体如下：中国知网（n=158）、万方（n=264）、维普（n=240）、PubMed（n=11）

图选项

下载全尺寸图像

下载幻灯片

2.2 纳入文献基本情况

纳入的 24 篇文献多发表于 2016 年及之后，评价层面涉及医师个体、医师组、病区、科室、医院乃至医院集合。纳入研究中大部分基于北京版 DRG（包括 BJ-DRG 和 CN-DRG）进行分组；4 篇文献^{[6, 9, 26-27]}通过省级卫生健康委员会或信息中心平台得到分组及指标结果，未明确给出分组器版本；雷敏等^[28]使用企业开发的 J-DRG 进行分组；张瑞迪^[14]主要依据人均费用对病例进行组合；王振宇^[19]则未提及分组工具。见表 2。

表2 基于 DRG 进行综合评价的纳入研究

表选项

下载CSV

表2 基于 DRG 进行综合评价的纳入研究

纳入研究	分组器版本	评价层面	DRG 指标	指标权重确定	综合评价方法
陈颖等 2015^[6]	北京平台	医师组	②⑤⑥⑩	无权重	平均秩次法
万钢等 2016^[7]	BJ-DRG	科室	③④⑤⑥	无权重	秩和比法
谢世堂 2016^[8]	BJ-DRG	科室	②③④⑤⑥⑩	无权重	TOPSIS 法
郝晋等 2016^[9]	北京平台	主诊组	②④⑤⑥	无权重	非整秩次秩和比
季新强 2016^[10]	BJ-DRG	病区	①③④⑤⑥⑩	无权重	综合指数法
白玲 2016^[11]	BJ-DRG	医院	③④⑤⑥⑨	德尔菲法	加权 TOPSIS
张肖肖等 2017^[12]	BJ-DRG	医师团队	③④⑤⑥⑨	无权重	综合指数法
万钢等 2017^[13]	BJ-DRG	科室	③④⑤⑥	无权重	TOPSIS 法
张瑞迪 2016^[14]	费用分组	科室	①③④⑤⑥⑨	有权重	综合指数法
刘豆等 2017^[15]	CN-DRG	病区	②③④⑤⑥⑨	无权重	平均秩次法
魏俊丽等 2017^[16]	BJ-DRG	科室	②③④⑤⑥⑨	有权重	综合指数法
李顺飞等 2017^[17]	CN-DRG	医院集合	③④⑤⑥⑨	无权重	综合指数法
李顺飞等 2017^[18]	CN-DRG	医院	③④⑤⑥⑨	参照北京	综合指数法
王振宇 2017^[19]	未说明	科室	②③④⑤⑥⑨	德尔菲法+层次分析法^*	层次分析法
陈世景等 2017^[20]	BJ-DRG	科室	②③④⑤⑥⑩	无权重	TOPSIS 法
吴国安等 2018^[21]	BJ-DRG	科室	③④⑤⑥	无权重	秩和比法
田小芸等 2018^[22]	CN-DRG	病区	②③④⑤⑥⑨	参照北京	综合指数法
戴卉等 2018^[23]	BJ-DRG	科室	②④⑤	无权重	非整秩次秩和比
明星辰等 2018^[24]	CN-DRG	病区	②③④⑤⑥⑨	无权重	综合指数法
陈园园等 2018^[25]	CN-DRG	医师	②③④⑤⑥⑨	无权重	秩和比法+TOPSIS 法+综合指数法
杨业春 2018^[26]	广东平台	病区	①③④⑤⑥⑩	专家讨论法^*	加权 TOPSIS
罗礼生等 2019^[27]	江西平台	医院集合	②③④⑦⑧⑨	Saaty 法^*	加权 TOPSIS
雷敏等 2019^[28]	J-DRG	科室	②③④⑤⑥	无权重	秩和比法
李欢等 2019^[29]	CN-DRG	医院	②③④⑤⑥⑨⑩	无权重	秩和比法
①：病例数；②：总权重；③：DGR 组数；④：病例组合指数；⑤：时间消耗指数；⑥：费用消耗指数；⑦：平均住院日；⑧：平均总费用；⑨：低风险组死亡率；⑩：使用除“低风险组死亡率”以外的其他质量指标进行医疗质量与安全维度的评价；TOPSIS：逼近理想解排序法；^*在采用相应方法确定指标权重的同时在结果中给出了确切的权重系数

2.3 指标的选用

纳入研究立足于评价问题和评价对象的实际情况对 DRG 指标的选用有所不同，见表 2。

在医疗服务能力指标的使用中，3 篇文献^{[8, 20, 26]}认为能力指标应与评价对象规模相适应，因此使用床位数对能力指标进行了调整，最终使用床均总权重、床均 DRG 组数评价能力维度。

在对医疗服务效率维度的评价上，22 篇文献^{[6-22, 24-26, 28-29]}使用时间消耗指数和费用消耗指数，罗礼生等^[27]则使用平均住院日和平均总费用，戴卉等^[23]则在针对床位使用效率的评价中仅选用了时间消耗指数。

在医疗质量与安全指标的选定上，部分研究中评价对象低风险组死亡率为 0，存在指标失效的现象，所以有学者^[29]将低风险死亡率结合其他质量指标，如中低风险组死亡率，进行医疗安全维度的评价，也有部分学者^{[6, 8, 10, 20, 26]}选用了其他指标进行质量评价，如死亡指数、再返指数、出院人数死亡率、非计划 14 日再入院率、医院感染率、非计划二次手术率、权重大于 2 的病例占比等。

除了 DRG 相关的能力、效率、质量 3 个维度的指标外，部分研究也引入了其他维度指标加入综合评价体系。王振宇^[19]使用层次分析法构建的评价体系除了 6 个 DRG 指标外，还包含了医疗、财务、教学与科研、人才梯队等其他 15 个指标；杨业春^[26]基于 DRG 计算时间指数和费用指数的方法计算出了中医治疗指数、中药饮片使用指数，将这 2 个中医能力维度指标与 DRG 指标相结合评价中医骨科的综合绩效。

2.4 权重的设定

纳入研究中仅有 8 篇文献^{[11, 14, 16, 18-19, 22, 26-27]}使用了指标权重。李顺飞等^[18]和田小芸等^[22]均参照了北京市 DRG 住院绩效评价方法的权重设定，王振宇^[19]联合使用德尔菲法和层次分析法确定各指标和维度权重，白玲^[11]、杨业春^[26]、罗礼生等^[27]分别使用德尔菲法、专家讨论法、Saaty 法，其中 3 篇文献^{[19, 26-27]}在使用相应的方法定权后明确给出了权重的系数结果，另 2 篇研究^{[14, 16]}在计算综合评价值的步骤中使用了维度权重却未说明权重设置依据。

2.5 综合评价方法

2.5.1 秩和比法

纳入文献中，5 篇文献^{[7, 21, 25, 28-29]}使用常规的秩和比法，郝晋等^[9]和戴卉等^[23]认为使用非整秩次编秩可以在一定程度上弥补常规方法信息损失的不足，因而选用了非整秩次秩和比法；陈颖等^[6]和刘豆等^[15]则使用平均秩次法，以评价对象各指标秩次的算数平均数作为评价优劣等级的依据。

2.5.2 逼近理想解排序（Technique for Order Preference by Similarity to Solution，TOPSIS）法

在 7 篇^{[8, 11, 13, 20, 25-27]}将 TOPSIS 法运用于 DRG 相关指标的综合评价中，欧氏距离和最优值接近程度的计算方法并无不同，但低优指标的正向化处理方法和归一化处理方法有所区别。见表 3。

表3 使用 TOPSIS 法进行综合评价的研究指标预处理方法

表选项

下载CSV

纳入研究	综合评价方法	低优指标正向化方法		归一化处理
谢世堂 2016^[8]	TOPSIS 法	倒数法	倒数法	赋值法		公式处理
白玲 2016^[11]	加权 TOPSIS	未说明	未说明	赋值法	均值化法
万钢等 2017^[13]	TOPSIS 法	未说明	未说明	未说明	未说明
陈世景等 2017^[20]	TOPSIS 法	倒数法	倒数法	差值法	公式处理
陈园园等 2018^[25]	TOPSIS 法	倒数法	倒数法	差值法	公式处理
杨业春 2018^[26]	加权 TOPSIS	未说明	未说明	未说明	未说明
罗礼生等 2019^[27]	加权 TOPSIS	未使用	未使用	未说明	未说明
归一化处理中使用的处理公式为：，其中 X_ij 为第 i 个评价对象的第 j 个指标值，Z_ij 则为处理后的归一化值

2.5.3 综合指数法

9 篇使用综合指数法的文献^{[10, 12, 14, 16-18, 22, 24-25]}在 DRG 指标标准值的选定中，DRG 组数、总权重一般选择评价对象均值；病例组合指数、费用消耗指数、时间消耗指数既可选择评价对象均值，也可选择平台均值 1；低风险死亡率的标准值为 0，但季新强^[10]先将指标使用差值法进行正向化，再将正向化后的均值作为标准值以计算指数。在计算相对比上，一般而言，正向指标计算方法为“实际值/标准值”，负向指标计算方法为“标准值/实际值”。在使用 DRG 相关指标时，由于低风险死亡率的平台标准值为 0，选用此标准值的研究不适用一般的指数计算方法，因此部分研究^{[12, 14, 16, 18, 22, 25]}采用了区间分段法对指标进行赋值，而李顺飞等^[17]则使用差值法“1－低风险死亡率/10”计算指标指数。在综合指数值的计算中，2 篇研究^{[18, 22]}使用了加权求和法；4 篇文献^{[10, 12, 24-25]}使用乘加法，即同类相乘、异类相加，先将同一维度下各指标相乘，再将各维度指标乘积相加得到综合指数；李顺飞等^[17]研究中使用连乘法计算综合指数并将其命名为临床绩效指数；张瑞迪^[14]和魏俊丽等^[16]则在计算出能力和效率维度的综合指数后使用质量指标得分作为直接系数对综合指数进行调整。

2.5.4 其他综合评价方法

除以上使用最多的 3 种综合评价方法外，王振宇^[19]使用层次分析法方法，将 DRG 指标同其他医疗、质量、财务指标相结合，综合评价不同医院的心血管内科专科绩效；陈园园等^[25]分别使用秩和比法、TOPSIS 法和综合指数法基于同一 DRG 指标体系评价了不同医师的医疗服务绩效，并使用平均值法将 3 种评价结果进行组合综合评价。

3 讨论

3.1 综合评价方法的应用

3.1.1 指标选用

科学的指标体系是综合评价的前提，指标选择应考虑全面性、科学性、层次性、可操作性和目的性^[30]。本次系统评价纳入的各研究基于评价目的对 DRG 相关指标进行了筛选，但也有部分研究缺乏对质量指标的纳入。部分研究应用了一些其他指标以完善评价体系，如权重≥2 占比、学科发展均衡性、每床位权重、中医治疗指数，为 DRG 住院服务绩效评价指标体系的丰富与完善提供了借鉴。

3.1.2 权重设定

在综合评价中，指标权重系数是指标重要程度的衡量，是作出科学评价的关键。本次系统评价发现，纳入研究少有对权重系数的设定进行探讨，仅有 3 篇文献^{[19, 26-27]}使用了主观定权法且列出了确切的权重系数结果。权重的确定方法可分为主观定权法和客观定权法，主观定权法客观性差但可反映决策者的意向，客观定权法精度较高但解释性差且计算复杂，实际应用相对较少。在后续的相关研究中，基于专业解释选用合理可行的定权方法应得到更多的注重，同时，可探索将主客观赋权法组合应用于 DRG 相关指标权重的确定。

3.1.3 综合评价方法

纳入研究综合评价方法中，秩和比法、TOPSIS 法和综合指数法是使用频次最多的方法，此 3 种方法的共同优点是对数据无严格要求、能消除指标量纲的影响、操作相对简单^[31]。但是，我们在本次系统评价过程中发现，不少文献缺乏对指标预处理公式或综合评价值计算方法的具体交代，由此许多较有意义的研究并未被纳入系统评价。同时，各评价方法原理不同，方法的属性层次相异，当不同方法运用于同一评价体系时可能存在结果不一致的问题^[32]，陈园园等^[25]在研究中给出的 3 种不同评价结果就是例证。国内外的综合评价方法有数百种之多，目前尚无客观的标准对评价方法进行评价或优劣检验，不同方法评价结果的不一致是综合评价领域的共性问题。陈园园等^[25]还同时将 3 种结果的序值使用平均值法进行了组合评价。组合 2 种或 2 种以上的综合评价方法是解决评价结果不一致难题的方法之一，组合评价可在发挥各方法优势的同时互相弥补不足，评价结果更加客观、准确、稳定。基于 DRG 的住院医疗服务评价中，更多的组合评价方法应当得到探索应用，如 Borda 法、Copeland 法、模糊 Borda 法等。

3.2 高质量的信息源是科学评价的前提

基于 DRG 的住院服务绩效评价，首先数据来源于病案信息首页，其次依托于 DRG 分组平台。病案首页是住院患者诊疗信息的总结与归纳，主要包括患者基本信息、主要诊断、主要操作方式、出院情况等及其相应的编码，是分组的依据，纳入研究均对病案信息的质量有所强调。高质量的病案首页信息应当准确、规范、完整，这依赖于医院完善的信息系统建设、具有高度专业技能的编码员以及相应的病案质量监测机制，如此方能确保分组结果的真实可靠，提高评价结果的可信度。DRG 分组器根据病案信息将病例分至唯一的 DRG 组，分组规则是 DRG 系统运作的核心，已有研究表明，目前受到推广应用最多的北京版 DRG 具有良好的分组效果^[33]，但是 DRG 分组工具制定极其复杂且专业性强，难免存在漏洞，已有学者发现 CN-DRG 在应用过程中存在系统不完善、数据偏差的问题^[34]，因此，DRG 分组平台应当从设计层面适时调整、不断优化，保证分组规则能科学合理地适用于我国医疗卫生行业。

3.3 综合评价结果的应用

基于 DRG 的综合评价结果可为卫生管理者进行卫生规划等相关决策提供客观的数据支持。纳入研究针对综合评价结果均有不同程度的分析讨论。综合评价结果是评价对象医疗能力、技术、效率、质量的整体反馈，不仅可以通过内部分析找到医疗管理中的薄弱环节，有针对性地帮助改进诊疗服务流程，加强相应管理体制的建设，指导评价对象的科学发展，还可用于医院之间、学科之间、医师之间的横向比较，明确评价对象的行业定位以及优势劣势，以便于外部管理者据此进行相应的卫生资源配置，促进医疗卫生行业的健康发展。

综上所述，秩和比法通过对各项指标秩次之和进行比较评价，操作相对简便，可消除异常值的影响，但会损失一部分信息；TOPSIS 法通过计算各评价对象与评价对象中的相对最优值的接近程度来进行相对优劣的评判，可充分利用数据原始信息，但无法反映与理想方案的接近程度，灵敏度不高；综合指数法通过指数化来统一不同评价指标的综合水平，并运用一定方法进行综合，然后比较评价，此方法计算简便，适用范围广，但容易受到权重的影响，因此权重的确定较为关键。目前不同的综合评价方法均存在一定缺陷，不同的研究可立足于评价目的，根据可得数据选用相对合适的指标及方法对医疗服务绩效进行综合评价。