药品临床综合评价是促进药品回归临床价值的基础性工作,已成为近年来临床药学研究工作重点之一。现有研究重点关注临床综合评价指标体系构建及量化指标价值,对指标评分后的价值整合方法研究较少,决策方法过于单一,可能出现将次优方案评选为最优方案的情形。因此,本研究从背景、原理、适用情形等方面对多种综合价值整合方法进行归纳、总结,以期为我国临床综合评价提供方法学参考。
目前,我国药品临床综合评价已在罕见病药品[1]、抗癌药[2]、降脂药[3]、心血管慢病药[4]、中成药[5]、儿童药[6,7]等领域通过引用科学方法形成评价模型雏形、专家共识或指南,如使用多准则决策分析和层次分析法进行指标体系构建;使用直接评分法进行指标赋值;使用层次分析分析法、离散选择实验等进行权重赋值。但关于最终环节的价值整合分析方法研究较少。
现有研究对多维度评价得分整合时均采用简单加权算术法(simple weighted arithmetic,SWA)[8-10],虽然SWA法简单、易懂、易操作,但不可忽略的是SWA法无法消除或减少评价中主观因素对结果的影响。同时,在药品多维度价值整合过程中,评价对象的低价值维度得分会受到高价值维度得分的影响而被拉升,出现次优方案成为优选结果的情况[11]。例如,在进行多方案排序时,药品某一指标得分为0分,但是综合排名第二[12];在单个药品价值评估时,临床安全性、有效性、经济性极低,但综合评价结果表明药品临床价值好[13-16]。然而,根据现有临床综合评价体系权重赋值结果发现,研究者一致认为安全、有效、经济性在药品评价中更加重要[17-20]。因此,在某些情况下,SWA法可能无法准确遴选出以药品临床价值为导向的优选方案。
此外,随着我国药品集中带量采购工作向常态化、制度化方向推进,临床综合评价也逐渐成为指导集采药品合理配备和使用的重要工具。与以往药品临床综合评价不同的是,集采药品在根据6个维度评分得出综合价值后,需要将药品划分为强推荐、中推荐、弱推荐3个等级,为集采采购量调整、医疗机构药品配备、采购目录制定提供参考。然而,现有研究在等级划分过程均根据专家主观判断,缺少科学方法作为支撑,将会导致不同研究等级划分标准不同[21]。
为解决上述研究中存在的问题,本研究对医药领域决策常用的秩和比法(rank-sum ratio,RSR)、优劣解距离法(technique for order preference by similarity to an ideal solution,TOPSIS)、改进消去与选择转换法(elimination et choice translating reality,ELECTRE)进行梳理对比,并探讨其相对SWA法存在的优缺点。
1 方法对比
1.1 RSR法
1.1.1 方法原理
传统数理统计用参数描述患者患病率、好转率、恶化率、死亡率等情况时,要求样本总体呈现正态分布,若总体不满足正态分布,则需要足够多的样本量,然而临床样本量往往不能满足要求。近代非参数统计虽然不受样本分布限制,但是分辨率不高。为解决上述问题,我国预防医学科学院田凤调教授于1988年提出RSR法,融合了古典参数统计的数理优势和非参数统计的简易操作[22],用于解决各种医学领域评估问题。RSR法是将由n个评价对象,m个评价指标构成的矩阵,根据指标评分进行编秩,然后通过秩转换,得到无量纲统计值的RSR值,依据RSR值进行方案排序、分档[23],本质上是根据评价对象各评价指标的排序编号进行的再次排序。编秩是RSR法的关键步骤,分为整次RSR法和非整次RSR法。大多数研究采用整次RSR法,将N个指标评价结果从小到大排序,用1~N整数依次进行编秩,当同一指标数据相同时编平均秩[24],但这种方法会损失原指标的定量信息。非整次RSR法则将所编秩次与原指标之间构建线性对应关系,一定程度上可以保留原指标信息,提高结果准确性[25]。
1.1.2 方法应用
相比于SAW法,RSR法的编秩过程可以减少评价指标中极值对结果的影响,经过编秩,相邻两个评价对象指标得分最大不超过1。此外,在排序之后还能通过各评价对象概率单位对多方案进行分档,适用于原始数据形式不统一、需要进行等级划分的研究,因此RSR法在医疗服务质量评估[26-28]、卫生资源配置合理性评估[28-31]等领域广泛应用。黄延彪等[32]从能力、效率、质量维度对院内医师住院医疗服务进行综合评价,结果显示:采用SWA法排序的结果会出现方案综合排名靠前,但某一指标评分极低的现象;RSR法排序的结果则显示评价对象各评价指标单排序基本一致,排名在前的评价对象各评价指标得分均较高。有研究在进行医院手术科室风险分级时采用RSR法分档,可以按照实际需求确定所需要的分档级别数,根据最佳分档原则确定不同级别分级标准[33],相比于主观划分等级标准,更加科学、合理。
1.2 TOPSIS法
1.2.1 方法原理
1981年Hwang和Yoon首次提出TOPSIS法,是为解决决策者多准则决策而提出的一种接近于线性加权平均方法的排序法,最初用于个人生活选择、企业进行商业策略制定、公共资源配置、制定最优出行方案等需要进行多准则决策情形[34]。TOPSIS法首先需要对评价结果进行标化,得到由构成的矩阵,消除量纲影响,然后通过求解评价对象每一评价指标与理想解的接近程度,对其进行优先级排序。原理是当所选方案评价指标与理想解
的距离最短,并与负理想解
的距离最远时,最接近最优解。此外,在评价过程中,还考虑到指标权重
对结果的影响。该方法关键步骤是根据
和
求解相对值,因此,数据的单位和数量级不会对结果产生影响[35]。
1.2.2 方法应用
相比于SWA法、RSR法,TOPSIS法优势在于不需要对原始数据进行主观评分,也无需进行编秩,直接利用指标测量值,可以最大化保留数据信息。适用于对原始数据信息要求较高、数据形式不统一的研究。因此,常用于医疗绩效综合评估[36-38]。朱晓伟[39]基于DRG组数、CMI指数、费用指数、时间指数、DRG总量5种不同数据形式对医疗绩效进行综合排序,在充分利用原始数据的基础上,克服了传统评价指标数据形式单一的困难。另外,由于TOPSIS法不能进行方案分档,RSR法可能丢失原始数据信息,为避免以上两种方法缺陷,多数研究采用TOPSIS-RSR组合法[40-42]。吴晓凡[43]在进行医院科室分级时使用TOPSIS法对研究对象进行初步排序,然后基于CI值进行编秩,用RSR法分档原理完成医院服务质量分级。既实现了研究对象分类分档,又保留了原始数据信息。
1.3 ELECTRE法
1.3.1 方法原理
20世纪60年代,欧洲咨询公司SEMA在讨论是否发展新项目的决策问题时,在加权总和技术上遇到困难。为此,邀请数学家Roy作为顾问,设计出ELECTRE法,目的是在多个方案中选择最佳方案,随后经过迭代,已经形成ELECTRE-Ⅰ、ELECTRE-Ⅱ、ELECTRE-Ⅲ、ELECTRE-Ⅳ、ELECTRE-IS、ELECTRE-TRI等。常用于投资[44-46]、企业管理[47-50]领域。ELECTRE-Ⅰ根据方案之间差异是否超过阈值,进行和谐检验和不和谐检验,通过两两对比逐步剔除劣等方案,然而由于这种方法判断标准过于粗略,最终可能确定不只一个最优方案,因此ELETRE-Ⅱ被创立。ELETRE-Ⅱ通过增加预设标准,细化阈值范围,更多地保留了原始信息,实现了更好的排序。ELECTRE-Ⅲ引入可信度概念,以不和谐指数削弱和谐指数值,生成能够直接反映方案优先级别的净可信度。ELECTRE-Ⅳ优势在于不需要人为进行评价指标进行权重赋值,但是未保留ELETRE法使用和谐指数、不和谐指数的独特决策思路。ELECTRE-TRI主要用于方案分级或归类。
1.3.2 方法应用
ELETRE法最大的特点是可以解决指标之间互补性问题,即当备选方案因某一指标评分过高占据优势时,不会弥补其他指标评分过低产生的劣势,因此适用于对原始数据信息保留程度高,遴选各评价维度得分均高的研究。目前,医药领域逐渐使用ELECTRE法选择最佳方案[51-54]。ELETRE法与TOPSIS法都是基于原始数据两两之间相对值进行排序,但是ELETRE法避免了高分指标与低分指标之间的互补,还能对方案进行排序。李丽[55]曾通过比较决策者偏好效用函数与不同综合价值评估方法排序结果,发现相比于TOPSIS法,ELECTRE法排序结果与偏好效用函数一致性更高,可以更为准确地提供符合决策者偏好的方案。
2 药品价值整合方法的选择
2.1 遴选评价指标累积得分最高的方案
当药品临床综合评价需要遴选出所有评价指标得分之和最高的品种时,可以选择SWA法、TOPSIS法。SWA法更加简单易操作,能够获得各评价对象总得分,但是评价者的主观因素对结果影响较大;TOPSIS法可以减少评价者打分环节,一定程度上提高结论的客观性,并直接获得各方案与最优解相对接近程度,方便评价者进行决策。
2.2 遴选各评价维度均优的方案
当需要评选出各维度得分均高的品种时,可以选择RSR法、ELECTRE法。RSR法经过编秩,在一定程度上能够减少评价指标中极值对结果的影响,但计算过程中仍涉及到加权加和步骤,相比于ELECTRE法,结果会缺乏一定准确性。ELECTRE法运用和谐指数与非和谐指数理论避免指标得分互补,但是操作步骤相对复杂,对评价者要求高。
2.3 确定方案的推荐等级
当有多个方案进行综合排序,并需要确定推荐等级时,可以采用ELECTRE-TRI法、SWA法、TOPSIS-RSR法。ELECTRE-TRI法是在排序之前进行人为标准划分,一旦更改划分级数,则需重新计算,且无法保证不同研究分级标准一致。SWA法和TOPSIS-RSR组合法均是在评价对象排序结束后,确定等级标准,不同的是,SWA法是人为主观确定标准,TOPSIS-RSR组合法根据最佳分档原则,按照决策者要求获得不同级数分档标准,能够保证不同研究之间划分标准一致。

3 完善药品临床综合评价中价值整合的建议
3.1 使用组合法替代单一方法,弥补方法之间的缺陷
以上几种价值整合分析方法各有优缺点,方法原理和侧重点也都不同。建议进行药品临床综合评价时,采用多种模型同时对备选方案进行综合价值计算,相互验证,提高结果准确性[56-58];或者按照决策需求利用各方法之间的特点,不同阶段使用不同方法,例如TOPSIS-RSR分别在排序和分档阶段应用;或者使用FUZZY SET理论[25],加权不同方法排序结果,用不同权重下加权结果是否一致验证结果的稳定性。
3.2 开发药品临床综合评价操作软件,提高评价效率和准确率
本文介绍的三种价值整合分析方法操作过程相比SWA法略微复杂,尤其是ELECTRE法对研究者有着较高要求。相关研究人员、机构可以利用Python、Metlab等软件基于方法原理进行代码编写,开发药品临床综合评价应用软件,实现评价过程的简易操作。研究者在进行药品临床综合评价时,仅需输入备选方案各维度参数,即可快速确认最优方案,同时避免计算过程中产生的失误。
3.3 明确不同决策情形下评价标准及价值整合方法选择,规范综合评价步骤
指标体系是重要的评价工具,客观评价证据是基础的评价内容,评价结果整合分析是评价的关键环节。因此,建议相关指南或体系构建时,明确各评价维度不同等级或赋分标准,以及遴选药品时对综合价值的要求,提供最适合的价值整合分析方法。推动各种价值整合方法的应用,同时也尽量减少评价者主观因素对结果的影响。
临床综合评价是健全药品供应保障制度的具体要求,目前我国还处于初步探索阶段,仍有很多需要完善的环节[59]。除了本研究提到的综合价值评估缺乏准确性以外,还存在部分研究评价维度与《药品临床综合评价管理指南(2021年版试行)》要求不符的情形,或缺少对某一维度评价[60],或对其中一个维度进行更改[61]。为了提高药品规范科学使用管理水平,医疗机构、科研院所、行业学会等机构需不断完善药品临床综合评价体系,科学引导和规范临床综合评价在中国卫生决策领域的应用。本研究对综合评价中常用的综合价值评估方法进行了详细介绍,相关研究人员也应加大对综合价值评估方法的进一步探索,以提高我国临床综合评价研究综合评价结果的科学性、合理性、可靠性。
目前,我国药品临床综合评价已在罕见病药品[1]、抗癌药[2]、降脂药[3]、心血管慢病药[4]、中成药[5]、儿童药[6,7]等领域通过引用科学方法形成评价模型雏形、专家共识或指南,如使用多准则决策分析和层次分析法进行指标体系构建;使用直接评分法进行指标赋值;使用层次分析分析法、离散选择实验等进行权重赋值。但关于最终环节的价值整合分析方法研究较少。
现有研究对多维度评价得分整合时均采用简单加权算术法(simple weighted arithmetic,SWA)[8-10],虽然SWA法简单、易懂、易操作,但不可忽略的是SWA法无法消除或减少评价中主观因素对结果的影响。同时,在药品多维度价值整合过程中,评价对象的低价值维度得分会受到高价值维度得分的影响而被拉升,出现次优方案成为优选结果的情况[11]。例如,在进行多方案排序时,药品某一指标得分为0分,但是综合排名第二[12];在单个药品价值评估时,临床安全性、有效性、经济性极低,但综合评价结果表明药品临床价值好[13-16]。然而,根据现有临床综合评价体系权重赋值结果发现,研究者一致认为安全、有效、经济性在药品评价中更加重要[17-20]。因此,在某些情况下,SWA法可能无法准确遴选出以药品临床价值为导向的优选方案。
此外,随着我国药品集中带量采购工作向常态化、制度化方向推进,临床综合评价也逐渐成为指导集采药品合理配备和使用的重要工具。与以往药品临床综合评价不同的是,集采药品在根据6个维度评分得出综合价值后,需要将药品划分为强推荐、中推荐、弱推荐3个等级,为集采采购量调整、医疗机构药品配备、采购目录制定提供参考。然而,现有研究在等级划分过程均根据专家主观判断,缺少科学方法作为支撑,将会导致不同研究等级划分标准不同[21]。
为解决上述研究中存在的问题,本研究对医药领域决策常用的秩和比法(rank-sum ratio,RSR)、优劣解距离法(technique for order preference by similarity to an ideal solution,TOPSIS)、改进消去与选择转换法(elimination et choice translating reality,ELECTRE)进行梳理对比,并探讨其相对SWA法存在的优缺点。
1 方法对比
1.1 RSR法
1.1.1 方法原理
传统数理统计用参数描述患者患病率、好转率、恶化率、死亡率等情况时,要求样本总体呈现正态分布,若总体不满足正态分布,则需要足够多的样本量,然而临床样本量往往不能满足要求。近代非参数统计虽然不受样本分布限制,但是分辨率不高。为解决上述问题,我国预防医学科学院田凤调教授于1988年提出RSR法,融合了古典参数统计的数理优势和非参数统计的简易操作[22],用于解决各种医学领域评估问题。RSR法是将由n个评价对象,m个评价指标构成的矩阵,根据指标评分进行编秩,然后通过秩转换,得到无量纲统计值的RSR值,依据RSR值进行方案排序、分档[23],本质上是根据评价对象各评价指标的排序编号进行的再次排序。编秩是RSR法的关键步骤,分为整次RSR法和非整次RSR法。大多数研究采用整次RSR法,将N个指标评价结果从小到大排序,用1~N整数依次进行编秩,当同一指标数据相同时编平均秩[24],但这种方法会损失原指标的定量信息。非整次RSR法则将所编秩次与原指标之间构建线性对应关系,一定程度上可以保留原指标信息,提高结果准确性[25]。
1.1.2 方法应用
相比于SAW法,RSR法的编秩过程可以减少评价指标中极值对结果的影响,经过编秩,相邻两个评价对象指标得分最大不超过1。此外,在排序之后还能通过各评价对象概率单位对多方案进行分档,适用于原始数据形式不统一、需要进行等级划分的研究,因此RSR法在医疗服务质量评估[26-28]、卫生资源配置合理性评估[28-31]等领域广泛应用。黄延彪等[32]从能力、效率、质量维度对院内医师住院医疗服务进行综合评价,结果显示:采用SWA法排序的结果会出现方案综合排名靠前,但某一指标评分极低的现象;RSR法排序的结果则显示评价对象各评价指标单排序基本一致,排名在前的评价对象各评价指标得分均较高。有研究在进行医院手术科室风险分级时采用RSR法分档,可以按照实际需求确定所需要的分档级别数,根据最佳分档原则确定不同级别分级标准[33],相比于主观划分等级标准,更加科学、合理。
1.2 TOPSIS法
1.2.1 方法原理
1981年Hwang和Yoon首次提出TOPSIS法,是为解决决策者多准则决策而提出的一种接近于线性加权平均方法的排序法,最初用于个人生活选择、企业进行商业策略制定、公共资源配置、制定最优出行方案等需要进行多准则决策情形[34]。TOPSIS法首先需要对评价结果进行标化,得到由构成的矩阵,消除量纲影响,然后通过求解评价对象每一评价指标与理想解的接近程度,对其进行优先级排序。原理是当所选方案评价指标与理想解
的距离最短,并与负理想解
的距离最远时,最接近最优解。此外,在评价过程中,还考虑到指标权重
对结果的影响。该方法关键步骤是根据
和
求解相对值,因此,数据的单位和数量级不会对结果产生影响[35]。
1.2.2 方法应用
相比于SWA法、RSR法,TOPSIS法优势在于不需要对原始数据进行主观评分,也无需进行编秩,直接利用指标测量值,可以最大化保留数据信息。适用于对原始数据信息要求较高、数据形式不统一的研究。因此,常用于医疗绩效综合评估[36-38]。朱晓伟[39]基于DRG组数、CMI指数、费用指数、时间指数、DRG总量5种不同数据形式对医疗绩效进行综合排序,在充分利用原始数据的基础上,克服了传统评价指标数据形式单一的困难。另外,由于TOPSIS法不能进行方案分档,RSR法可能丢失原始数据信息,为避免以上两种方法缺陷,多数研究采用TOPSIS-RSR组合法[40-42]。吴晓凡[43]在进行医院科室分级时使用TOPSIS法对研究对象进行初步排序,然后基于CI值进行编秩,用RSR法分档原理完成医院服务质量分级。既实现了研究对象分类分档,又保留了原始数据信息。
1.3 ELECTRE法
1.3.1 方法原理
20世纪60年代,欧洲咨询公司SEMA在讨论是否发展新项目的决策问题时,在加权总和技术上遇到困难。为此,邀请数学家Roy作为顾问,设计出ELECTRE法,目的是在多个方案中选择最佳方案,随后经过迭代,已经形成ELECTRE-Ⅰ、ELECTRE-Ⅱ、ELECTRE-Ⅲ、ELECTRE-Ⅳ、ELECTRE-IS、ELECTRE-TRI等。常用于投资[44-46]、企业管理[47-50]领域。ELECTRE-Ⅰ根据方案之间差异是否超过阈值,进行和谐检验和不和谐检验,通过两两对比逐步剔除劣等方案,然而由于这种方法判断标准过于粗略,最终可能确定不只一个最优方案,因此ELETRE-Ⅱ被创立。ELETRE-Ⅱ通过增加预设标准,细化阈值范围,更多地保留了原始信息,实现了更好的排序。ELECTRE-Ⅲ引入可信度概念,以不和谐指数削弱和谐指数值,生成能够直接反映方案优先级别的净可信度。ELECTRE-Ⅳ优势在于不需要人为进行评价指标进行权重赋值,但是未保留ELETRE法使用和谐指数、不和谐指数的独特决策思路。ELECTRE-TRI主要用于方案分级或归类。
1.3.2 方法应用
ELETRE法最大的特点是可以解决指标之间互补性问题,即当备选方案因某一指标评分过高占据优势时,不会弥补其他指标评分过低产生的劣势,因此适用于对原始数据信息保留程度高,遴选各评价维度得分均高的研究。目前,医药领域逐渐使用ELECTRE法选择最佳方案[51-54]。ELETRE法与TOPSIS法都是基于原始数据两两之间相对值进行排序,但是ELETRE法避免了高分指标与低分指标之间的互补,还能对方案进行排序。李丽[55]曾通过比较决策者偏好效用函数与不同综合价值评估方法排序结果,发现相比于TOPSIS法,ELECTRE法排序结果与偏好效用函数一致性更高,可以更为准确地提供符合决策者偏好的方案。
2 药品价值整合方法的选择
2.1 遴选评价指标累积得分最高的方案
当药品临床综合评价需要遴选出所有评价指标得分之和最高的品种时,可以选择SWA法、TOPSIS法。SWA法更加简单易操作,能够获得各评价对象总得分,但是评价者的主观因素对结果影响较大;TOPSIS法可以减少评价者打分环节,一定程度上提高结论的客观性,并直接获得各方案与最优解相对接近程度,方便评价者进行决策。
2.2 遴选各评价维度均优的方案
当需要评选出各维度得分均高的品种时,可以选择RSR法、ELECTRE法。RSR法经过编秩,在一定程度上能够减少评价指标中极值对结果的影响,但计算过程中仍涉及到加权加和步骤,相比于ELECTRE法,结果会缺乏一定准确性。ELECTRE法运用和谐指数与非和谐指数理论避免指标得分互补,但是操作步骤相对复杂,对评价者要求高。
2.3 确定方案的推荐等级
当有多个方案进行综合排序,并需要确定推荐等级时,可以采用ELECTRE-TRI法、SWA法、TOPSIS-RSR法。ELECTRE-TRI法是在排序之前进行人为标准划分,一旦更改划分级数,则需重新计算,且无法保证不同研究分级标准一致。SWA法和TOPSIS-RSR组合法均是在评价对象排序结束后,确定等级标准,不同的是,SWA法是人为主观确定标准,TOPSIS-RSR组合法根据最佳分档原则,按照决策者要求获得不同级数分档标准,能够保证不同研究之间划分标准一致。

3 完善药品临床综合评价中价值整合的建议
3.1 使用组合法替代单一方法,弥补方法之间的缺陷
以上几种价值整合分析方法各有优缺点,方法原理和侧重点也都不同。建议进行药品临床综合评价时,采用多种模型同时对备选方案进行综合价值计算,相互验证,提高结果准确性[56-58];或者按照决策需求利用各方法之间的特点,不同阶段使用不同方法,例如TOPSIS-RSR分别在排序和分档阶段应用;或者使用FUZZY SET理论[25],加权不同方法排序结果,用不同权重下加权结果是否一致验证结果的稳定性。
3.2 开发药品临床综合评价操作软件,提高评价效率和准确率
本文介绍的三种价值整合分析方法操作过程相比SWA法略微复杂,尤其是ELECTRE法对研究者有着较高要求。相关研究人员、机构可以利用Python、Metlab等软件基于方法原理进行代码编写,开发药品临床综合评价应用软件,实现评价过程的简易操作。研究者在进行药品临床综合评价时,仅需输入备选方案各维度参数,即可快速确认最优方案,同时避免计算过程中产生的失误。
3.3 明确不同决策情形下评价标准及价值整合方法选择,规范综合评价步骤
指标体系是重要的评价工具,客观评价证据是基础的评价内容,评价结果整合分析是评价的关键环节。因此,建议相关指南或体系构建时,明确各评价维度不同等级或赋分标准,以及遴选药品时对综合价值的要求,提供最适合的价值整合分析方法。推动各种价值整合方法的应用,同时也尽量减少评价者主观因素对结果的影响。
临床综合评价是健全药品供应保障制度的具体要求,目前我国还处于初步探索阶段,仍有很多需要完善的环节[59]。除了本研究提到的综合价值评估缺乏准确性以外,还存在部分研究评价维度与《药品临床综合评价管理指南(2021年版试行)》要求不符的情形,或缺少对某一维度评价[60],或对其中一个维度进行更改[61]。为了提高药品规范科学使用管理水平,医疗机构、科研院所、行业学会等机构需不断完善药品临床综合评价体系,科学引导和规范临床综合评价在中国卫生决策领域的应用。本研究对综合评价中常用的综合价值评估方法进行了详细介绍,相关研究人员也应加大对综合价值评估方法的进一步探索,以提高我国临床综合评价研究综合评价结果的科学性、合理性、可靠性。