引用本文: 杨晓妍, 王觅也, 张睿, 李楠, 师庆科, 黄勇. 某三甲医院住院患者分类及费用影响因素分析. 中国循证医学杂志, 2015, 15(11): 1246-1253. doi: 10.7507/1672-2531.20150206 复制
新医改推进以来,“看病难、看病贵”背后的诸多问题仍未得到有效解决 [1-5]。作为改革重中之重的公立医院,如何在保证医疗服务质量的同时合理控费,以应对补偿机制与支付方式的改革 [6-12],是摆在医院管理者面前的重要命题。另一方面,大数据时代的到来及医院信息系统(HIS)的建设完善为医疗服务数据挖掘提供了可能。系统中保存着的丰富数据既是患者诊治过程的重要资料,又蕴含着可服务于医院管理、医疗服务或学科发展的宝贵信息,但这些数据格式不一、质量有别,需经合理抽取、清洗、转换、分析后方能很好地利用。本研究以住院患者诊疗数据为研究对象,分析基于住院费用的患者分类、病种分布及费用影响因素,以期为进一步研究病例组合积累基础数据,并为费用控制与病种管理提供依据。
1 资料与方法
1.1 资料来源
本研究所有资料来自某三甲医院2013年HIS记录的全年住院患者诊疗数据。
1.2 研究内容
住院费用情况及其分布,住院患者分类和病种分布情况以及住院费用的影响因素。
1.3 统计分析
采用EXCEL 2010收集整理数据,并对录入资料进行逻辑检错,保证数据的准确性。采用SPSS 16.0和STATA 12.0软件进行统计分析。用百分位数(中位数及四分位数)描述住院费用分布情况;用K-均值聚类法进行患者分类并分析影响该分类的费用类别;用秩和检验(Kruskal-Wallis H检验)分析各类患者住院费用的差异;基于国际疾病分类第十次修订本(ICD-10)进行病种分析;用中位数回归分析住院费用的影响因素。
2 结果
2.1 住院费用情况
全年总住院人次175 333例。总费用均数19 370.21元,中位数10 016.31元,四分位数间距15 791.06元(5 527.05元~21 318.11元)。基于核算字典表,将住院费用分为12类,分别为:治疗费用(包括治疗费、放疗费、输氧费)、检查费用(包括检查费、病理、测查费)、影像费用(包括CT费、磁共振、放射费、核医学、造影费)、诊察费用(包括会诊费、诊查费、出诊费)、材料费用(包括材料费、术材料、放材料、麻材料、血材料)、床位费用(包括床位费、冷暖费)、护理费用(包括护理费、监护费)、化验费用(包括化验费、配血检)、手术费用(包括介入费、麻醉费、手术费、术设备)、药品费用(包括西药费、中药费)、输血费用(包括输血费)和其他费用(包括膳食费),各类住院费用分布情况见表 1。

2.2 住院患者分类情况
2.2.1 数据准备
表 1可见,各类费用均数和中位数差异较大。经检验,费用合计为正偏态分布(偏度系数6.851,P<0.001),12类费用均不符合正态(P<0.001)。此外,尽管各类费用量纲相同,但取值差异很大,而K-均值聚类法无法自动对数据进行标准化。因此,首先对12类费用进行标准化处理后纳入后续分析。对费用分别取常用对数后做P-P图,正态性明显改善,以治疗收入为例,见图 1。

2.2.2 预聚类
由于缺乏住院患者分类类别数的经验数据,本研究首先尝试了不同类别数设定下的分类情况。发现有无“输血费用”对分类影响极大,有“输血费用”类共37例住院患者,该类患者占全年住院患者总数的比重极小。当分类数设定少于11类时,类别数的增加主要是对37例患者的进一步细分,而占比很大的无“输血费用”类病例基本无变化;当分类数设定达11类后,无“输血费用”类病例才会得到细分。
2.2.3 正式聚类
按有无“输血费用”先将患者分为两组,分别对两组进行聚类。在无“输血费用”组,进一步将患者分为五类(类别编码1-5),在有“输血费用”组,进一步将患者分为两类(类别编码6-7)。
由表 2可知,各类患者分别可概括为:第1类,无输血费用组无手术高费用类;第2类,无输血费用组有手术高费用类;第3类,无输血费用组无手术低费用类;第4类,无输血费用组有手术低费用类;第5类,无输血费用组有手术中费用类;第6类,有输血费用组低费用类,第7类,有输血费用组高费用类(图 2)。


图 2为7类患者示意图。以有无输血费用为横轴,以有无手术费用为纵轴将平面分为四个象限,圆球的大小代表住院人次,圆球的位置代表费用合计的高低。为了在较小面积内清晰显示所有圆球,将第6类和第7类的样本量分别扩大了10倍;而圆球的位置只是同一象限内费用合计相对高低的示意,不代表其间的实际数量关系。进一步分析各费用类别对患者分类的影响,结果见表 3、表 4。


无输血费用患者各类费用对患者分类均有意义(P<0.001),其中影响前三位的费用分别为手术费用、化验费用和诊察费用(表 3)。有输血费用患者对患者分类有意义的费用类别分别为输血费用、化验费用和诊察费用,影响依次降低(P<0.05);可能有影响的有治疗费用和护理费用(P值接近0.05)(表 4)。
2.3 病种分析
基于上述7种患者分类,分析其病种分布情况。第1~7类的病种数(ICD-10亚目即四位编码)分别为2 147种(住院人次44 607)、2 182种(住院人次41 287)、1 499种(住院人次26 370)、1 301种(住院人次22 011)、2 059种(住院人次41 019)、22种(住院人次22)和14种(住院人次15)。将各类患者全年住院人次分别从高到低排序,前5位病种情况见表 5。

7类患者病种分布有交叉,同一病种所属患者类别数越多,表明该病种费用变异越大,或者说,整个治疗过程的变异越大。限于篇幅,表 5仅列出了各类患者住院人次前5位的病种,若将其展示完整,可得到各类患者所有ICD-10亚目病种的分布。将病种上归一级到ICD-10类目(三位编码),分析前50%的病种可知,2个及以上患者类别的有60种,分别是:带状疱疹(B02)、慢性病毒性肝炎(B18)、食管恶性肿瘤(C15)、胃恶性肿瘤(C16)、直肠恶性肿瘤(C20)、肝和肝内胆管恶性肿瘤(C22)、胆道其他和未特指部位的恶性肿瘤(不包括肝内胆管,C24)、支气管和肺恶性肿瘤(C34)、肾(除外肾盂)恶性肿瘤(C64)、甲状腺恶性肿瘤(C73)、弥漫性非霍奇金淋巴瘤(C83)、多发性骨髓瘤和恶性浆细胞肿瘤(C90)、淋巴样细胞白血病(C91)、髓样白血病(C92)、血管瘤和淋巴管瘤,任何部位(D18)、脑脊膜良性肿瘤(D32)、内分泌腺其他和未特指良性肿瘤(D35)、非胰岛素依赖型糖尿病(E11)、精神分裂症(F20)、老年性白内障(H25)、其他白内障(H26)、视网膜脱离和断裂(H33)、多个心瓣膜疾病(I08)、心绞痛(I20)、急性心肌梗死(I21)、慢性缺血性心脏病(I25)、阵发性心动过速(I47)、心房纤颤和扑动(I48)、蛛网膜下出血(I60)、脑内出血(I61)、脑梗死(I63)、肺炎,病原体未特指(J18)、声带和喉疾病,不可归类在他处者(J38)、其他慢性阻塞性肺病(J44)、其他呼吸性疾患(J98)、急性阑尾炎(K35)、腹股沟疝(K40)、麻痹性肠梗阻和不伴有疝的肠梗阻(K56)、肝纤维化和肝硬变(K74)、肝的其他疾病(K76)、胆石症(K80)、急性胰腺炎(K85)、消化系统的其他疾病(K92)、膝关节病(M17)、系统性红斑狼疮(M32)、骨质疏松伴有病理性骨折(M80)、肾病综合征(N04)、梗阻性和反流性尿路病(N13)、慢性肾衰竭(N18)、肾和输尿管结石(N20)、前列腺增生(N40)、心间隔先天性畸形(Q21)、睾丸未降(Q53)、中枢神经系统诊断性影像检查的异常所见(R90)、颅内损伤(S06)、股骨骨折(S72)、躯干烧伤和腐蚀伤(T21)、操作并发症,不可归类在他处者(T81)、其他矫形外科的随诊医疗(Z47)、其他医疗照顾(Z51,如放射治疗疗程、为肿瘤化学治疗疗程)。
2.4 住院费用的影响因素分析
由于数据来源于HIS,变量繁多且完整性参差不齐,在进行影响因素分析前先对各变量进行梳理:对反映同一主题的变量,选择数据缺失少、逻辑错误少的指标来代表该因素,如抗生素使用类变量、呼吸机使用类变量等;结合国家相关管理要求与临床实践重建相关变量,如基于使用一线、二线、三线、四线抗生素产生新变量“治疗使用二线及以上抗生素”;对取值分类太多且无必要分析所有类别或分类过细导致某些类别样本量过少的变量进行两分类处理,如将现住址分为市内外、省内外,将国籍分为国内外等,然后用中位数回归方法分析可能影响费用合计的因素。以住院总费用为因变量,以各相关因素(表 6)为自变量进行中位数回归,先进行单因素分析,对单因素分析有意义的变量进行多因素分析(逐步回归)。表 6是单因素分析结果,表 7是多因素分析结果。表 6可见,除民族外各变量均有统计学意义(P<0.001)。单因素分析结果有意义的变量纳入多因素分析时,仅“国籍”变量未进入最终模型。表 7可见,使费用增加的因素包括:年龄增加、住院天数增加、门急诊与出院诊断不吻合、省内患者、市外患者、男性患者、已婚或其他(离异、丧偶等)、有转科、非现金付费方式、出院时除主诊断外有其他诊断、有手术、有抢救、死亡患者、使用过呼吸机、治疗使用过二线及以上抗生素、由其他医疗机构转入的患者。上述因素可概括为患者相关因素和诊治相关因素两大类。患者相关因素包括年龄、性别、婚姻状况、住址,诊治相关因素为上述其余变量。


3 讨论
本研究采用的K-均值聚类法是最常用的非层次聚类法,该方法分析得到的结果能较好地区分影响住院费用的最主要特征,且各类患者费用差异存在统计学意义。有研究表明,K-均值聚类法能较好地将患者分类并用于后续处理,具有良好的应用性 [13]。但K-均值聚类法的缺点在于需要自定义类别数。本研究通过反复尝试,最终将患者分成了7类,各类患者可以用3个费用维度来粗略地定义其特征:即是否有输血费用、是否有手术费用及总费用高低。对于无输血费用的第1~5类患者,各类费用对分类的影响均有统计学意义,其中手术费用的影响最大,其次是化验和诊察费用;对有输血费用的第6、7类患者,对分类有意义的变量分别为输血费用、化验费用和诊察费用,可能有影响的有治疗费用和护理费用。有输血费用的37例患者中33例输过Rh阴性红细胞悬液,其余4例输过病毒灭活血浆。可见,除输血、手术费用外,化验和诊察费用是影响患者分类的重要因素,上述费用类别是进行费用控制时需着重考虑的方面。
本研究基于费用将患者进行分类,并对各类患者的病种分布进行了描述。从病种分布看,第6、7类患者病种数较少,与这两类患者总数很少相一致。这两类患者中89%输注了Rh阴性红细胞悬液。在汉族及大多数民族人群中,Rh阴性血型约占0.4%或略高 [14, 15],Rh阴性血来源困难,需支付输血费用。此外,由表 2可知,这两类患者各类费用均较高,尤其是治疗、材料、护理、化验和药品费用。这两类患者罹患的病种主要是某些恶性肿瘤及个别循环、呼吸、消化、泌尿系统疾病及严重创伤等,可为医院高额病种管理的病种选择提供参考,同时为Rh血型与疾病的相关性研究提供线索。本研究提示,分布于2类及以上患者的类目病种有60种,这种临床变异可能是由于疾病本身的特性所致,或者是收治住院患者本身的差异较大,或者是主要用于人群疾病统计上报的ICD-10在临床的适用性欠佳,有待进一步研究。当然,由于数据涵盖全年各科近20万病例且分类仅基于费用且分组数很少,对由很多因素决定的病种分组区分度欠佳是可能的,从学界用500至1 000余种疾病诊断相关组(diagnostic related groups,DRGs)来区分各病种就比较好理解这一点。尽管如此,本研究基于费用的患者分类可以提示我们,从管理上加大力度提高诊治的一致性可减少临床处置及费用的差异,同时,可为临床路径病种选择及路径管理提供参考。这种疾病与治疗过程本身的个体化、差异化特征提示我们,应加强医院战略定位的宣传与分级医疗及双向转诊,尽量收治与医院定位目标相一致的患者;同时加强指南学习、促进医护技合作,尽量较少诊治过程的变异以规范诊疗、降低风险,同时注意特殊病例的个体化治疗。
关于费用影响因素分析:中位数回归参数估计采用最小一乘准则,最小一乘思想的提出远比最小二乘早,但由于计算复杂并未得到普遍应用 [16]。由于费用合计呈偏态分布且存在极端值,本研究采用中位数回归分析费用影响因素,以避免数据不满足模型条件时最小二乘法模型稳健性受影响而得到不同程度偏离真值的整体拟合结果 [17, 18]。影响费用的多因素分析结果提示,现住址这个因素,住院治疗的市外患者费用高于市内患者、省内患者高于省外患者。疾病复杂程度与轻重缓急、就诊距离及医院技术实力等会影响患者的就医选择(数据显示市内患者占所有患者的40.9%,省外患者仅占所有患者的7.9%),可造成不同疾病及其严重程度的患者分布不均衡,同时也提示我们对患者来源地及病种的进一步分析可帮助明确医院及其各临床科室提供服务的辐射区域。需要指出的是,本研究分析的数据是全院各科病例,且是基于HIS的回顾性业务数据,相关因素只能是普适性变量且可用数量有限、完整性参差不齐,今后可结合各科专病数据库开展进一步分析。
本研究的局限性:① 本研究是在医改前提下开展,尚未形成成熟医疗费用支付模式,因此,医疗信息系统、医疗编码系统及标准数据库等还有待基于支付方式作进一步完善。② 本研究仅是基于一家医院的初步尝试,未收集到各病种所有特异及非特异性因素,亦未尝试与比较多种统计方法,需要进一步开展相关研究进行探讨。
总之,本研究尝试利用HIS进行数据挖掘。其结果表明,所得患者分类能较好地解释其重要特征及费用差异,为不同患者各类费用的控制提供依据;基于患者分类的病种分析为病种管理提供参考;住院费用的影响因素分析为患者收治与诊治管理提供信息。
新医改推进以来,“看病难、看病贵”背后的诸多问题仍未得到有效解决 [1-5]。作为改革重中之重的公立医院,如何在保证医疗服务质量的同时合理控费,以应对补偿机制与支付方式的改革 [6-12],是摆在医院管理者面前的重要命题。另一方面,大数据时代的到来及医院信息系统(HIS)的建设完善为医疗服务数据挖掘提供了可能。系统中保存着的丰富数据既是患者诊治过程的重要资料,又蕴含着可服务于医院管理、医疗服务或学科发展的宝贵信息,但这些数据格式不一、质量有别,需经合理抽取、清洗、转换、分析后方能很好地利用。本研究以住院患者诊疗数据为研究对象,分析基于住院费用的患者分类、病种分布及费用影响因素,以期为进一步研究病例组合积累基础数据,并为费用控制与病种管理提供依据。
1 资料与方法
1.1 资料来源
本研究所有资料来自某三甲医院2013年HIS记录的全年住院患者诊疗数据。
1.2 研究内容
住院费用情况及其分布,住院患者分类和病种分布情况以及住院费用的影响因素。
1.3 统计分析
采用EXCEL 2010收集整理数据,并对录入资料进行逻辑检错,保证数据的准确性。采用SPSS 16.0和STATA 12.0软件进行统计分析。用百分位数(中位数及四分位数)描述住院费用分布情况;用K-均值聚类法进行患者分类并分析影响该分类的费用类别;用秩和检验(Kruskal-Wallis H检验)分析各类患者住院费用的差异;基于国际疾病分类第十次修订本(ICD-10)进行病种分析;用中位数回归分析住院费用的影响因素。
2 结果
2.1 住院费用情况
全年总住院人次175 333例。总费用均数19 370.21元,中位数10 016.31元,四分位数间距15 791.06元(5 527.05元~21 318.11元)。基于核算字典表,将住院费用分为12类,分别为:治疗费用(包括治疗费、放疗费、输氧费)、检查费用(包括检查费、病理、测查费)、影像费用(包括CT费、磁共振、放射费、核医学、造影费)、诊察费用(包括会诊费、诊查费、出诊费)、材料费用(包括材料费、术材料、放材料、麻材料、血材料)、床位费用(包括床位费、冷暖费)、护理费用(包括护理费、监护费)、化验费用(包括化验费、配血检)、手术费用(包括介入费、麻醉费、手术费、术设备)、药品费用(包括西药费、中药费)、输血费用(包括输血费)和其他费用(包括膳食费),各类住院费用分布情况见表 1。

2.2 住院患者分类情况
2.2.1 数据准备
表 1可见,各类费用均数和中位数差异较大。经检验,费用合计为正偏态分布(偏度系数6.851,P<0.001),12类费用均不符合正态(P<0.001)。此外,尽管各类费用量纲相同,但取值差异很大,而K-均值聚类法无法自动对数据进行标准化。因此,首先对12类费用进行标准化处理后纳入后续分析。对费用分别取常用对数后做P-P图,正态性明显改善,以治疗收入为例,见图 1。

2.2.2 预聚类
由于缺乏住院患者分类类别数的经验数据,本研究首先尝试了不同类别数设定下的分类情况。发现有无“输血费用”对分类影响极大,有“输血费用”类共37例住院患者,该类患者占全年住院患者总数的比重极小。当分类数设定少于11类时,类别数的增加主要是对37例患者的进一步细分,而占比很大的无“输血费用”类病例基本无变化;当分类数设定达11类后,无“输血费用”类病例才会得到细分。
2.2.3 正式聚类
按有无“输血费用”先将患者分为两组,分别对两组进行聚类。在无“输血费用”组,进一步将患者分为五类(类别编码1-5),在有“输血费用”组,进一步将患者分为两类(类别编码6-7)。
由表 2可知,各类患者分别可概括为:第1类,无输血费用组无手术高费用类;第2类,无输血费用组有手术高费用类;第3类,无输血费用组无手术低费用类;第4类,无输血费用组有手术低费用类;第5类,无输血费用组有手术中费用类;第6类,有输血费用组低费用类,第7类,有输血费用组高费用类(图 2)。


图 2为7类患者示意图。以有无输血费用为横轴,以有无手术费用为纵轴将平面分为四个象限,圆球的大小代表住院人次,圆球的位置代表费用合计的高低。为了在较小面积内清晰显示所有圆球,将第6类和第7类的样本量分别扩大了10倍;而圆球的位置只是同一象限内费用合计相对高低的示意,不代表其间的实际数量关系。进一步分析各费用类别对患者分类的影响,结果见表 3、表 4。


无输血费用患者各类费用对患者分类均有意义(P<0.001),其中影响前三位的费用分别为手术费用、化验费用和诊察费用(表 3)。有输血费用患者对患者分类有意义的费用类别分别为输血费用、化验费用和诊察费用,影响依次降低(P<0.05);可能有影响的有治疗费用和护理费用(P值接近0.05)(表 4)。
2.3 病种分析
基于上述7种患者分类,分析其病种分布情况。第1~7类的病种数(ICD-10亚目即四位编码)分别为2 147种(住院人次44 607)、2 182种(住院人次41 287)、1 499种(住院人次26 370)、1 301种(住院人次22 011)、2 059种(住院人次41 019)、22种(住院人次22)和14种(住院人次15)。将各类患者全年住院人次分别从高到低排序,前5位病种情况见表 5。

7类患者病种分布有交叉,同一病种所属患者类别数越多,表明该病种费用变异越大,或者说,整个治疗过程的变异越大。限于篇幅,表 5仅列出了各类患者住院人次前5位的病种,若将其展示完整,可得到各类患者所有ICD-10亚目病种的分布。将病种上归一级到ICD-10类目(三位编码),分析前50%的病种可知,2个及以上患者类别的有60种,分别是:带状疱疹(B02)、慢性病毒性肝炎(B18)、食管恶性肿瘤(C15)、胃恶性肿瘤(C16)、直肠恶性肿瘤(C20)、肝和肝内胆管恶性肿瘤(C22)、胆道其他和未特指部位的恶性肿瘤(不包括肝内胆管,C24)、支气管和肺恶性肿瘤(C34)、肾(除外肾盂)恶性肿瘤(C64)、甲状腺恶性肿瘤(C73)、弥漫性非霍奇金淋巴瘤(C83)、多发性骨髓瘤和恶性浆细胞肿瘤(C90)、淋巴样细胞白血病(C91)、髓样白血病(C92)、血管瘤和淋巴管瘤,任何部位(D18)、脑脊膜良性肿瘤(D32)、内分泌腺其他和未特指良性肿瘤(D35)、非胰岛素依赖型糖尿病(E11)、精神分裂症(F20)、老年性白内障(H25)、其他白内障(H26)、视网膜脱离和断裂(H33)、多个心瓣膜疾病(I08)、心绞痛(I20)、急性心肌梗死(I21)、慢性缺血性心脏病(I25)、阵发性心动过速(I47)、心房纤颤和扑动(I48)、蛛网膜下出血(I60)、脑内出血(I61)、脑梗死(I63)、肺炎,病原体未特指(J18)、声带和喉疾病,不可归类在他处者(J38)、其他慢性阻塞性肺病(J44)、其他呼吸性疾患(J98)、急性阑尾炎(K35)、腹股沟疝(K40)、麻痹性肠梗阻和不伴有疝的肠梗阻(K56)、肝纤维化和肝硬变(K74)、肝的其他疾病(K76)、胆石症(K80)、急性胰腺炎(K85)、消化系统的其他疾病(K92)、膝关节病(M17)、系统性红斑狼疮(M32)、骨质疏松伴有病理性骨折(M80)、肾病综合征(N04)、梗阻性和反流性尿路病(N13)、慢性肾衰竭(N18)、肾和输尿管结石(N20)、前列腺增生(N40)、心间隔先天性畸形(Q21)、睾丸未降(Q53)、中枢神经系统诊断性影像检查的异常所见(R90)、颅内损伤(S06)、股骨骨折(S72)、躯干烧伤和腐蚀伤(T21)、操作并发症,不可归类在他处者(T81)、其他矫形外科的随诊医疗(Z47)、其他医疗照顾(Z51,如放射治疗疗程、为肿瘤化学治疗疗程)。
2.4 住院费用的影响因素分析
由于数据来源于HIS,变量繁多且完整性参差不齐,在进行影响因素分析前先对各变量进行梳理:对反映同一主题的变量,选择数据缺失少、逻辑错误少的指标来代表该因素,如抗生素使用类变量、呼吸机使用类变量等;结合国家相关管理要求与临床实践重建相关变量,如基于使用一线、二线、三线、四线抗生素产生新变量“治疗使用二线及以上抗生素”;对取值分类太多且无必要分析所有类别或分类过细导致某些类别样本量过少的变量进行两分类处理,如将现住址分为市内外、省内外,将国籍分为国内外等,然后用中位数回归方法分析可能影响费用合计的因素。以住院总费用为因变量,以各相关因素(表 6)为自变量进行中位数回归,先进行单因素分析,对单因素分析有意义的变量进行多因素分析(逐步回归)。表 6是单因素分析结果,表 7是多因素分析结果。表 6可见,除民族外各变量均有统计学意义(P<0.001)。单因素分析结果有意义的变量纳入多因素分析时,仅“国籍”变量未进入最终模型。表 7可见,使费用增加的因素包括:年龄增加、住院天数增加、门急诊与出院诊断不吻合、省内患者、市外患者、男性患者、已婚或其他(离异、丧偶等)、有转科、非现金付费方式、出院时除主诊断外有其他诊断、有手术、有抢救、死亡患者、使用过呼吸机、治疗使用过二线及以上抗生素、由其他医疗机构转入的患者。上述因素可概括为患者相关因素和诊治相关因素两大类。患者相关因素包括年龄、性别、婚姻状况、住址,诊治相关因素为上述其余变量。


3 讨论
本研究采用的K-均值聚类法是最常用的非层次聚类法,该方法分析得到的结果能较好地区分影响住院费用的最主要特征,且各类患者费用差异存在统计学意义。有研究表明,K-均值聚类法能较好地将患者分类并用于后续处理,具有良好的应用性 [13]。但K-均值聚类法的缺点在于需要自定义类别数。本研究通过反复尝试,最终将患者分成了7类,各类患者可以用3个费用维度来粗略地定义其特征:即是否有输血费用、是否有手术费用及总费用高低。对于无输血费用的第1~5类患者,各类费用对分类的影响均有统计学意义,其中手术费用的影响最大,其次是化验和诊察费用;对有输血费用的第6、7类患者,对分类有意义的变量分别为输血费用、化验费用和诊察费用,可能有影响的有治疗费用和护理费用。有输血费用的37例患者中33例输过Rh阴性红细胞悬液,其余4例输过病毒灭活血浆。可见,除输血、手术费用外,化验和诊察费用是影响患者分类的重要因素,上述费用类别是进行费用控制时需着重考虑的方面。
本研究基于费用将患者进行分类,并对各类患者的病种分布进行了描述。从病种分布看,第6、7类患者病种数较少,与这两类患者总数很少相一致。这两类患者中89%输注了Rh阴性红细胞悬液。在汉族及大多数民族人群中,Rh阴性血型约占0.4%或略高 [14, 15],Rh阴性血来源困难,需支付输血费用。此外,由表 2可知,这两类患者各类费用均较高,尤其是治疗、材料、护理、化验和药品费用。这两类患者罹患的病种主要是某些恶性肿瘤及个别循环、呼吸、消化、泌尿系统疾病及严重创伤等,可为医院高额病种管理的病种选择提供参考,同时为Rh血型与疾病的相关性研究提供线索。本研究提示,分布于2类及以上患者的类目病种有60种,这种临床变异可能是由于疾病本身的特性所致,或者是收治住院患者本身的差异较大,或者是主要用于人群疾病统计上报的ICD-10在临床的适用性欠佳,有待进一步研究。当然,由于数据涵盖全年各科近20万病例且分类仅基于费用且分组数很少,对由很多因素决定的病种分组区分度欠佳是可能的,从学界用500至1 000余种疾病诊断相关组(diagnostic related groups,DRGs)来区分各病种就比较好理解这一点。尽管如此,本研究基于费用的患者分类可以提示我们,从管理上加大力度提高诊治的一致性可减少临床处置及费用的差异,同时,可为临床路径病种选择及路径管理提供参考。这种疾病与治疗过程本身的个体化、差异化特征提示我们,应加强医院战略定位的宣传与分级医疗及双向转诊,尽量收治与医院定位目标相一致的患者;同时加强指南学习、促进医护技合作,尽量较少诊治过程的变异以规范诊疗、降低风险,同时注意特殊病例的个体化治疗。
关于费用影响因素分析:中位数回归参数估计采用最小一乘准则,最小一乘思想的提出远比最小二乘早,但由于计算复杂并未得到普遍应用 [16]。由于费用合计呈偏态分布且存在极端值,本研究采用中位数回归分析费用影响因素,以避免数据不满足模型条件时最小二乘法模型稳健性受影响而得到不同程度偏离真值的整体拟合结果 [17, 18]。影响费用的多因素分析结果提示,现住址这个因素,住院治疗的市外患者费用高于市内患者、省内患者高于省外患者。疾病复杂程度与轻重缓急、就诊距离及医院技术实力等会影响患者的就医选择(数据显示市内患者占所有患者的40.9%,省外患者仅占所有患者的7.9%),可造成不同疾病及其严重程度的患者分布不均衡,同时也提示我们对患者来源地及病种的进一步分析可帮助明确医院及其各临床科室提供服务的辐射区域。需要指出的是,本研究分析的数据是全院各科病例,且是基于HIS的回顾性业务数据,相关因素只能是普适性变量且可用数量有限、完整性参差不齐,今后可结合各科专病数据库开展进一步分析。
本研究的局限性:① 本研究是在医改前提下开展,尚未形成成熟医疗费用支付模式,因此,医疗信息系统、医疗编码系统及标准数据库等还有待基于支付方式作进一步完善。② 本研究仅是基于一家医院的初步尝试,未收集到各病种所有特异及非特异性因素,亦未尝试与比较多种统计方法,需要进一步开展相关研究进行探讨。
总之,本研究尝试利用HIS进行数据挖掘。其结果表明,所得患者分类能较好地解释其重要特征及费用差异,为不同患者各类费用的控制提供依据;基于患者分类的病种分析为病种管理提供参考;住院费用的影响因素分析为患者收治与诊治管理提供信息。