随着区域医疗大数据平台的建立和不断完善,区域医疗大数据在医药政策研究评价中越来越凸显出重要的作用。区域医疗大数据通常具有层次结构,传统的统计分析模型因不能处理层次结构的数据而受到限制,多水平模型是处理层次结构数据的有力统计分析工具,近年来受到国外政策评价研究者的广泛关注,而国内缺乏其在医药政策评价中的应用。本文介绍了多水平模型构建的总体思路及其在医药政策评价领域中的几种常见应用场景,以期为未来利用区域医疗大数据或层次结构数据评价医疗政策实施效果提供方法学参考。
引用本文: 任燕, 黄云香, 仉元瑾, 姚明宏, 贾玉龙, 杨珉, 孙鑫. 多水平模型及其在医药政策评价研究领域的应用. 中国循证医学杂志, 2021, 21(12): 1474-1479. doi: 10.7507/1672-2531.202108101 复制
多水平模型(multilevel models)是基于多水平数据(层次结构数据)发展和应用起来的统计分析方法[1]。因学科领域的不同,多水平模型在不同领域的叫法存在差异,例如在社会学研究领域中,多水平模型被称为层次线性模型(hierarchical linear models);在生物统计领域被称为混合效应模型(mixed-effect models)或随机效应模型(random-effect models),在计量经济学领域被称为随机系数模型(random coefficient models)[2]。多水平模型最先应用于教育学领域,因多水平模型对不同层次数据处理具有统计学优势,近年来在心理学、社会学、经济学、组织行为与管理科学、医学和公共卫生等领域均得到了广泛的应用。
传统的医药政策评价研究中,多采用调查的方式,收集的数据量有限且很少存在层次结构,数据为单水平结构,此时传统的统计方法即可用于政策实施效果评价。在医药政策评价研究中,若数据具有层次或聚类结构,如采用全国基层医疗机构数据评价基本药物制度实施效果的研究,其数据的多层次结构表现为县嵌套于市,市嵌套于省,省嵌套于国家或地区[3],此时传统统计模型因不能处理具有层次结构的数据,不再适用于此类研究。近几年,随着区域医疗大数据的发展与可及(如天津、济南、厦门区域医疗大数据等),区域医疗大数据在政策评价研究中的运用越来越凸显。而区域医疗大数据通常具有医疗机构嵌套于区,区嵌套于市的层次结构,这种具有层次机构的数据在同一层次内具有较高的相似性、不同层次具有较强的异质性,亟需创新研究方法从不同角度评价医药政策实施的效果[4]。
在医药政策效果评价中,针对多层次结构数据,采用多水平统计方法对政策实施效果进行统计分析,已成为方法学研究的热点。近年来,国内外相关学者开始探索多水平模型用于医药政策的评价,如美国、加拿大、瑞典、我国已有学者采用多水平间断时间序列模型(interrupted time-series,ITS)、多水平双重差分模型(difference-in-difference,DID)和多水平重复测量模型评价政策的实施效果[5-9]。国内尚缺乏有关多水平模型在医药政策评价领域的方法学介绍和情景分析,鉴于此,本文介绍多水平模型建模的总体思路及其在医药政策评价研究中的几种常见应用场景,以期为未来利用区域医疗大数据评价政策实施效果提供方法学参考。
1 多水平模型的数据结构类型
多水平数据指观测数据在单位上具有嵌套的关系,如患者嵌套于医院,医院嵌套于地区,形成了三水平的数据结构,三水平数据结构示意图见图1,箭头方向表示低水平单元嵌套于高水平单元内。若只存在患者嵌套于医院时,三水平数据结构就变成了两水平的数据结构。

2 传统线性模型与两水平线性模型的差异性分析
现以简单的传统线性模型与两水平线性模型为例,介绍多水平统计分析模型的原理。
传统线性模型的模型设定:
![]() |
两水平线性模型的模型设定:
![]() |
表达式中:i指水平1单位,如患者;j为水平1所属的水平2单位,如医院,为
在水平2的随机效应,
为水平1的残差,即随机误差。图2中的
表示传统线性模型所获得的总均值,
、
、
表示两水平线性模型中水平2单位的均值。从传统线性模型与两水平线性模型表达式及其残差示意图2可以清晰的发现,两水平线性模型可将残差进行分解为一水平的残差和二水平的残差,如果二水平的残差
为0,则可直接采用传统线性模型,如果二水平的残差
不为0,则应该采用两水平线性模型。

3 多水平模型建模总体思路
根据研究者的目的和数据资料的情况不同,多水平模型存在不同类型,如:多水平线性回归、多水平logistic回归、多水平poisson回归、多水平Cox回归、多元多水平模型、多水平交叉分类模型、多水平样条函数模型、多水平结构方程模型等。多水平模型虽然存在不同类型,但其建模的总体思路是类似的,如图3。以构建两水平线性模型为例,首先建立仅包含随机截距项的两水平的空模型,对空模型中的两水平的方差进行检验,若该检验结果有统计学意义,说明存在两水平的层次结构,进一步构建随机截距模型,即在空模型中加入固定效应的自变量,若想进一步估计随机截距模型中自变量的随机效应,则需构建随机系数模型,若进一步考虑加入两水平的自变量,则形成了全模型。

3.1 构建空模型
空模型中只包含截距项,不包含任何自变量。多水平模型的空模型与传统回归模型的区别在于截距项,传统回归模型中的截距项为固定变量,即总均值只有一个,是固定的,不会在水平2上存在变化,而多水平模型的空模型中的截距项为随机效应,即总体均值在不同的水平存在变异,如水平2有5家医院,可得到5家医院不同的均值。两水平线性空模型的模型设定为:
![]() |
![]() |
![]() |
表达式中:i指水平1单位,如患者;j为水平1所属的水平2单位,如医院;为
的总平均,
为
在水平2的残差,即
在水平2的随机效应,代表组间变异;
为水平1的残差,即随机误差,代表组内变异;
为组间方差,
为组内方差,对其进行假设检验,若假设检验发现其存在差异,则应采用两水平模型。
3.2 构建随机截距模型
随机截距模型是在上述空模型的基础上加入水平1的变量,且自变量是固定效应。假设只纳入水平1单位1个自变量,随机截距模型表达为:
![]() |
表达式中:为加入的水平1自变量,
为
对y的固定效应。
3.3 构建随机系数模型
随机系数模型是在随机截距模型的基础上考虑自变量的随机效应。随机系数模型表达为:
![]() |
![]() |
![]() |
表达式中:为
对y的平均效应,
为
的随机效应,通过对随机效应
的方差系数
进行假设检验,可以发现两水平各单元的效应分布,如两水平各个医院的效应分布,通过对随机效应
进行排序,可判断两水平的哪个单元效应最高或最低。
3.4 全模型
全模型即在随机系数模型中进一步加入水平2的自变量。假设只纳入水平2的1个自变量,全模型表达为:
![]() |
表达式中:为加入的水平2自变量,
为
对y的固定效应,由于
是水平2的自变量,所以不能构建其随机效应。
以上为两水平模型的构建总体思路,该思路可以扩展到三水平及以上水平的模型,同时结局变量类型是二分类或者事件发生数等也适用。
4 多水平模型在医药政策实施效果评价领域的几种常见应用场景
多水平模型在医药政策实施效果评价领域可以应用但不限于以下几种常见的场景,以评价基本药物制度的实施效果为例进行介绍各种场景,其因变量为基层医疗卫生机构的服务量。研究数据均是全省的基层医疗卫生机构,则同一个县中的基层医疗卫生机构的服务量可能更为接近,这就造成了数据间不独立,从而需在传统的模型基础上考虑多水平的数据结构,采用对应的多水平模型。
4.1 多水平ITS模型评价基本药物制度实施对基层医疗卫生机构服务量的影响
4.1.1 研究问题
评价基本药物制度实施前后基层医疗卫生机构服务量的变化趋势,评估政策干预对基层医疗卫生机构服务量的影响。
4.1.2 研究设计
研究设计为某个省实施前和实施后基层医疗卫生机构多次重复测量的数据,如2008年未实施基本药物制度,2009年实施了基本药物制度,2008年和2009年每个月均测量了基层医疗卫生机构的服务量。该研究只有一个省份数据,没有其他省份作为对照。
4.2.3 多水平ITS
针对4.1.1研究问题和4.1.2研究设计,需采用多水平ITS,其模型基本表达式如下:
![]() |
![]() |
![]() |
该模型不同于传统的ITS,考虑了数据的层次结构,即考虑了不同测量时间点在同一医疗机构水平的聚集性,模型中变量是指基层医疗卫生机构i在时间点t处的服务量;
是一个连续变量,指从时间序列起始处计算的时间点t;
是一个虚拟变量,政策实施前则取0,政策实施后则取1。参数
是服务量的基线水平平均估计值,即t=0时基层医疗机构服务量的平均值,随机部分
分别代表基层医疗机构服务量平均估计值的方差,随机变量
表示i基层医疗机构服务量与总体均数
之差;
是干预实施前基层医疗机构服务量随单位时间变量t变化的趋势估计值,即基线斜率估计值;
是指政策实施前时间分段末端处与实施后时间分段的起始处的指标水平值的差值,即政策引起的基层医疗机构服务量水平变化的估计值;
是政策实施后时间分段趋势值(斜率)与实施前时间分段趋势值的差值,即政策实施引起的基层医疗机构服务量的趋势变化估计值;即
与
的和为政策实施后时间分段趋势的斜率,该模型也可以直接加入协变量。
4.2 多水平DID模型评价基本药物制度实施对基层医疗卫生机构服务量的影响
4.2.1 研究问题
评价基本药物制度实施前后基层医疗卫生机构服务量的变化趋势,评估政策干预对基层医疗卫生机构服务量的影响。
4.2.2 研究设计
两个省的基层医疗卫生机构在2008年均未实施基本药物制度,在2009年其中一个省实施了基本药物制度,而另外一个省仍未实施基本药物制度。两个省份的基层医疗卫生机构可比可以通过倾向性评分匹配实现。该研究涉及两个不同的省份相互对照和自身前后对照。
4.2.3 多水平DID模型
针对4.2.1研究问题和4.2.2研究设计,需采用多水平DID模型的统计方法。两水平的DID模型如下:
![]() |
![]() |
![]() |
模型中机构为水平一,县为水平二,i、j代表水平1、2,该模型中和
均是分类变量。该模型考虑了截距项的随机效应,即基层医疗卫生机构服务量在不同水平结构的层次效应,随机部分
代表县水平上的基层医疗卫生机构服务量平均估计值的方差,并且假设服从正态分布,随机变量
表示j县的服务量均数与总体均数之差。该模型中
为固定效应系数,表示两个时间点上的政策干预效应,也可进一步考虑其随机效应,估计不同县基层医疗卫生机构服务量的影响效应,比较哪些县政策实施效果更好,同时该模型也可直接加入其余协变量。
4.3 多水平重复测量模型评价基本药物制度实施效果的剂量反应效应
4.3.1 研究问题
评价全国2008~2012年基本药物制度实施效果是否存在剂量-反应关系,即是否基本药物制度实施时间越长,基层医疗卫生机构服务量增加的越多。
4.3.2 研究设计
全国基本药物制度是从2009至2012年逐步实施的,从而2008年所有基层医疗机构均未实施基本药物制度,2012年所有基层医疗机构均实施了基本药物制度,基本药物制度在各地基层医疗机构逐步实施的过程是一个非随机化的过程,因此是非标准的“阶梯试验设计”,估称为“类阶梯试验设计”(图4)。

白色框:未接受干预;蓝色框:接受了干预,时间点1所有医疗机构未接受干预,至时间点
4.3.3 多水平重复测量模型
评价基本药物制度实施效果是否存在剂量-反应关系,我们可构建多水平重复测量模型。重复测量时间点为一水平,机构为二水平,县为三水平,省为四水平,令i,j,k,l分别代表水平一、二、三、四,多水平重复测量基本模型如下:
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
该模型中连续性变量,2008~2012年分别表示0、1、2、3、4,该模型可以直接加入各水平的自变量。该模型不仅考虑了截距项的随机效应,还考虑了实施效果评价的随机效应,
指的是总均数在省份/县/基层卫生机构层次的随机效应,
为各层次上的剂量反应效应的随机效应。通过对随机效应
的方差系数
,
和
进行假设检验,我们可以找到各水平上各单元的剂量反应效应的分布,通过对随机效应
进行排序,可以判断哪个做的最好或者最差。
5 案例分析
以应用场景:多水平重复测量模型评价基本药物制度实施效果是否存在剂量-反应关系为例,介绍多水平重复测量模型可呈现的关键结果。通过多水平重复测量模型,可以获得截距项和政策的剂量反应效应在不同水平的变异情况,即对截距项在不同水平的方差系数、
、
、
和政策剂量反应效应在不同水平的方差系数
、
、
进行假设检验,获得截距项和政策剂量反应效应在不同水平上的分布情况是否存在变异,如表1的结果。

根据多水平重复测量模型,我们可以计算每个省、县、基层医疗卫生机构的剂量反应效应的变异值、
、
,将总体平均剂量反应效应
加上各省份上效应的变异值
,得到各个省份的剂量反应效应值(表2),北京、江苏、辽宁、甘肃、浙江等16个省/市的剂量反应效应值为正值,说明这些省/市的政策干预实施效果较好,其中浙江省实施干预政策所带来的服务量增加最快(每年增加0.12)。黑龙江、内蒙古、陕西、吉林等15个省份的剂量反应效应值为负值,说明这些省/市的服务量未随着政策实施时间的增加而增加,政策干预实施效果相对较差。

6 展望
随着区域医疗大数据的出现,基于区域医疗大数据的医药政策评价研究成为可能,而通常这种区域医疗大数据具有多个层次结构,对其的数据分析有必要考虑不同层次之间的异质性,利用多水平模型一方面能够高效地处理数据分析,并提高统计推断的精确度;另一方面能够分解不同层次之间的异质性,精确评价哪些地区的政策实施效果更好或更差,为政策实施监管提供科学依据。多水平模型将随着区域医疗大数据的发展应用于医药政策研究实施效果越来越多,如基于厦门或天津区域医疗大数据采用多水平模型评价“4+7”带量采购政策的实施效果等。同时,本文章仅介绍了多水平模型在医药政策实施效果评价领域的几种常见应用场景,未来根据研究目的不同还可能存在更多的应用场景[10]。
多水平模型(multilevel models)是基于多水平数据(层次结构数据)发展和应用起来的统计分析方法[1]。因学科领域的不同,多水平模型在不同领域的叫法存在差异,例如在社会学研究领域中,多水平模型被称为层次线性模型(hierarchical linear models);在生物统计领域被称为混合效应模型(mixed-effect models)或随机效应模型(random-effect models),在计量经济学领域被称为随机系数模型(random coefficient models)[2]。多水平模型最先应用于教育学领域,因多水平模型对不同层次数据处理具有统计学优势,近年来在心理学、社会学、经济学、组织行为与管理科学、医学和公共卫生等领域均得到了广泛的应用。
传统的医药政策评价研究中,多采用调查的方式,收集的数据量有限且很少存在层次结构,数据为单水平结构,此时传统的统计方法即可用于政策实施效果评价。在医药政策评价研究中,若数据具有层次或聚类结构,如采用全国基层医疗机构数据评价基本药物制度实施效果的研究,其数据的多层次结构表现为县嵌套于市,市嵌套于省,省嵌套于国家或地区[3],此时传统统计模型因不能处理具有层次结构的数据,不再适用于此类研究。近几年,随着区域医疗大数据的发展与可及(如天津、济南、厦门区域医疗大数据等),区域医疗大数据在政策评价研究中的运用越来越凸显。而区域医疗大数据通常具有医疗机构嵌套于区,区嵌套于市的层次结构,这种具有层次机构的数据在同一层次内具有较高的相似性、不同层次具有较强的异质性,亟需创新研究方法从不同角度评价医药政策实施的效果[4]。
在医药政策效果评价中,针对多层次结构数据,采用多水平统计方法对政策实施效果进行统计分析,已成为方法学研究的热点。近年来,国内外相关学者开始探索多水平模型用于医药政策的评价,如美国、加拿大、瑞典、我国已有学者采用多水平间断时间序列模型(interrupted time-series,ITS)、多水平双重差分模型(difference-in-difference,DID)和多水平重复测量模型评价政策的实施效果[5-9]。国内尚缺乏有关多水平模型在医药政策评价领域的方法学介绍和情景分析,鉴于此,本文介绍多水平模型建模的总体思路及其在医药政策评价研究中的几种常见应用场景,以期为未来利用区域医疗大数据评价政策实施效果提供方法学参考。
1 多水平模型的数据结构类型
多水平数据指观测数据在单位上具有嵌套的关系,如患者嵌套于医院,医院嵌套于地区,形成了三水平的数据结构,三水平数据结构示意图见图1,箭头方向表示低水平单元嵌套于高水平单元内。若只存在患者嵌套于医院时,三水平数据结构就变成了两水平的数据结构。

2 传统线性模型与两水平线性模型的差异性分析
现以简单的传统线性模型与两水平线性模型为例,介绍多水平统计分析模型的原理。
传统线性模型的模型设定:
![]() |
两水平线性模型的模型设定:
![]() |
表达式中:i指水平1单位,如患者;j为水平1所属的水平2单位,如医院,为
在水平2的随机效应,
为水平1的残差,即随机误差。图2中的
表示传统线性模型所获得的总均值,
、
、
表示两水平线性模型中水平2单位的均值。从传统线性模型与两水平线性模型表达式及其残差示意图2可以清晰的发现,两水平线性模型可将残差进行分解为一水平的残差和二水平的残差,如果二水平的残差
为0,则可直接采用传统线性模型,如果二水平的残差
不为0,则应该采用两水平线性模型。

3 多水平模型建模总体思路
根据研究者的目的和数据资料的情况不同,多水平模型存在不同类型,如:多水平线性回归、多水平logistic回归、多水平poisson回归、多水平Cox回归、多元多水平模型、多水平交叉分类模型、多水平样条函数模型、多水平结构方程模型等。多水平模型虽然存在不同类型,但其建模的总体思路是类似的,如图3。以构建两水平线性模型为例,首先建立仅包含随机截距项的两水平的空模型,对空模型中的两水平的方差进行检验,若该检验结果有统计学意义,说明存在两水平的层次结构,进一步构建随机截距模型,即在空模型中加入固定效应的自变量,若想进一步估计随机截距模型中自变量的随机效应,则需构建随机系数模型,若进一步考虑加入两水平的自变量,则形成了全模型。

3.1 构建空模型
空模型中只包含截距项,不包含任何自变量。多水平模型的空模型与传统回归模型的区别在于截距项,传统回归模型中的截距项为固定变量,即总均值只有一个,是固定的,不会在水平2上存在变化,而多水平模型的空模型中的截距项为随机效应,即总体均值在不同的水平存在变异,如水平2有5家医院,可得到5家医院不同的均值。两水平线性空模型的模型设定为:
![]() |
![]() |
![]() |
表达式中:i指水平1单位,如患者;j为水平1所属的水平2单位,如医院;为
的总平均,
为
在水平2的残差,即
在水平2的随机效应,代表组间变异;
为水平1的残差,即随机误差,代表组内变异;
为组间方差,
为组内方差,对其进行假设检验,若假设检验发现其存在差异,则应采用两水平模型。
3.2 构建随机截距模型
随机截距模型是在上述空模型的基础上加入水平1的变量,且自变量是固定效应。假设只纳入水平1单位1个自变量,随机截距模型表达为:
![]() |
表达式中:为加入的水平1自变量,
为
对y的固定效应。
3.3 构建随机系数模型
随机系数模型是在随机截距模型的基础上考虑自变量的随机效应。随机系数模型表达为:
![]() |
![]() |
![]() |
表达式中:为
对y的平均效应,
为
的随机效应,通过对随机效应
的方差系数
进行假设检验,可以发现两水平各单元的效应分布,如两水平各个医院的效应分布,通过对随机效应
进行排序,可判断两水平的哪个单元效应最高或最低。
3.4 全模型
全模型即在随机系数模型中进一步加入水平2的自变量。假设只纳入水平2的1个自变量,全模型表达为:
![]() |
表达式中:为加入的水平2自变量,
为
对y的固定效应,由于
是水平2的自变量,所以不能构建其随机效应。
以上为两水平模型的构建总体思路,该思路可以扩展到三水平及以上水平的模型,同时结局变量类型是二分类或者事件发生数等也适用。
4 多水平模型在医药政策实施效果评价领域的几种常见应用场景
多水平模型在医药政策实施效果评价领域可以应用但不限于以下几种常见的场景,以评价基本药物制度的实施效果为例进行介绍各种场景,其因变量为基层医疗卫生机构的服务量。研究数据均是全省的基层医疗卫生机构,则同一个县中的基层医疗卫生机构的服务量可能更为接近,这就造成了数据间不独立,从而需在传统的模型基础上考虑多水平的数据结构,采用对应的多水平模型。
4.1 多水平ITS模型评价基本药物制度实施对基层医疗卫生机构服务量的影响
4.1.1 研究问题
评价基本药物制度实施前后基层医疗卫生机构服务量的变化趋势,评估政策干预对基层医疗卫生机构服务量的影响。
4.1.2 研究设计
研究设计为某个省实施前和实施后基层医疗卫生机构多次重复测量的数据,如2008年未实施基本药物制度,2009年实施了基本药物制度,2008年和2009年每个月均测量了基层医疗卫生机构的服务量。该研究只有一个省份数据,没有其他省份作为对照。
4.2.3 多水平ITS
针对4.1.1研究问题和4.1.2研究设计,需采用多水平ITS,其模型基本表达式如下:
![]() |
![]() |
![]() |
该模型不同于传统的ITS,考虑了数据的层次结构,即考虑了不同测量时间点在同一医疗机构水平的聚集性,模型中变量是指基层医疗卫生机构i在时间点t处的服务量;
是一个连续变量,指从时间序列起始处计算的时间点t;
是一个虚拟变量,政策实施前则取0,政策实施后则取1。参数
是服务量的基线水平平均估计值,即t=0时基层医疗机构服务量的平均值,随机部分
分别代表基层医疗机构服务量平均估计值的方差,随机变量
表示i基层医疗机构服务量与总体均数
之差;
是干预实施前基层医疗机构服务量随单位时间变量t变化的趋势估计值,即基线斜率估计值;
是指政策实施前时间分段末端处与实施后时间分段的起始处的指标水平值的差值,即政策引起的基层医疗机构服务量水平变化的估计值;
是政策实施后时间分段趋势值(斜率)与实施前时间分段趋势值的差值,即政策实施引起的基层医疗机构服务量的趋势变化估计值;即
与
的和为政策实施后时间分段趋势的斜率,该模型也可以直接加入协变量。
4.2 多水平DID模型评价基本药物制度实施对基层医疗卫生机构服务量的影响
4.2.1 研究问题
评价基本药物制度实施前后基层医疗卫生机构服务量的变化趋势,评估政策干预对基层医疗卫生机构服务量的影响。
4.2.2 研究设计
两个省的基层医疗卫生机构在2008年均未实施基本药物制度,在2009年其中一个省实施了基本药物制度,而另外一个省仍未实施基本药物制度。两个省份的基层医疗卫生机构可比可以通过倾向性评分匹配实现。该研究涉及两个不同的省份相互对照和自身前后对照。
4.2.3 多水平DID模型
针对4.2.1研究问题和4.2.2研究设计,需采用多水平DID模型的统计方法。两水平的DID模型如下:
![]() |
![]() |
![]() |
模型中机构为水平一,县为水平二,i、j代表水平1、2,该模型中和
均是分类变量。该模型考虑了截距项的随机效应,即基层医疗卫生机构服务量在不同水平结构的层次效应,随机部分
代表县水平上的基层医疗卫生机构服务量平均估计值的方差,并且假设服从正态分布,随机变量
表示j县的服务量均数与总体均数之差。该模型中
为固定效应系数,表示两个时间点上的政策干预效应,也可进一步考虑其随机效应,估计不同县基层医疗卫生机构服务量的影响效应,比较哪些县政策实施效果更好,同时该模型也可直接加入其余协变量。
4.3 多水平重复测量模型评价基本药物制度实施效果的剂量反应效应
4.3.1 研究问题
评价全国2008~2012年基本药物制度实施效果是否存在剂量-反应关系,即是否基本药物制度实施时间越长,基层医疗卫生机构服务量增加的越多。
4.3.2 研究设计
全国基本药物制度是从2009至2012年逐步实施的,从而2008年所有基层医疗机构均未实施基本药物制度,2012年所有基层医疗机构均实施了基本药物制度,基本药物制度在各地基层医疗机构逐步实施的过程是一个非随机化的过程,因此是非标准的“阶梯试验设计”,估称为“类阶梯试验设计”(图4)。

白色框:未接受干预;蓝色框:接受了干预,时间点1所有医疗机构未接受干预,至时间点
4.3.3 多水平重复测量模型
评价基本药物制度实施效果是否存在剂量-反应关系,我们可构建多水平重复测量模型。重复测量时间点为一水平,机构为二水平,县为三水平,省为四水平,令i,j,k,l分别代表水平一、二、三、四,多水平重复测量基本模型如下:
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
该模型中连续性变量,2008~2012年分别表示0、1、2、3、4,该模型可以直接加入各水平的自变量。该模型不仅考虑了截距项的随机效应,还考虑了实施效果评价的随机效应,
指的是总均数在省份/县/基层卫生机构层次的随机效应,
为各层次上的剂量反应效应的随机效应。通过对随机效应
的方差系数
,
和
进行假设检验,我们可以找到各水平上各单元的剂量反应效应的分布,通过对随机效应
进行排序,可以判断哪个做的最好或者最差。
5 案例分析
以应用场景:多水平重复测量模型评价基本药物制度实施效果是否存在剂量-反应关系为例,介绍多水平重复测量模型可呈现的关键结果。通过多水平重复测量模型,可以获得截距项和政策的剂量反应效应在不同水平的变异情况,即对截距项在不同水平的方差系数、
、
、
和政策剂量反应效应在不同水平的方差系数
、
、
进行假设检验,获得截距项和政策剂量反应效应在不同水平上的分布情况是否存在变异,如表1的结果。

根据多水平重复测量模型,我们可以计算每个省、县、基层医疗卫生机构的剂量反应效应的变异值、
、
,将总体平均剂量反应效应
加上各省份上效应的变异值
,得到各个省份的剂量反应效应值(表2),北京、江苏、辽宁、甘肃、浙江等16个省/市的剂量反应效应值为正值,说明这些省/市的政策干预实施效果较好,其中浙江省实施干预政策所带来的服务量增加最快(每年增加0.12)。黑龙江、内蒙古、陕西、吉林等15个省份的剂量反应效应值为负值,说明这些省/市的服务量未随着政策实施时间的增加而增加,政策干预实施效果相对较差。

6 展望
随着区域医疗大数据的出现,基于区域医疗大数据的医药政策评价研究成为可能,而通常这种区域医疗大数据具有多个层次结构,对其的数据分析有必要考虑不同层次之间的异质性,利用多水平模型一方面能够高效地处理数据分析,并提高统计推断的精确度;另一方面能够分解不同层次之间的异质性,精确评价哪些地区的政策实施效果更好或更差,为政策实施监管提供科学依据。多水平模型将随着区域医疗大数据的发展应用于医药政策研究实施效果越来越多,如基于厦门或天津区域医疗大数据采用多水平模型评价“4+7”带量采购政策的实施效果等。同时,本文章仅介绍了多水平模型在医药政策实施效果评价领域的几种常见应用场景,未来根据研究目的不同还可能存在更多的应用场景[10]。