人在行走的时候会产生步态信号,不同的人会产生不同的步态信号,步态信号复杂度的研究在医学上具有重要的意义。我们可以根据一个人步态信号的复杂度来评估一个人的健康状况,从而及时发现和诊断疾病。本文采用詹森香农差异(JSD)的复杂度分析方法,分别计算健康老年人、健康年轻人和帕金森病患者的步态信号复杂度,并对实验数据进行方差分析。结果表明,三种步态信号的复杂度具有明显差异。通过本文的研究,我们得出了帕金森病患者、健康老年人和健康年轻人步态信号复杂度的取值范围,从而为临床诊断提供了重要依据。
引用本文: 王沛存, 王俊. 基于詹森香农差异的步态信号复杂度分析. 生物医学工程学杂志, 2014, 31(3): 583-585. doi: 10.7507/1001-5515.20140109 复制
引言
所谓步态是指人们走路时候的姿势,它由身体各个部位的相对运动组成,是人体生理机能和心理活动在行走时的外在表现形式。不同年龄、性别、性格、健康状况和职业的人的步态是不同的[1]。基于不同个体之间所存在的不同步态特征可以实现非接触情况下的身份识别[2]。步态信号是人在走路的时候产生的信号。随着科技进步和社会的发展,步态信号的分析和处理能力得到了极大的提高,步态信号在生物医学方法的应用也越来越普遍。步态信号的研究在临床上能够评估患者是否存在异常步态,为患者的康复和治疗提供了最好的评价手段[3],具有重大意义。本文采用詹森香农差异(Jensen-Shannon divergence,JSD)的复杂度分析方法分析和研究了健康老年人、年轻人和帕金森病患者的步态信号,得出了这三种人步态信号复杂度的取值范围,为医学诊断提供了依据。
1 统计复杂度
统计复杂度作为描述序列随机本质的重要指标,在时间序列和符号序列的研究分析中起着越来越重要的作用[4]。统计复杂度反映了时间序列或符号序列随时间增长新模式出现的速率,序列的统计复杂度越大,表明在单位时间内这一序列的变化越快,出现的新模式越多,说明单位时间内这一序列的变化是统计复杂的并且随机性较强,反之亦然。
自JSD(用于度量随机变量概率分布之间的差异)于1991年提出后[5],就被广泛应用于时间序列和符号序列的分析和特征描述中[6],如模式识别、DNA序列的分割。同时,JSD也在传感网络以及图像视频等领域得到了很好的应用,比如图像分割和边缘检测等。JSD是对Kullback-Leibler divergence进行对称和平滑的结果,JSD的非负性、对称性、连续性和有界性等特征在时间序列数据分析中得到了普遍的应用[7]。步态信号可以视为一种时间序列,所以,基于JSD的统计复杂度分析方法可用来实现步态信号的识别与检测。本文采用JSD的统计复杂度分析方法对三种步态信号进行了对比分析与研究。
2 算法描述
基于JSD的步态信号的复杂度计算方法:
(1)设步态信号序列为X,X={x1,x2,x3,…xi,…,xN},序列长度为N。
(2)对步态信号序列采用符号动力学方法进行符号化处理[8];对时间序列X粗粒化处理[9],转换成符号序列S={s1,s2,…,si,…,sN},si∈A (A=0,1,2,3)。计算时间序列的平均值u。
${{s}_{i}}\left( {{x}_{i}} \right)=\left\{ \begin{align} & 0:u <{{x}_{i}}\le \left( 1+a \right)u\text{ } \\ & 1:\left( 1+a \right)u<{{x}_{i}}<\infty \\ & 2:\left( 1-a \right)u<{{x}_{i}}\le u \\ & 3:0\le {{x}_{i}}\le \left( 1-a \right)u \\ \end{align} \right.,$ |
其中i=1,2,…,N。a是一个常量,a=0.05。a的值取得过大或过小,在把原始时间序列转化成符号序列时,会导致细节信息的丢失,不能很好地捕捉到信号中的动态信息。
(3)统计符号序列排列的概率分布[10]。采用B-P算法,嵌入维数取d=6。 对于给定时间序列{xn,n=1,2,…,N}和一个嵌入维数d>1,对每一时刻i=1,2,…,N-d+1,其d阶顺次模式是由时刻(i,i+1,…,i+d-1)的值组成的d维向量表示:
$\left( S \right)|->({{x}_{i}},{{x}_{i+1}},\ldots ,{{x}_{i+d-1}}),$ |
根据d阶顺次模式,定义(0,1,…d-1)的一个排列π=(r0,r1,…,rd-1)为
${{x}_{i+{{r}_{0}}}}\le {{x}_{i+{{r}_{1}}}}\le \ldots \le {{x}_{i+{{r}_{d-1}}}},$ |
若xi+r1≤xi+ri-1,则ri<ri-1。因此,对所有可能的d!个d阶排列π,概率分布P={p(π)}定义为[11]
$p(\pi )=\frac{\#\{s|iT-d+1;\left( s \right)has-type-\pi \}}{T-d+1}$ |
其中符号#代表排列的数目。
(4)计算Shannon熵和最大熵,得到归一化熵HS,即
${{H}_{S}}=H\left[ P \right]/{{H}_{max}},{{H}_{max}}=ln\left( k \right),$ |
其中k为排列π的所有组合数目。
(5)计算概率分布P与均匀分布Pe的JSD:
${{D}_{js}}=H((P+{{P}_{e}})/2)-H\left[ P \right]/2-H[{{P}_{e}}]/2,$ |
其中Pe为均匀概率分布,为1/k;
(6)计算统计复杂度C:
${{C}_{js}}={{Q}_{0}}^{(J)}{{D}_{js}}{{H}_{S}}~,$ |
其中Qo为一常数[12],
${{Q}_{0}}^{(J)}=-2\left( \frac{k+1}{k} \right)ln\left( k+1 \right)-2ln\left( 2k \right)+ln\left( k \right)\wedge \left( -1 \right)$ |
3 基于JSD的步态信号复杂度计算和分析
实验中采用的数据是从MIT-BIH标准数据库中提取的来自Gait in Aging and Disease Database的10组样本(行走步幅间隔时间序列):10例健康年轻人(年龄23~29周岁,以下简称年轻人),10例健康老年人(年龄71~77周岁,以下简称老年人),10例患有帕金森病的老年人(年龄60~77周岁)。行走步幅间隔是由放置在鞋内的超薄力敏电阻测量的。
编写程序,计算老年人、帕金森病患者和年轻人的步态信号的复杂度,结果如表 1所示。

将三种步态信号的复杂度投影到CH平面,结果如图 1所示。

从图 1我们可发现,三种步态信号的复杂度在CH平面的投影点和投影区域有所不同。年轻人的步态信号复杂度分布在图的中上部,老年人的复杂度分布在图的中间,而帕金森病患者的复杂度主要分布在图的下部,即年轻人的步态信号复杂度最大,老年人次之,而帕金森病患者的步态信号复杂度最小。三种步态信号的复杂度相互之间都有重叠部分。年轻人与帕金森病患者的重叠部分很少,老年人与帕金森病患者的重叠部分很多,而年轻人的复杂度与老年人之间大约有一半重叠。就三种复杂度之间的数值差距来看,老年人和年轻人的复杂度相差不大,而帕金森病患者的复杂度就小得多了。
以上分析充分说明不同年龄、不同健康状况的人步态信号复杂度差异是比较明显的,因此,步态信号的复杂度值可以作为评判健康状况的依据,为临床诊断提供帮助。
根据医学研究中的统计学方法[13],对三种步态信号的复杂度进行方差分析,并绘制三种步态信号复杂度的箱线图(见图 2)。
箱线图又称为盒须图、盒式图或箱形图,是一种用作显示一组数据分散情况资料的统计图,因型状如箱子而得名。箱线图将一组数据从大到小排列,分别计算出上边缘、上四分位数、中位数、下四分位数、下边缘。

方差分析得出F值为13.33,P值为0.000 09,显示三种步态信号的复杂度有明显的差异,即基于JSD的复杂度分析结果具有统计学意义。
4 结论
步态是具有个体差异性的行为特征,不同的人在走路时会产生不同的步态信号。本文提出一种新的基于JSD的复杂度分析方法,对三种步态信号的复杂度进行了分析和研究,结果表明三种步态信号复杂度具有明显差异,步态信号的复杂度值可以作为评判健康状况的依据,为临床诊断提供帮助。
引言
所谓步态是指人们走路时候的姿势,它由身体各个部位的相对运动组成,是人体生理机能和心理活动在行走时的外在表现形式。不同年龄、性别、性格、健康状况和职业的人的步态是不同的[1]。基于不同个体之间所存在的不同步态特征可以实现非接触情况下的身份识别[2]。步态信号是人在走路的时候产生的信号。随着科技进步和社会的发展,步态信号的分析和处理能力得到了极大的提高,步态信号在生物医学方法的应用也越来越普遍。步态信号的研究在临床上能够评估患者是否存在异常步态,为患者的康复和治疗提供了最好的评价手段[3],具有重大意义。本文采用詹森香农差异(Jensen-Shannon divergence,JSD)的复杂度分析方法分析和研究了健康老年人、年轻人和帕金森病患者的步态信号,得出了这三种人步态信号复杂度的取值范围,为医学诊断提供了依据。
1 统计复杂度
统计复杂度作为描述序列随机本质的重要指标,在时间序列和符号序列的研究分析中起着越来越重要的作用[4]。统计复杂度反映了时间序列或符号序列随时间增长新模式出现的速率,序列的统计复杂度越大,表明在单位时间内这一序列的变化越快,出现的新模式越多,说明单位时间内这一序列的变化是统计复杂的并且随机性较强,反之亦然。
自JSD(用于度量随机变量概率分布之间的差异)于1991年提出后[5],就被广泛应用于时间序列和符号序列的分析和特征描述中[6],如模式识别、DNA序列的分割。同时,JSD也在传感网络以及图像视频等领域得到了很好的应用,比如图像分割和边缘检测等。JSD是对Kullback-Leibler divergence进行对称和平滑的结果,JSD的非负性、对称性、连续性和有界性等特征在时间序列数据分析中得到了普遍的应用[7]。步态信号可以视为一种时间序列,所以,基于JSD的统计复杂度分析方法可用来实现步态信号的识别与检测。本文采用JSD的统计复杂度分析方法对三种步态信号进行了对比分析与研究。
2 算法描述
基于JSD的步态信号的复杂度计算方法:
(1)设步态信号序列为X,X={x1,x2,x3,…xi,…,xN},序列长度为N。
(2)对步态信号序列采用符号动力学方法进行符号化处理[8];对时间序列X粗粒化处理[9],转换成符号序列S={s1,s2,…,si,…,sN},si∈A (A=0,1,2,3)。计算时间序列的平均值u。
${{s}_{i}}\left( {{x}_{i}} \right)=\left\{ \begin{align} & 0:u <{{x}_{i}}\le \left( 1+a \right)u\text{ } \\ & 1:\left( 1+a \right)u<{{x}_{i}}<\infty \\ & 2:\left( 1-a \right)u<{{x}_{i}}\le u \\ & 3:0\le {{x}_{i}}\le \left( 1-a \right)u \\ \end{align} \right.,$ |
其中i=1,2,…,N。a是一个常量,a=0.05。a的值取得过大或过小,在把原始时间序列转化成符号序列时,会导致细节信息的丢失,不能很好地捕捉到信号中的动态信息。
(3)统计符号序列排列的概率分布[10]。采用B-P算法,嵌入维数取d=6。 对于给定时间序列{xn,n=1,2,…,N}和一个嵌入维数d>1,对每一时刻i=1,2,…,N-d+1,其d阶顺次模式是由时刻(i,i+1,…,i+d-1)的值组成的d维向量表示:
$\left( S \right)|->({{x}_{i}},{{x}_{i+1}},\ldots ,{{x}_{i+d-1}}),$ |
根据d阶顺次模式,定义(0,1,…d-1)的一个排列π=(r0,r1,…,rd-1)为
${{x}_{i+{{r}_{0}}}}\le {{x}_{i+{{r}_{1}}}}\le \ldots \le {{x}_{i+{{r}_{d-1}}}},$ |
若xi+r1≤xi+ri-1,则ri<ri-1。因此,对所有可能的d!个d阶排列π,概率分布P={p(π)}定义为[11]
$p(\pi )=\frac{\#\{s|iT-d+1;\left( s \right)has-type-\pi \}}{T-d+1}$ |
其中符号#代表排列的数目。
(4)计算Shannon熵和最大熵,得到归一化熵HS,即
${{H}_{S}}=H\left[ P \right]/{{H}_{max}},{{H}_{max}}=ln\left( k \right),$ |
其中k为排列π的所有组合数目。
(5)计算概率分布P与均匀分布Pe的JSD:
${{D}_{js}}=H((P+{{P}_{e}})/2)-H\left[ P \right]/2-H[{{P}_{e}}]/2,$ |
其中Pe为均匀概率分布,为1/k;
(6)计算统计复杂度C:
${{C}_{js}}={{Q}_{0}}^{(J)}{{D}_{js}}{{H}_{S}}~,$ |
其中Qo为一常数[12],
${{Q}_{0}}^{(J)}=-2\left( \frac{k+1}{k} \right)ln\left( k+1 \right)-2ln\left( 2k \right)+ln\left( k \right)\wedge \left( -1 \right)$ |
3 基于JSD的步态信号复杂度计算和分析
实验中采用的数据是从MIT-BIH标准数据库中提取的来自Gait in Aging and Disease Database的10组样本(行走步幅间隔时间序列):10例健康年轻人(年龄23~29周岁,以下简称年轻人),10例健康老年人(年龄71~77周岁,以下简称老年人),10例患有帕金森病的老年人(年龄60~77周岁)。行走步幅间隔是由放置在鞋内的超薄力敏电阻测量的。
编写程序,计算老年人、帕金森病患者和年轻人的步态信号的复杂度,结果如表 1所示。

将三种步态信号的复杂度投影到CH平面,结果如图 1所示。

从图 1我们可发现,三种步态信号的复杂度在CH平面的投影点和投影区域有所不同。年轻人的步态信号复杂度分布在图的中上部,老年人的复杂度分布在图的中间,而帕金森病患者的复杂度主要分布在图的下部,即年轻人的步态信号复杂度最大,老年人次之,而帕金森病患者的步态信号复杂度最小。三种步态信号的复杂度相互之间都有重叠部分。年轻人与帕金森病患者的重叠部分很少,老年人与帕金森病患者的重叠部分很多,而年轻人的复杂度与老年人之间大约有一半重叠。就三种复杂度之间的数值差距来看,老年人和年轻人的复杂度相差不大,而帕金森病患者的复杂度就小得多了。
以上分析充分说明不同年龄、不同健康状况的人步态信号复杂度差异是比较明显的,因此,步态信号的复杂度值可以作为评判健康状况的依据,为临床诊断提供帮助。
根据医学研究中的统计学方法[13],对三种步态信号的复杂度进行方差分析,并绘制三种步态信号复杂度的箱线图(见图 2)。
箱线图又称为盒须图、盒式图或箱形图,是一种用作显示一组数据分散情况资料的统计图,因型状如箱子而得名。箱线图将一组数据从大到小排列,分别计算出上边缘、上四分位数、中位数、下四分位数、下边缘。

方差分析得出F值为13.33,P值为0.000 09,显示三种步态信号的复杂度有明显的差异,即基于JSD的复杂度分析结果具有统计学意义。
4 结论
步态是具有个体差异性的行为特征,不同的人在走路时会产生不同的步态信号。本文提出一种新的基于JSD的复杂度分析方法,对三种步态信号的复杂度进行了分析和研究,结果表明三种步态信号复杂度具有明显差异,步态信号的复杂度值可以作为评判健康状况的依据,为临床诊断提供帮助。