一、数据列的表示方式
作关联分析首先要指定参考的数据列。参考数据列常记为x 0 ,x 0 由不同时刻的值构成,记第1个时刻的值为x 0 (1),第2个时刻的值为x 0 (2),第k个时刻的值为x 0 (k)。因此参考序列x0可表示为:x 0 =(x 0 (1),x 0 (2),…,x 0 (n));关联分析中的被比较数列常记为:x 1 ,x 2 ,…,x n ,例如:x 1 =(x 1 (1),x 1 (2),…,x 1 (n))。这样几个数列,为关联度分析准备了条件。
二、关联系数、关联度的计算
设
x 0 =(x 0 (1),x 0 (2),…,x 0 (n));x 1 =(x 1 (1),x 1 (2),…,x 1 (n));
x 2 =(x 2 (1),x 2 (2),…,x 2 (n));x 3 =(x 3 (1),x 3 (2),…,x 3 (n));……;
x m =(x m (1),x m (2),…,x m (n))
关联系数定义为:
其中:
(1)|x 0 (k)-x i (k)|为第k个点x 0 与x 1 的绝对误差,k=1,2,…,n,i=1,2,…,m。
(2)minmin|x 0 (k)-x i (k)|为两级最小差。其中,min|x 0 (k)-x i (k)|是第一级最小差,表示在xi(k)序列上找各点与x 0 (k)的最小差,即跑遍k选最小者。minmin|x 0 (k)-x i (k)|为第二级最小差,表示在各序列找出的最小差基础上寻找所有序列中的最小差,即跑遍i选最小者。
(3)maxmax|x 0 (k)-x i (k)|是两级最大差,其含义与最小差类似。
(4)ρ为分辨率或分辨系数,0﹤ρ﹤1,一般取ρ=0.5。
(5)对单位不一、初值不同的序列,在计算关联系数前应首先进行 无量纲化处理 ,具体方法是初值化,即将该序列所有数据分别除以第一个数据;或均值化处理。
关联系数的数值很多,信息过于分散,不便于比较,为此有必要将各个时刻关联系数集中为一个值,求平均值便是作这种信息集中处理的一种方法,此结果称为 关联度 ,其一般表达式为