灰色关联分析笔记 - 详解

灰色关联分析笔记 - 详解

灰色关联分析模型引出什么是灰色架构?1982年由邓聚龙创立的一门边缘性学科(interdisciplinary)。就是灰色环境理论灰色系统用颜色深浅反映信息量的多少。说一个系统是黑色黑洞洞的,就是的,就是说这个架构信息量太少;说一个系统是白色的,就是说这个框架是清楚的,信息量充足。而处于黑白之间的系统,或说信息不完全的系统,称为灰色系统或简称灰系统。“信息不完全”的基本含义(灰的核心)一般指:

环境因素不完全明确因素关系不完全清楚系统的结构不完全知道系统的作用原理不完全明了白、黑、灰系统对比表维度白色系统黑色系统灰色系统从表象看明朗暗若明若暗从过程看新旧新旧交替从性质看纯不纯多种成分从信息看完全不完全部分完全从结果看唯一的解无数的解非唯一性从态度看肯定否定扬弃从方法看严厉放纵宽容什么是关联分析?所谓关联分析,就是系统地分析因素需发展的,那些需要抑制……就是。回答的问题是:某个包含多种因素的系统中,哪些因素是主要的,哪些是次要的;哪些因素影响大,哪些因素影响小;哪些因素是明显的,哪些因素是潜在的;哪些现有因素分析的量化方法,大都是数理统计法(如回归分析、方差分析、主要成分分析等),这些方法都有下述弱点: (1)要求大量数据,数据量少难以找到统计规律(2)要求分布是典型的(线性的、指数的或对数的),即使是典型的并非都能处理 (3)计算工作量大,一般需要计算机帮助(4)有时可能出现反常情况,如正相关则断为负相关,以至正确现象受到歪曲和颠倒尤其是我国统计数据十分有限,而且现有数据灰度较大,许多数据都出现几次大起大落,没有典型的分布规律。因此,采用数理统计方法往往难以奏效。灰色关联分析灰色关联度分析(Grey Relation Analysis,GRA),是一种多因素统计分析的方法。灰色关联分析方法弥补了采用数理统计方法作系统分析所导致的缺憾。它对样本量的多少和样本有无规律都同样适用,而且计算量小,十分方便,更不会出现量化结果与定性分析结果不符的情况。

灰色关联分析的基本思想是:根据序列曲线几何形状的相似程度来判断其联系是否紧密。曲线越接近,相应序列之间的关联度就越大,反之就越小。

对一个抽象的框架或现象进行分析,首先要选准反映系统行为特征的数据序列(称为“系统行为的映射量”),用映射量来间接地表征环境行为。例如,用国民平均接受教育的年数来反映教育发达程度,用刑事案件的发案率来反映社会治安面貌和社会秩序,用医院挂号次数来反映国民的健康水平等。有了环境行为特征数据和相关因素的数据,即可作出各个序列的图形,从直观上进行分析。

关联程度的逻辑关系曲线几何形态越相似 → 发展变化态势就越接近 → 其关联程度就越大

关联分析步骤1、母序列(又称参考序列、母指标)能反映系统行为特征的数据序列,类似于因变量YYY,记为Y=[y1,y2,⋯ ,yn]TY = [y_1, y_2, \cdots, y_n]^TY=[y1​,y2​,⋯,yn​]T

2、子序列(又称比较序列、子指标)影响体系行为的因素组成的数据序列,类似于自变量XXX,记为Xnm=[x11x12⋯x1mx21x22⋯x2m⋮⋮⋱⋮xn1xn2⋯xnm]X_{nm} = \begin{bmatrix} x_{11} & x_{12} & \cdots & x_{1m} \\ x_{21} & x_{22} & \cdots & x_{2m} \\ \vdots & \vdots & \ddots & \vdots \\ x_{n1} & x_{n2} & \cdots & x_{nm} \end{bmatrix}Xnm​=​x11​x21​⋮xn1​​x12​x22​⋮xn2​​⋯⋯⋱⋯​x1m​x2m​⋮xnm​​​

3、数据预处理由于不同要素具有不同量纲和数据范围,因此我们要对他们进行预处理去量纲,将他们统一到近似的范围内,先求出每个指标的均值,在用指标中的元素除以其均值y~k=yky‾i,y‾i=1n∑k=1nyk\widetilde{y}_k = \frac{y_k}{\overline{y}_i}, \overline{y}_i = \frac{1}{n}\sum_{k=1}^{n} y_ky​k​=y​i​yk​​,y​i​=n1​k=1∑n​yk​x~ki=xkix‾i,x‾i=1n∑k=1nxki(i=1,2,⋯ ,m)\widetilde{x}_{ki} = \frac{x_{ki}}{\overline{x}_i}, \overline{x}_i = \frac{1}{n}\sum_{k=1}^{n} x_{ki} (i = 1, 2, \cdots, m)xki​=xi​xki​​,xi​=n1​k=1∑n​xki​(i=1,2,⋯,m)

4、计算灰色关联系数计算子序列中各个指标与母序列的关联系数 记为:a=min⁡imin⁡k∣x0(k)−xi(k)∣a = \min\limits_{i}\min\limits_{k} \vert x_0(k) - x_i(k) \verta=imin​kmin​∣x0​(k)−xi​(k)∣,b=max⁡imax⁡k∣x0(k)−xi(k)∣b = \max\limits_{i}\max\limits_{k} \vert x_0(k) - x_i(k) \vertb=imax​kmax​∣x0​(k)−xi​(k)∣为两极最小差和最大差 构造:ξi(k)=y(x0(k),xi(k))=a+ρb∣x0(k)−xi(k)∣+ρb\xi_i(k) = y(x_0(k), x_i(k)) = \frac{a + \rho b}{\vert x_0(k) - x_i(k) \vert + \rho b}ξi​(k)=y(x0​(k),xi​(k))=∣x0​(k)−xi​(k)∣+ρba+ρb​,其中ρ\rhoρ为分辨系数,一般取0.50.50.5

5、计算关联度ri=1n∑k=1nξi(k)=1n∑k=1ny(x0(k),xi(k))r_i = \frac{1}{n}\sum_{k = 1}^{n} \xi_i(k) = \frac{1}{n}\sum_{k = 1}^{n} y(x_0(k), x_i(k))ri​=n1​∑k=1n​ξi​(k)=n1​∑k=1n​y(x0​(k),xi​(k))

关联分析例题1、已知某地国民生产总值,工业和农业生产总值,原始数据的形式及来源见下表,分析工业农业哪个对国民生产总值影响大

项目名称年份2016201720182019国民生产总值556575100工业产值24384050农业产值102218201)定义母序列及子序列如下

项目名称年份项目代号2016201720182019国民生产总值556575100X0X_0X0​(母序列)工业产值24384050X1X_1X1​(子序列)农业产值10221820X2X_2X2​(子序列)2)数据预处理

对数据进行均值化,公式为:

y~k=yky‾i,y‾i=1n∑k=1nyk\widetilde{y}_k = \frac{y_k}{\overline{y}_i}, \overline{y}_i = \frac{1}{n}\sum_{k=1}^{n} y_ky​k​=y​i​yk​​,y​i​=n1​k=1∑n​yk​

x~ki=xkix‾i,x‾i=1n∑k=1nxki(i=1,2,⋯ ,m)\widetilde{x}_{ki} = \frac{x_{ki}}{\overline{x}_i}, \overline{x}_i = \frac{1}{n}\sum_{k=1}^{n} x_{ki} (i = 1,2,\cdots,m)xki​=xi​xki​​,xi​=n1​k=1∑n​xki​(i=1,2,⋯,m)

项目名称年份项目代号2016201720182019国民生产总值0.750.881.021.36(母序列)工业产值0.631.001.051.32(子序列)农业产值0.571.261.031.14(子序列)3)求关联系数

相关公式:

a=min⁡imin⁡k∣x0(k)−xi(k)∣a = \min\limits_{i}\min\limits_{k} \vert x_0(k) - x_i(k) \verta=imin​kmin​∣x0​(k)−xi​(k)∣b=max⁡imax⁡k∣x0(k)−xi(k)∣b = \max\limits_{i}\max\limits_{k} \vert x_0(k) - x_i(k) \vertb=imax​kmax​∣x0​(k)−xi​(k)∣ξi(k)=y(x0(k),xi(k))=a+ρb∣x0(k)−xi(k)∣+ρb\xi_i(k) = y(x_0(k), x_i(k)) = \frac{a + \rho b}{\vert x_0(k) - x_i(k) \vert + \rho b}ξi​(k)=y(x0​(k),xi​(k))=∣x0​(k)−xi​(k)∣+ρba+ρb​

kkkX0X_0X0​X1X_1X1​X2X_2X2​∣x0(k)−x1(k)∣\vert x_0(k) - x_1(k) \vert∣x0​(k)−x1​(k)∣∣x0(k)−x2(k)∣\vert x_0(k) - x_2(k) \vert∣x0​(k)−x2​(k)∣10.750.630.570.120.1820.8811.260.120.3831.021.051.030.030.0141.361.321.140.040.22已知a=0.01a = 0.01a=0.01,b=0.38b = 0.38b=0.38,关联系数公式:ξi(k)=y(x0(k),xi(k))=0.01+0.5×0.38∣x0(k)−xi(k)∣+0.5×0.38=0.2∣x0(k)−xi(k)∣+0.19 \xi_i(k) = y(x_0(k), x_i(k)) = \frac{0.01 + 0.5 \times 0.38}{\vert x_0(k) - x_i(k) \vert + 0.5 \times 0.38} = \frac{0.2}{\vert x_0(k) - x_i(k) \vert + 0.19}ξi​(k)=y(x0​(k),xi​(k))=∣x0​(k)−xi​(k)∣+0.5×0.380.01+0.5×0.38​=∣x0​(k)−xi​(k)∣+0.190.2​

kkk∣x0(k)−x1(k)∣\vert x_0(k) - x_1(k) \vert∣x0​(k)−x1​(k)∣∣x0(k)−x2(k)∣\vert x_0(k) - x_2(k) \vert∣x0​(k)−x2​(k)∣ξ1\xi_1ξ1​ξ2\xi_2ξ2​10.120.180.6450.54120.120.380.6450.35130.030.010.9091.00040.040.220.8700.4884)求关联度关联度公式:ri=1n∑k=1nξi(k)=1n∑k=1ny(x0(k),xi(k)) r_i = \frac{1}{n}\sum_{k=1}^{n} \xi_i(k) = \frac{1}{n}\sum_{k=1}^{n} y(x_0(k), x_i(k))ri​=n1​k=1∑n​ξi​(k)=n1​k=1∑n​y(x0​(k),xi​(k))

kkkξ1\xi_1ξ1​ξ2\xi_2ξ2​10.6450.54120.6450.35130.9091.00040.8700.488( r )0.7670.595因为 r1>r2r_1 > r_2r1​>r2​,所以工业产值关联度更大。

灰色关联综合评价——典型例题我们来换个方法给明星Kun选对象,还是A、B、C三位候选人(Kun觉得身高165是最好,体重在90 - 100斤是最好)

候选人颜值脾气(争吵次数)身高体重A910175120B8716480C63157901)数据正向化处理(可看TOPSIS一节)将原始矩阵正向化,就是要将所有的指标类型统一转化为极大型指标。

原始矩阵形式:Xnm=[x11x12⋯x1mx21x22⋯x2m⋮⋮⋱⋮xn1xn2⋯xnm] X_{nm} = \begin{bmatrix} x_{11} & x_{12} & \cdots & x_{1m} \\ x_{21} & x_{22} & \cdots & x_{2m} \\ \vdots & \vdots & \ddots & \vdots \\ x_{n1} & x_{n2} & \cdots & x_{nm} \end{bmatrix}Xnm​=​x11​x21​⋮xn1​​x12​x22​⋮xn2​​⋯⋯⋱⋯​x1m​x2m​⋮xnm​​​

正向化后资料:

候选人颜值脾气(争吵次数)身高体重A9000B830.90.5C670.212)正向化后数据预处理

每个指标的元素除以该指标元素的平均值,矩阵形式:Znm=[z11z12⋯z1mz21z22⋯z2m⋮⋮⋱⋮zn1zn2⋯znm] Z_{nm} = \begin{bmatrix} z_{11} & z_{12} & \cdots & z_{1m} \\ z_{21} & z_{22} & \cdots & z_{2m} \\ \vdots & \vdots & \ddots & \vdots \\ z_{n1} & z_{n2} & \cdots & z_{nm} \end{bmatrix}Znm​=​z11​z21​⋮zn1​​z12​z22​⋮zn2​​⋯⋯⋱⋯​z1m​z2m​⋮znm​​​

候选人颜值脾气(争吵次数)身高体重A1.170.000.000.00B1.040.902.451.00C0.782.100.552.003)构造母序列(倘若没有明确的母序列,就选各个指标的最大值)

母序列 Y=[y1,y2,⋯ ,yn]TY = [y_1, y_2, \cdots, y_n]^TY=[y1​,y2​,⋯,yn​]T,其中 yi=max⁡(zi1,zi2,⋯ ,zim)y_i = \max(z_{i1}, z_{i2}, \cdots, z_{im})yi​=max(zi1​,zi2​,⋯,zim​)

候选人YYY颜值脾气(争吵次数)身高体重A1.171.170.000.000.00B2.451.040.902.451.00C2.100.782.100.552.004)计算关联系数

记差值矩阵为( K ),矩阵形式:Knm=[k11k12⋯k1mk21k22⋯k2m⋮⋮⋱⋮kn1kn2⋯knm]=[∣z11−y1∣∣z12−y1∣⋯∣z1m−y1∣∣z21−y2∣∣z22−y2∣⋯∣z2m−y2∣⋮⋮⋱⋮∣zn1−yn∣∣zn2−yn∣⋯∣znm−yn∣] K_{nm} = \begin{bmatrix} k_{11} & k_{12} & \cdots & k_{1m} \\ k_{21} & k_{22} & \cdots & k_{2m} \\ \vdots & \vdots & \ddots & \vdots \\ k_{n1} & k_{n2} & \cdots & k_{nm} \end{bmatrix} = \begin{bmatrix} \vert z_{11} - y_1 \vert & \vert z_{12} - y_1 \vert & \cdots & \vert z_{1m} - y_1 \vert \\ \vert z_{21} - y_2 \vert & \vert z_{22} - y_2 \vert & \cdots & \vert z_{2m} - y_2 \vert \\ \vdots & \vdots & \ddots & \vdots \\ \vert z_{n1} - y_n \vert & \vert z_{n2} - y_n \vert & \cdots & \vert z_{nm} - y_n \vert \end{bmatrix}Knm​=​k11​k21​⋮kn1​​k12​k22​⋮kn2​​⋯⋯⋱⋯​k1m​k2m​⋮knm​​​=​∣z11​−y1​∣∣z21​−y2​∣⋮∣zn1​−yn​∣​∣z12​−y1​∣∣z22​−y2​∣⋮∣zn2​−yn​∣​⋯⋯⋱⋯​∣z1m​−y1​∣∣z2m​−y2​∣⋮∣znm​−yn​∣​​

其中,a=min⁡imin⁡k∣x0(k)−xi(k)∣a = \min\limits_{i}\min\limits_{k} \vert x_0(k) - x_i(k) \verta=imin​kmin​∣x0​(k)−xi​(k)∣,b=max⁡imax⁡k∣x0(k)−xi(k)∣b = \max\limits_{i}\max\limits_{k} \vert x_0(k) - x_i(k) \vertb=imax​kmax​∣x0​(k)−xi​(k)∣

候选人YYYZ1Z_1Z1​Z2Z_2Z2​Z3Z_3Z3​Z4Z_4Z4​∣zk1−yk∣\vert z_{k1} - y_k \vert∣zk1​−yk​∣∣zk2−yk∣\vert z_{k2} - y_k \vert∣zk2​−yk​∣∣zk3−yk∣\vert z_{k3} - y_k \vert∣zk3​−yk​∣∣zk4−yk∣\vert z_{k4} - y_k \vert∣zk4​−yk​∣A1.171.170.000.000.000.001.171.171.17B2.451.040.902.451.001.411.550.001.45C2.100.782.100.552.001.320.001.550.10易得a=0a = 0a=0,b=1.55b = 1.55b=1.55

关联系数公式:ξi(k)=y(x0(k),xi(k))=0+0.5×1.55∣x0(k)−xi(k)∣+0.5×1.55=0.775∣x0(k)−xi(k)∣+0.775 \xi_i(k) = y(x_0(k), x_i(k)) = \frac{0 + 0.5 \times 1.55}{\vert x_0(k) - x_i(k) \vert + 0.5 \times 1.55} = \frac{0.775}{\vert x_0(k) - x_i(k) \vert + 0.775}ξi​(k)=y(x0​(k),xi​(k))=∣x0​(k)−xi​(k)∣+0.5×1.550+0.5×1.55​=∣x0​(k)−xi​(k)∣+0.7750.775​

候选人∣zk1−yk∣\vert z_{k1} - y_k \vert∣zk1​−yk​∣∣zk2−yk∣\vert z_{k2} - y_k \vert∣zk2​−yk​∣∣zk3−yk∣\vert z_{k3} - y_k \vert∣zk3​−yk​∣∣zk4−yk∣\vert z_{k4} - y_k \vert∣zk4​−yk​∣ξ1\xi_1ξ1​ξ2\xi_2ξ2​ξ3\xi_3ξ3​ξ4\xi_4ξ4​A0.001.171.171.171.0000.3980.3980.398B1.411.550.001.450.3550.3331.0000.348C1.320.001.550.100.3701.0000.3330.8865)计算关联度

关联度公式:ri=1n∑k=1nξi(k)=1n∑k=1ny(x0(k),xi(k)) r_i = \frac{1}{n}\sum_{k=1}^{n} \xi_i(k) = \frac{1}{n}\sum_{k=1}^{n} y(x_0(k), x_i(k))ri​=n1​k=1∑n​ξi​(k)=n1​k=1∑n​y(x0​(k),xi​(k))

候选人ξ1\xi_1ξ1​ξ2\xi_2ξ2​ξ3\xi_3ξ3​ξ4\xi_4ξ4​rrrA1.0000.3980.3980.3980.575B0.3550.3331.0000.3480.577C0.3701.0000.3330.8860.5446)计算指标权重 公式:wi=ri∑k=1mrk(i=1,2,⋯ ,m)w_i = \frac{r_i}{\sum_{k=1}^{m} r_k} (i = 1,2,\cdots, m)wi​=∑k=1m​rk​ri​​(i=1,2,⋯,m)

候选人颜值脾气(争吵次数)身高体重rrr0.5750.5770.5770.544www0.2530.2540.2540.2396)计算得分并归一化 公式:Si=∑k=1mZik⋅wiS_i = \sum_{k=1}^{m} Z_{ik} \cdot w_iSi​=∑k=1m​Zik​⋅wi​,S~i=Si∑k=1mSk(i=1,2,⋯ ,n)\widetilde{S}_i = \frac{S_i}{\sum_{k=1}^{m} S_k} (i = 1,2,\cdots, n)Si​=∑k=1m​Sk​Si​​(i=1,2,⋯,n)

候选人颜值脾气(争吵次数)身高体重得分归一化得分A1.170.000.000.000.2960.099B1.040.902.451.001.3530.451C0.782.100.552.001.3480.450明星kun依旧选择了B

相关数据

植物花粉
365软件下载

植物花粉

⏳ 09-07 💖 584
SpringBoot – 加载配置文件的实现方式[通俗易懂]
365bet官网提现说维护

SpringBoot – 加载配置文件的实现方式[通俗易懂]

⏳ 10-07 💖 140
吱口令怎么粘贴微信?有效期多久?
365软件下载

吱口令怎么粘贴微信?有效期多久?

⏳ 08-04 💖 749