1.介绍
主成分分析就是设法将原来众多具有一定相关性的指标,重新组合成几个新的相互无关的综合指标,并且尽可能多地反映原来指标的信息。它是数学上的一种降维方法。
2.案例分析
其中 X1表示人均食品消费; X2表示人均衣着消费; X3表示家庭设备及服务人均消费; X4表示医疗保健人均消费; X5表示交通和通信人均消费; X6表示教育文化娱乐服务人均消费; 表X7示居住的人均消费; X8杂项商品和服务;Y表示年。
主要步骤: (1)对原来的p个指标进行标准化,以消除变量在水平和量纲上的影响; (2)根据标准化后的数据矩阵求出相关系数矩阵 ; (3)求出相关系数矩阵的特征根和特征向量 和对应的特征向量; (4)计算主成分贡献率及累计贡献率;一般取累计贡献率达85-95%的特征值 ,所对应的 个主成分; (5)计算主成分荷载; (6)对主成分载荷归一化;
clc,clear X=[2297.86 589.62 474.74 164.19 290.91 626.21 295.20 199.03; 2262.19 571.69 461.25 185.90 337.83 604.78 354.66 198.96; 2303.29 589.99 516.21 236.55 403.92 730.05 438.41 225.80; 2308.70 551.14 476.45 293.23 406.44 785.74 494.04 254.10; 2337.65 589.28 509.82 334.05 442.50 850.15 563.72 246.51; 2418.96 618.60 454.20 429.60 615.00 1065.12 594.48 164.28; 2702.34 735.01 475.36 459.69 790.26 1025.99 741.60 187.81; 3015.32 779.68 474.15 537.95 865.45 1200.52 903.22 196.77; 3135.65 849.53 583.50 629.32 929.92 1391.11 882.41 221.85; 3415.92 1038.98 615.74 705.72 976.02 1449.49 954.56 242.26];
x=zscore(X); %数据标准化; std=CORRCOEF(x); %计算相关系数矩阵 [vec,val]=eig(std); %求特征值(val)及特征向量(vec) newval=diag(val) ; %将特征值作成一个新向量 [y,ii]=sort(newval) %对特征根进行排序,y为排序结果,ii为索引 rate=y/sum(y) %计算贡献率 sumrate=0; newi=[]; for k=length(y)????1 sumrate=sumrate+rate(k); newi(length(y)+1-k)=ii(k); if sumrate>0.85 break; end fprintf(‘主成分数:%g\n\n’,length(newi)); for i=1:1:length(newi) %计算载荷aa for j=1:1:length(y) aa(i,j)=sqrt(newval(newi(i)))*vec(j,newi(i)); end end aaa=aa.*aa; %主成分载荷归一化zcfhz for i=1:1:length(newi) for j=1:1:length(y) zcfhz(i,j)=aa(i,j)/sqrt(sum(aaa(i,:))); end end fprintf(‘主成分载荷:\n’, zcfhz) %输出主成分载荷zcfhzC
主成分数:2 计算主成分载荷: aa = 0.9820 0.9632 0.7666 0.9831 0.9657 0.9763 0.9620 0.1481 -0.0241 0.0253 0.5461 -0.1018 -0.2272 -0.1192 -0.1300 0.9558 主成分载荷(单位化后): a = 0.3919 0.3844 0.3059 0.3923 0.3854 0.3896 0.3839 0.0591 -0.0210 0.0221 0.4778 -0.0891 -0.1988 -0.1043 -0.1138 0.8363 因此重庆城镇居民消费水平的第一,二主成分:
1.在第一主成分的表达式中,我们可以看出第一项、二项、四项、五项、六项、七项的系数比较大,这6项指标对城镇居民消费水平的影响较大。其中食品消费和医疗保健消费系数比另外几项都大,说明居民现在很注重吃和健康两方面。 2.在第二主成分表达式中,只有第八项的系数比较的系数比较大,远远超过其他指标的系数,因此可以单独看作是杂项商品和服务的影响,说明人们的生活用品等杂项商品及服务在消费水平中也占据了很大的比例。
|
请发表评论