• 设为首页
  • 点击收藏
  • 手机版
    手机扫一扫访问
    迪恩网络手机版
  • 关注官方公众号
    微信扫一扫关注
    公众号

Matlab主成分分析(根据例子学原理)

原作者: [db:作者] 来自: [db:来源] 收藏 邀请

1.介绍

主成分分析就是设法将原来众多具有一定相关性的指标,重新组合成几个新的相互无关的综合指标,并且尽可能多地反映原来指标的信息。它是数学上的一种降维方法。

2.案例分析


其中 X1表示人均食品消费; X2表示人均衣着消费; X3表示家庭设备及服务人均消费; X4表示医疗保健人均消费; X5表示交通和通信人均消费; X6表示教育文化娱乐服务人均消费; 表X7示居住的人均消费; X8杂项商品和服务;Y表示年。

主要步骤:
(1)对原来的p个指标进行标准化,以消除变量在水平和量纲上的影响;
(2)根据标准化后的数据矩阵求出相关系数矩阵 ;
(3)求出相关系数矩阵的特征根和特征向量 和对应的特征向量;
(4)计算主成分贡献率及累计贡献率;一般取累计贡献率达85-95%的特征值 ,所对应的 个主成分;
(5)计算主成分荷载;
(6)对主成分载荷归一化;

clc,clear
X=[2297.86 589.62 474.74 164.19 290.91 626.21 295.20 199.03;
2262.19 571.69 461.25 185.90 337.83 604.78 354.66 198.96;
2303.29 589.99 516.21 236.55 403.92 730.05 438.41 225.80;
2308.70 551.14 476.45 293.23 406.44 785.74 494.04 254.10;
2337.65 589.28 509.82 334.05 442.50 850.15 563.72 246.51;
2418.96 618.60 454.20 429.60 615.00 1065.12 594.48 164.28;
2702.34 735.01 475.36 459.69 790.26 1025.99 741.60 187.81;
3015.32 779.68 474.15 537.95 865.45 1200.52 903.22 196.77;
3135.65 849.53 583.50 629.32 929.92 1391.11 882.41 221.85;
3415.92 1038.98 615.74 705.72 976.02 1449.49 954.56 242.26];

x=zscore(X); %数据标准化;
std=CORRCOEF(x); %计算相关系数矩阵
[vec,val]=eig(std); %求特征值(val)及特征向量(vec)
newval=diag(val) ; %将特征值作成一个新向量
[y,ii]=sort(newval) %对特征根进行排序,y为排序结果,ii为索引
rate=y/sum(y) %计算贡献率
sumrate=0; newi=[];
for k=length(y)????1
sumrate=sumrate+rate(k);
newi(length(y)+1-k)=ii(k);
if sumrate>0.85 break;
end
fprintf(‘主成分数:%g\n\n’,length(newi));
for i=1:1:length(newi) %计算载荷aa
for j=1:1:length(y)
aa(i,j)=sqrt(newval(newi(i)))*vec(j,newi(i));
end
end
aaa=aa.*aa; %主成分载荷归一化zcfhz
for i=1:1:length(newi)
for j=1:1:length(y)
zcfhz(i,j)=aa(i,j)/sqrt(sum(aaa(i,:)));
end
end
fprintf(‘主成分载荷:\n’, zcfhz) %输出主成分载荷zcfhzC

主成分数:2
计算主成分载荷:
aa =
0.9820 0.9632 0.7666 0.9831 0.9657 0.9763 0.9620 0.1481
-0.0241 0.0253 0.5461 -0.1018 -0.2272 -0.1192 -0.1300 0.9558
主成分载荷(单位化后):
a =
0.3919 0.3844 0.3059 0.3923 0.3854 0.3896 0.3839 0.0591
-0.0210 0.0221 0.4778 -0.0891 -0.1988 -0.1043 -0.1138 0.8363
因此重庆城镇居民消费水平的第一,二主成分:

1.在第一主成分的表达式中,我们可以看出第一项、二项、四项、五项、六项、七项的系数比较大,这6项指标对城镇居民消费水平的影响较大。其中食品消费和医疗保健消费系数比另外几项都大,说明居民现在很注重吃和健康两方面。
2.在第二主成分表达式中,只有第八项的系数比较的系数比较大,远远超过其他指标的系数,因此可以单独看作是杂项商品和服务的影响,说明人们的生活用品等杂项商品及服务在消费水平中也占据了很大的比例。


鲜花

握手

雷人

路过

鸡蛋
该文章已有0人参与评论

请发表评论

全部评论

专题导读
热门推荐
阅读排行榜

扫描微信二维码

查看手机版网站

随时了解更新最新资讯

139-2527-9053

在线客服(服务时间 9:00~18:00)

在线QQ客服
地址:深圳市南山区西丽大学城创智工业园
电邮:jeky_zhao#qq.com
移动电话:139-2527-9053

Powered by 互联科技 X3.4© 2001-2213 极客世界.|Sitemap