1200字范文,内容丰富有趣,写作的好帮手!
1200字范文 > 机器学习(MACHINE LEARNING)主成分分析(PCA降维)

机器学习(MACHINE LEARNING)主成分分析(PCA降维)

时间:2023-12-25 06:14:05

相关推荐

机器学习(MACHINE LEARNING)主成分分析(PCA降维)

文章目录

1 概述2 spss实现3 输出4 EXCEL权重计算(不接上面内容)

1 概述

主成分分析是一种统计学方法,它主要通过降维来简化数据结构,将多个变量转化成少数的几个综合变量,而综合变量能很好地表达原来多个变量的大部分信息,变量之间需要要具备相关性,而经过分析后的变量之间没有相关性。

主成分分析(Principal Component Analysis,PCA), 是一种统计方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。

在许多领域的研究与应用中,往往需要对反映事物的多个变量进行大量的观测,收集大量数据以便进行分析寻找规律。多变量大样本无疑会为研究和应用提供了丰富的信息,但也在一定程度上增加了数据采集的工作量,更重要的是在多数情况下,许多变量之间可能存在相关性,从而增加了问题分析的复杂性,同时对分析带来不便。如果分别对每个指标进行分析,分析往往是孤立的,而不是综合的。盲目减少指标会损失很多信息,容易产生错误的结论。

因此需要找到一个合理的方法,在减少需要分析的指标同时,尽量减少原指标包含信息的损失,以达到对所收集数据进行全面分析的目的。由于各变量间存在一定的相关关系,因此有可能用较少的综合指标分别综合存在于各变量中的各类信息。主成分分析与因子分析就属于这类降维的方法。

2 spss实现

3 输出

相关性矩阵

VAR00002 VAR00003 VAR00004 VAR00005 VAR00006 VAR00007 VAR00008 VAR00009 VAR00010 VAR00011

相关性 VAR00002 1.000 -.094 -.052 .967 .979 .923 .922 .941 .637 .826

VAR00003 -.094 1.000 -.171 .113 .074 .214 .093 -.043 .081 .273

VAR00004 -.052 -.171 1.000 -.132 -.050 -.098 -.176 .013 -.125 -.086

VAR00005 .967 .113 -.132 1.000 .985 .963 .939 .935 .705 .898

VAR00006 .979 .074 -.050 .985 1.000 .973 .940 .962 .714 .913

VAR00007 .923 .214 -.098 .963 .973 1.000 .971 .937 .717 .934

VAR00008 .922 .093 -.176 .939 .940 .971 1.000 .897 .624 .848

VAR00009 .941 -.043 .013 .935 .962 .937 .897 1.000 .836 .929

VAR00010 .637 .081 -.125 .705 .714 .717 .624 .836 1.000 .882

VAR00011 .826 .273 -.086 .898 .913 .934 .848 .929 .882 1.000

查看结果中的“总方差解释”,提取的主成分个数,一般有两种条件:1)特征值>1,2)方差累积贡献率>80%,在85%—95%;

所以选择成分1和成分2

4 EXCEL权重计算(不接上面内容)

由于前5个成分方差累积贡献率为85.564%>85%,因此提取前5个主成分

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。