Z
1
=
μ
11
X
1
+
μ
12
X
2
+
…μ
1p
X
p
Z
2
=
μ
21
X
1
+
μ
22
X
2
+
…μ
2p
X
p
……
……
……
Z
p
=
μ
p1
X
1
+
μ
p2
X
2
+
…μ
pp
X
p
主成分是不相关的线性组合
Z
1
,
Z
2
……
Z
p
,并且
Z
1
是
X
1
,
X
2
…
X
p
的线性组
合中方差最大者,
Z
2
是与
Z
1
不相关的线性组合中方差最大者,…,
Z
p
是与
Z
1
,
Z
2
……
Z
p-1
都不相关的线性组合中方差最大者。
(三)主成分分析法基本步骤
第一步:设估计样本数为
n
,选取的财务指标数为
p
,则由估计样本的原始
数据可得矩阵
X=(x
ij
)
m
×
p
,其中
x
ij
表示第
i
家上市公司的第
j
项财务指标数据。
第二步:
为了消除各项财务指标之间在量纲化和数量级上的差别,
对指标数
据进行标准化,得到标准化矩阵(系统自动生成)
。
第三步:根据标准化数据矩阵建立协方差矩阵
R
,是反映标准化后的数据之
间相关关系密切程度的统计指标,值越大,说明有必要对数据进行主成分分析。
其中,
R
ij
(
i
,
j=1
,
2
,…,
p
)为原始变量
X
i
与
X
j
的相关系数。
R
为实对称矩阵
(即
R
ij
=R
ji
)
,只需计算其上三角元素或下三角元素即可,其计算公式为:
2
2
1
1
)
(
)
(
)
(
)
(
j
kj
n
k
i
kj
j
kj
n
k
i
kj
ij
X
X
X
X
X
X
X
X
R
第四步:根据协方差矩阵
R
求出特征值、主成分贡献率和累计方差贡献率,
确定主成分个数。
解特征方程
0
R
E
,
求出特征值λ
i
(
i=1
,
2
,
…,
p
)
。
因为
R
是正定矩阵,所以其特征值λ
i
都为正数,将其按大小顺序排列,即λ
1
≥λ
2
≥…≥λ
i
≥
0
。特征值是各主成分的方差,它的大小反映了各个主成分的
影响力。主成分
Z
i
的贡献率
W
i
=
p
j
j
j
1
,累计贡献率为