1200字范文 > 【什么是自相关矩阵自协方差矩阵互相关矩阵互协方差矩阵？】

【什么是自相关矩阵自协方差矩阵互相关矩阵互协方差矩阵？】

时间：2024-07-04 16:42:44

写在前面的话

最近看模式识别课程的时候卡在了一个地方，见下图：

协方差矩阵倒还知道，自相关矩阵？怎么推导的？它有什么意义？上网查了资料，要么晦涩难懂，要么一堆废话，这里我想尽量用最简洁的语言讲清楚它们。

前置知识

向量的内积与外积

场景：机器学习

样本（n个样本，N个维度（特征））：

X={x1,x2,...,xn}xi={wi,1,wi,2,...,wi,N}Ti∈[1,n]wj={w1,j,w2,j,...,wn,j}j∈[1,N]X=\left \{ x_1,x_2,...,x_n \right \} \\ x_i=\left \{ w_{i,1},w_{i,2},...,w_{i,N} \right \} ^T \\ i\in \left [ 1,n \right ] \\ w_j=\left \{ w_{1,j},w_{2,j},...,w_{n,j} \right \}\\ j\in \left [ 1,N \right ] \\ X={x1,x2,...,xn}xi={wi,1,wi,2,...,wi,N}Ti∈[1,n]wj={w1,j,w2,j,...,wn,j}j∈[1,N]

这里的i和j与下面的i和j无关！！！

具体样例（3个样本，4个维度（特征））：

X={x1,x2,x3}x1={1,2,3,4}Tx2={3,2,1,4}Tx3={2,2,3,4}TX=\left \{ x_1,x_2,x_3 \right \} \\ x_1=\left \{ 1,2,3,4 \right \} ^T\\ x_2=\left \{ 3,2,1,4 \right \} ^T\\ x_3=\left \{ 2,2,3,4 \right \} ^T X={x1,x2,x3}x1={1,2,3,4}Tx2={3,2,1,4}Tx3={2,2,3,4}T

方差（后面会频繁用到方差）：

自协方差矩阵

首先定义由各样本向量均值构成的向量MXM_XMX ，则样本向量XXX构成的协方差矩阵记为：

MX=E(X)={m1,m2,...,mN}TCX,X=E{(X−MX)(X−MX)T}=[c1,1...c1,N.........cN,1...cN,N]M_X=E\left ( X \right )=\left \{ m_1,m_2,...,m_N \right \}^T \\ C_{X,X}=E\left\{ \left ( X-M_X \right )\left ( X-M_X \right ) ^T \right\} =\begin{bmatrix} c_{1,1} & ... & c_{1,N}\\ ... & ... & ...\\ c_{N,1} & ... &c_{N,N} \end{bmatrix} MX=E(X)={m1,m2,...,mN}TCX,X=E{(X−MX)(X−MX)T}=⎣⎡c1,1...cN,1.........c1,N...cN,N⎦⎤

ci,ic_{i,i}ci,i是wiw_iwi的方差：

ci,i=E{(wi−MX,i)(wi−MX,i)T}=E{∣wi−MX,i∣2}c_{i,i}=E\left\{ \left ( w_i-M_{X,i} \right )\left ( w_i-M_{X,i} \right ) ^T \right\} =E\left \{ \left | w_i-M_{X,i} \right |^2 \right \} ci,i=E{(wi−MX,i)(wi−MX,i)T}=E{∣wi−MX,i∣2}

ci,jc_{i,j}ci,j是wiw_iwi和wjw_jwj的协方差：

ci,j=E{(wi−MX,i)(wj−MX,j)T}c_{i,j}=E\left\{ \left ( w_i-M_{X,i} \right )\left ( w_j-M_{X,j}\right ) ^T \right\} ci,j=E{(wi−MX,i)(wj−MX,j)T}

通过公式可以知道，自协方差矩阵也是Hermitian矩阵。自协方差矩阵也被称为方差矩阵，用符号Var(X)Var(X)Var(X)表示。

注意，自协方差矩阵是N*N的方阵，理解协方差矩阵的关键就在于它的计算是不同维度之间的协方差，而不是不同样本之间。拿到一个样本矩阵，最先要明确的就是一行是一个样本还是一个维度。在这里一行是一个维度，一列是一个样本，这一点一定要记住！

具体样例

X={x1,x2,x3}x1={1,2,3,4}Tx2={3,2,1,4}Tx3={2,2,3,4}TX=[132222313444]X=\left \{ x_1,x_2,x_3 \right \} \\ x_1=\left \{ 1,2,3,4 \right \} ^T\\ x_2=\left \{ 3,2,1,4 \right \} ^T\\ x_3=\left \{ 2,2,3,4 \right \} ^T\\ X=\begin{bmatrix} 1 & 3 & 2 \\ 2 & 2 & 2 \\ 3 & 1 & 3 \\ 4 & 4 & 4 \\ \end{bmatrix} X={x1,x2,x3}x1={1,2,3,4}Tx2={3,2,1,4}Tx3={2,2,3,4}TX=⎣⎢⎢⎡123432142234⎦⎥⎥⎤

MX=E(X)={m1,m2,...,mN}Tm1=(1+3+2)/3=2m2=(2+2+2)/3=2m3=(3+1+3)/3=2.5m4=(4+4+4)/3=4MX={2,3,2.5,4}TM_X=E\left ( X \right )=\left \{ m_1,m_2,...,m_N \right \} ^T \\ m_1=(1+3+2)/3=2\\ m_2=(2+2+2)/3=2\\ m_3=(3+1+3)/3=2.5\\ m_4=(4+4+4)/3=4\\ M_X=\left \{ 2,3,2.5,4 \right \} ^T MX=E(X)={m1,m2,...,mN}Tm1=(1+3+2)/3=2m2=(2+2+2)/3=2m3=(3+1+3)/3=2.5m4=(4+4+4)/3=4MX={2,3,2.5,4}T

CX,X=E{(X−MX)(X−MX)T}=[c1,1...c1,N.........cN,1...cN,N]C_{X,X}=E\left\{ \left ( X-M_X \right )\left ( X-M_X \right ) ^T \right\} =\begin{bmatrix} c_{1,1} & ... & c_{1,N}\\ ... & ... & ...\\ c_{N,1} & ... &c_{N,N} \end{bmatrix} CX,X=E{(X−MX)(X−MX)T}=⎣⎡c1,1...cN,1.........c1,N...cN,N⎦⎤

X−MX=[1−23−22−22−32−32−33−2.51−2.53−2.54−44−44−4]=[−110−1−1−10.5−1.50.5000]X-M_X =\begin{bmatrix} 1-2 & 3-2 & 2-2 \\ 2-3 & 2-3 & 2-3 \\ 3-2.5 & 1-2.5 & 3-2.5 \\ 4-4 & 4-4 & 4-4 \\ \end{bmatrix}= \begin{bmatrix} -1 & 1 & 0 \\ -1 & -1 & -1 \\ 0.5 & -1.5 & 0.5 \\ 0 & 0 & 0 \\ \end{bmatrix} X−MX=⎣⎢⎢⎡1−22−33−2.54−43−22−31−2.54−42−22−33−2.54−4⎦⎥⎥⎤=⎣⎢⎢⎡−1−10.501−1−1.500−10.50⎦⎥⎥⎤

(X−MX)T=[−1−10.501−1−1.500−10.50]\left ( X-M_X \right ) ^T=\begin{bmatrix} -1 & -1 & 0.5 & 0\\ 1 & -1 & -1.5 & 0\\ 0 & -1 & 0.5 & 0\\ \end{bmatrix} (X−MX)T=⎣⎡−110−1−1−10.5−1.50.5000⎦⎤

ci,ic_{i,i}ci,i是wiw_iwi的方差：

ci,i=E{(wi−MX,i)(wi−MX,i)T}=E{∣wi−MX,i∣2}w1−MX,1=[1−23−22−2]T=[−110]T(x1−MX,1)(x1−MX,1)T=(−1)∗(−1)+(1)∗(1)+0∗0=2E{∣w1−MX,1∣2}=2/n=2/3c_{i,i}=E\left\{ \left ( w_i-M_{X,i} \right )\left ( w_i-M_{X,i} \right ) ^T \right\} =E\left \{ \left | w_i-M_{X,i} \right |^2 \right \} \\ w_1-M_{X,1} =\begin{bmatrix} 1-2 & 3-2 & 2-2 \\ \end{bmatrix}^T=\begin{bmatrix} -1 & 1 & 0 \\ \end{bmatrix}^T\\ \left ( x_1-M_{X,1} \right )\left ( x_1-M_{X,1} \right ) ^T=(-1)*(-1)+(1)*(1)+0*0=2\\ E\left \{ \left | w_1-M_{X,1}\right |^2 \right \} =2/n=2/3 ci,i=E{(wi−MX,i)(wi−MX,i)T}=E{∣wi−MX,i∣2}w1−MX,1=[1−23−22−2]T=[−110]T(x1−MX,1)(x1−MX,1)T=(−1)∗(−1)+(1)∗(1)+0∗0=2E{∣w1−MX,1∣2}=2/n=2/3

在matlab里面是除以样本数减1的差值，即n-1。

ci,jc_{i,j}ci,j是wiw_iwi和wjw_jwj的协方差：

ci,j=E{(wi−MX,i)(wj−MX,j)T}w1−MX,1=[1−23−22−2]T=[−110]Tw2−MX,2=[2−32−32−3]T=[−1−1−1]T(x1−MX,1)(x2−MX,2)T=(−1)∗(−1)+(1)∗(−1)+0∗(−1)=0E{(wi−MX,i)(wj−MX,j)T}=0/n=0c_{i,j}=E\left\{ \left ( w_i-M_{X,i} \right )\left ( w_j-M_{X,j}\right ) ^T \right\} \\ w_1-M_{X,1} =\begin{bmatrix} 1-2 & 3-2 & 2-2 \\ \end{bmatrix}^T=\begin{bmatrix} -1 & 1 & 0 \\ \end{bmatrix}^T\\ w_2-M_{X,2} =\begin{bmatrix} 2-3 & 2-3 & 2-3 \\ \end{bmatrix}^T=\begin{bmatrix} -1 & -1 & -1 \\ \end{bmatrix}^T\\ \left ( x_1-M_{X,1} \right )\left ( x_2-M_{X,2} \right ) ^T=(-1)*(-1)+(1)*(-1)+0*(-1)=0\\ E\left\{ \left ( w_i-M_{X,i} \right )\left ( w_j-M_{X,j}\right ) ^T \right\}=0/n=0 ci,j=E{(wi−MX,i)(wj−MX,j)T}w1−MX,1=[1−23−22−2]T=[−110]Tw2−MX,2=[2−32−32−3]T=[−1−1−1]T(x1−MX,1)(x2−MX,2)T=(−1)∗(−1)+(1)∗(−1)+0∗(−1)=0E{(wi−MX,i)(wj−MX,j)T}=0/n=0

自相关矩阵

自相关矩阵定义为样本向量与自身的外积的数学期望，其实就是自协方差矩阵不减均值向量就好：

RX,X=E(XXT)=[r1,1...r1,N.........rN,1...rN,N]R_{X,X}=E\left ( XX^T \right ) =\begin{bmatrix} r_{1,1} & ... & r_{1,N}\\ ... & ... & ...\\ r_{N,1} & ... &r_{N,N} \end{bmatrix} RX,X=E(XXT)=⎣⎡r1,1...rN,1.........r1,N...rN,N⎦⎤

ri,ir_{i,i}ri,i是wiw_iwi的自相关系数：

ri,i=E{wiwiT}=E{∣wi∣2}r_{i,i}=E\left\{ w_i w_i ^T \right\}=E\left \{ \left | w_i \right |^2 \right \} ri,i=E{wiwiT}=E{∣wi∣2}

ri,jr_{i,j}ri,j是wiw_iwi和wjw_jwj的互相关系数：

ri,j=E{wiwjT}r_{i,j}=E\left \{ w_iw_j^T \right \} ri,j=E{wiwjT}

自相关矩阵是复共轭对称的，即为Hermitian矩阵。

这里就不举例了，计算方法都相似~

自相关矩阵与自协方差矩阵的关系

自相关矩阵与自协方差矩阵存在如下关系：

CX,X=RX,X−MXMXTC_{X,X}=R_{X,X}-M_XM_X^T CX,X=RX,X−MXMXT

互协方差矩阵

考虑又一个数据集，样本数量无所谓，但是特征数一定要是N：

Y={y1,y2,...,yn}TY=\left \{ y_1,y_2,...,y_n \right \}^T Y={y1,y2,...,yn}T

通过自协方差矩阵的推广，可以得到样本向量XXX与YYY的互协方差矩阵，定义为：

MX=E(X)MY=E(Y)CX,Y=E{(X−MX)(Y−MY)T}=[cwx1,wy1...cwx1,wyN.........cwxN,wy1...cwxN,wyN]M_X=E\left ( X \right ) \\ M_Y=E\left ( Y \right ) \\ C_{X,Y}=E\left\{ \left ( X-M_X \right )\left ( Y-M_Y \right ) ^T \right\} =\begin{bmatrix} c_{w_{x1},w_{y1}} & ... & c_{w_{x1},w_{yN}}\\ ... & ... & ...\\ c_{w_{xN},w_{y1}} & ... &c_{w_{xN},w_{yN}} \end{bmatrix} MX=E(X)MY=E(Y)CX,Y=E{(X−MX)(Y−MY)T}=⎣⎡cwx1,wy1...cwxN,wy1.........cwx1,wyN...cwxN,wyN⎦⎤

互协方差表示两个向量对应元素减去各自期望，再相乘再做期望。

(X−MX),(Y−MY)T\left ( X-M_X \right ),\left ( Y-M_Y \right ) ^T(X−MX),(Y−MY)T表示两个零期望的随机序列。

互相关矩阵

通过自相关矩阵的推广，可以得到样本向量XXX与YYY的互相关矩阵，定义为：

RX,Y=E(XYT)=[rwx1,wy1...rwx1,wyN.........rwxN,wy1...rwxN,wyN]R_{X,Y}=E\left ( XY^T \right ) =\begin{bmatrix} r_{w_{x1},w_{y1}} & ... & r_{w_{x1},w_{yN}}\\ ... & ... & ...\\ r_{w_{xN},w_{y1}} & ... &r_{w_{xN},w_{yN}} \end{bmatrix} RX,Y=E(XYT)=⎣⎡rwx1,wy1...rwxN,wy1.........rwx1,wyN...rwxN,wyN⎦⎤

互相关表示两个向量对应元素相乘的期望。