|
本帖最后由 wufaxian 于 2022-2-16 08:56 编辑
有这样一道题有这样一组向量x(x1,x2,x3,x4……xm) ,x1,x2,x3,x4都是二维平面上的点。因此他们都是二维向量,这些向量都是已经中心化的向量。现在要求这些向量向平面向量u 上投影后(投影后的向量记作y(y1,y2,y3,y4……ym),y也是一组二维向量)的方差,于是有下列等式:
var(y)=var(u\(\cdot\)x)=\(\frac{1}{m}\sum_{i=1}^my_i^2=\frac{1}{m}\sum_{i=1}^m\left( x_i^Tu\right)^2=\frac{1}{m}\sum_{i=1}^mu^Tx_ix\ _i^Tu\)
从上面可以看出最早的\(\frac{1}{m}\sum_{i=1}^my_i^2\) 这就是最原始的方差公式。按照方差公式定义。这里的\(y_{i }^{2 }\) 就是\(y_iy_i\) ,而没有点乘的意思。可是到了最后一步就变成点乘了。点乘和乘法是不一样的运算规则。可是到了这里怎么乘法就等同于点乘了?
进一步,一组数据的方差看作一组数据与均值距离的平方。从上面的逻辑看,一组向量的均值应该就是一组向量各个维度上数值的算术平均值。因为只有这样在中心化以后,二维平面上的点才会围绕原点"对称"分布。那这样向量方差的含义就是:所有点到原点距离的平方?
|
|