为什么要这样定义呢?对于 X 和 Y 两个变量,E[X] 表示 X 变量的的期望值(即 X 的平均值),E[Y] 表示 Y 变量的期望值(即 Y 的平均值)。(X-E[X])×(Y-E[Y]) 表示 X 和 Y 的每个样本偏移值相乘,从整体样本上看,两个变量的偏移值的乘积能够表示两个变量变化的方向,即是同向变化还是反向变化。
通过下图就能很容易感受这种关系,可以看到 X 和 Y 两个变量的关系变化。当协方差为正时,整体从左往右上升趋势,表示正相关,因为 X 增大 Y 也增大。此外整个带状越细相关性就越大。当协方差为负时则反过来是负相关的。而接近 0 时则表示两个变量不太相关,很明显因为 X 增大 Y 基本不变。