相关系数
Correlation Coefficient)
刻画了随机变量之间的线性相关程度
- 协方差的一种标准化形式,它通过除以两个变量的标准差来消除量纲和量级的影响,使得相关系数的值域在 -1 到 1 之间。
- 提供了一个无单位的度量,使得不同数据集的相关性可以进行比较。
的值越接近 1,线性相关程度越高 的值越接近 0,线性相关程度越弱
当时:
称不相关
相互独立时, ,称 不相关
但是不相关,不一定能推出 相互独立
(如果服从二维正态分布,则:相互独立与不相关等价)
当时:
存在常数使得
的变换完全由 的线性函数给出
均方误差
最小二乘法
用
当
均方误差的最小值: