FindMyFUN

峰度(Kurtosis)和偏度(Skewness)

如上图所示,可以看到与使用matplotlib作的直方图最大的区别在于有一条密度曲线(KDE),可以通过设置参数去掉这条默认的曲线。另外,由上图可以知道房价呈现正态分布,还可以看到两个统计学中的概念:峰度(Kurtosis)和偏度(Skewness)

峰度:峰度(Kurtosis)是描述某变量所有取值分布形态陡缓程度的统计量。

计算公式:β = M_4 / σ^4

它是和正态分布相比较的。

偏度:偏度(Skewness)是描述某变量取值分布对称性的统计量。

计算公式:S = (X^ - M_0) / δ

Skewness越大,分布形态偏移程度越大。


BASE ON Kaggle
Getting Started Prediction Competition
House Prices: Advanced Regression Techniques
Thx: marsggbo

当前页面是本站的「Google AMP」版。查看和发表评论请点击:完整版 »