检验样本数据概率分布(例如正态分布)的方法。
使用方法如下:

fig = plt.figure()
res = stats.probplot(train[‘SalePrice’], plot=plt) #默认检测是正态分布
plt.show()

简单说Q-Q图;stats.probplot(QQ图)_数据


注意: 红色线条表示正态分布,蓝色线条表示样本数据蓝色越接近红色参考线,说明越符合预期分布(这是是正态分布)

q-q 图是通过比较数据和正态分布的分位数是否相等来判断数据是不是符合正态分布

注:
学习于​​这篇文章​​