T.test 适用于小样本总体标准差未知的正态分布

  • 应用场景 单样本t检验(检验一个样本平均数与一已知的总体平均数的差异是否显著。) 两独立样本t检验 成对样本t检验t.test
  • T.test检验原理/步骤 1、根据检验目的构造原假设、备择假设,设置显著性水平 2、构造检验统计量,基于抽取的样本计算检验统计量 3、与临界值相比较,得出最终结论。
  • ABtest原理3分钟看懂ABtest
  • z检验 适用情况:大样本/(小样本、总体方差已知、正态分布)
  • Z检验和T 检验的区别
  • 置信区间 置信水平 是个概率 这次网捞到鱼的概率 95%
  • 中心极限定理 如果样本量足够大,则变量均值的采样分布将近似于正态分布 意义:中心极限定理在理论上保证了我们可以用只抽样一部分的方法,达到推测研究对象统计参数的目的。 举例:现在我们要统计全国的人的体重,看看我国平均体重是多少。当然,我们把全国所有人的体重都调查一遍是不现实的。 所以我们打算一共调查1000组,每组50个人。然后,我们求出第一组的体重平均值、第二组的体重平均值,一直到最后一组的体重平均值。中心极限定理说:这些平均值是呈现正态分布的。并且,随着组数的增加,效果会越好。最后,当我们再把1000组算出来的平均值加起来取个平均值,这个平均值会接近全国平均体重。中心极限定理应用
  • 显著性水平 通常是0.05或其他,是人为给定的
  • p值的含义 p值是一个概率,通常大家先设定一个显著性水平比如0.05,然后将p值和显著性水平来做比较从而进行决策。小于显著性水平会拒绝原假设,大于则没有足够理由拒绝原假设。
  • 假设检验原理
  • 基本思想 假设检验的基本思想是“小概率事件”原理,其统计推断方法是带有某种概率性质的反证法。小概率思想是指小概率事件在一次试验中基本上不会发生。反证法思想是先提出检验假设,再用适当的统计方法,利用小概率原理,确定假设是否成立。即为了检验一个假设H0是否正确,首先假定该假设H0正确,然后根据样本对假设H0做出接受或拒绝的决策。如果样本观察值导致了“小概率事件”发生,就应拒绝假设H0,否则应接受假设H0 [1] 。
  • 基本步骤 1、提出原假设和备择假设 2、确定检验统计量,并计算 3、将检验统计量和临界值进行比较 4、得出结论
  • 第一类错误和第二类错误 一类错误(弃真错误)是指H0为真,但却拒绝了H0,犯错风险是α。 二类错误(存伪错误)是指H1为真,但却拒绝了H1,犯错风险是β。 第一类错误和第二类错误是 “此消彼长”的关系 同时减少这两类错误的方法 只有 增加样本;
  • 小概率事件 一个事件的发生概率非常小,在一次试验中是几乎不可能发生的,但在多次重复试验中是必然发生的。在一次试验中,小概率事件不应该发生,若发生了,则否定原假设H0,接受与其对立的备择假设H1。
  • 相关系数
  • 贝叶斯定理
  • 条件概率
  • z统计量和t统计量 python z统计量和t统计量区别_决策树

  • 随机森林 森林:多个决策树 随机:每棵树都随机采取样本 功能:可以做分类,可以做回归 决策树的样子(判断条件顺序很重要):

z统计量和t统计量 python z统计量和t统计量区别_正态分布_02

决策树的组成:

z统计量和t统计量 python z统计量和t统计量区别_决策树_03

决策树的训练与测试:

z统计量和t统计量 python z统计量和t统计量区别_决策树_04

  • 最小二乘法和极大似然估计
  • 回归模型