统计学(三) 假设检验

本文最后更新于:2023年2月28日 下午

1. 相关概念

假设检验 (hypothesis test)

先对总体参数提出某种假设,然后利用祥本信息判断假设是否成立的过程。

假设 (hypothesis)

对总体参数的具体数值做出的猜测陈述。

  • 原假设 (null hypothesis):通常将研究者想收集证据予以反对的假设,记作H0H_0
  • 备择假设 (alternative hypothesis):通常将研究者想收集证据予以支持的假设,与原假设对立,记作H1H_1

根据备择假设中对总体参数做出的假设区间(方向性)可以将假设分为:

  • 单尾/单侧检验 (one-tailed test):备择假设具有特定的方向性(含有符号“>”,"<"等)

  • 双尾/双侧检验 (two-tailed test):备择假设没有特定的方向性(含有符号“\neq”等)

假设检验的决策

假设检验的结论与后果

第Ⅰ类错误 (type Ⅰ error)

当原假设为真时拒绝原假设,又称弃真错误,第Ⅰ类错误犯错概率记作 α\alpha

第Ⅱ类错误 (type Ⅱ error)

当原假设为假时未拒绝原假设,又称取伪错误,第Ⅱ类错误犯错概率记作 β\beta

显著性水平 (level of significance)

第Ⅰ类错误犯错概率,记作 α\alpha

通常用显著性水平度量假设检验结论的可靠性

检验统计量 (test statistic)

用以对假设作出决策的样本统计量,实际上是总体参数的点估计量

标准化检验统计量通常简称为检验统计量(检验统计量标准化后可用标准正态分布校验,点估计量的抽样分布满足中心极限定理)

检验统计量标准化公式

拒绝域 (rejection region)

能够拒绝原假设的检验统计量的所有可能取值的集合,由显著性水平 α\alpha 围成的面积

临界值 (critical value)

拒绝域的边界值

P值 (p-value)

也称观察到的显著性水平 (observed significance level),第Ⅰ类错误犯错概率的实际观测值

  • 左侧检验—— H0H_0μμ0\mu\geq\mu_0H1H_1μ<μ0\mu<\mu_0

    P=P(zztrueμ=μ0)P =P(z \leq z_{true}| \mu=\mu_0)

  • 右侧检验—— H0H_0μμ0\mu\leq\mu_0H1H_1μ>μ0\mu>\mu_0

    P=P(zztrueμ=μ0)P=P(z \geq z_{true}| \mu=\mu_0)

  • 双侧检验—— H0H_0μ=μ0\mu=\mu_0H1H_1μμ0\mu\neq\mu_0

    P=2P(zztrueμ=μ0)P=2P(z \geq |z_{true}|| \mu=\mu_0)

假设检验的步骤

  1. 选择总体参数,作出原假设 H0H_0 和备择假设 H1H_1;确定显著性水平 α\alpha

  2. 计算抽取的随机样本的检验统计量

  3. 由显著性水平 α\alpha得到临界值,确定拒绝域

  4. 比较检验统计量与临界值,做出决策

    检验统计量落入拒绝域,则拒绝原假设 H0H_0

    检验统计量未落入拒绝域,则不拒绝原假设 H0H_0

  5. 或计算 PP值,与给定显著性水平α\alpha 比较,做出决策

    单尾检验:

    PP<α< \alpha ,则拒绝原假设 H0H_0

    PP>α> \alpha ,则不拒绝原假设 H0H_0

    双尾检验:

    PP<α2< \frac{\alpha}{2} ,则拒绝原假设 H0H_0

    PP>α2> \frac{\alpha}{2} ,则不拒绝原假设 H0H_0

    理解:

    H0H_0为真拒绝H0H_0的概率小了(α\alpha),则H0H_0为假不拒绝H0H_0的概率大了(β\beta),因此拒绝 H0H_0

P值、α是曲线面积;计算出的检验统计量、临界值是随机变量的值

2. 总体均值的假设检验

graph LR;
0[均值] --- 1[大样本] ---> a[正态分布检验];
0 --- 2[小样本] --- 已知方差的正态总体 ---> a;
2 --- 未知方差的正态总体 ---> t检验

正态分布的检验

条件:

大样本 或 已知总体方差且总体正态分布的小样本

步骤:

假设->计算检验统计量->通过临界值或p值做出决策

例题

  1. 提出假设(左侧检验)

    H0:μ1.35,H1:μ<1.35H_0:\mu\geq1.35 ,H_1:\mu<1.35

  2. 计算检验统计量

    x=1.3152,s=0.3657\overline x =1.3152,s=0.3657

    标准化检验统计量

  3. 根据临界值做出决策

    由显著性谁平 α=0.01\alpha=0.01,查标准正态分布表得到 zα=z0.01=2.33z_\alpha=z_{0.01}=-2.33,拒绝域为 z2.33z\leq-2.33

    因此,检验统计量 2.6061-2.6061在拒绝域内,拒绝原假设 H0H_0

  4. 根据PP 值做出决策

    P=P(z2.6061μ=μ0)=0.04579P =P(z \leq -2.6061| \mu=\mu_0)=0.04579P<α=0.01P< \alpha=0.01 ,拒绝原假设 H0H_0

t检验

目的:

通过比较不同数据的均值,研究两组数据之间是否存在显著差异。

条件:

未知总体方差且总体正态分布的小样本

步骤:

假设->计算检验统计量->通过临界值或p值做出决策

例题

  1. 提出假设(双侧检验)

    H0:μ=12,H1:μ12H_0:\mu=12 ,H_1:\mu\ne12

  2. 计算检验统计量

    x=11.89,s=0.4932\overline x =11.89,s=0.4932

    tt检验统计量

  3. 根据临界值做出决策

    由显著性谁平 α=0.05\alpha=0.05,自由度 n1=101=9n-1=10-1=9 ,查 tt 分布表得到 tα(n1)=t0.025(9)=2.262t_\alpha(n-1)=t_{0.025}(9)=-2.262,拒绝域为 t2.262|t|\geq2.262

    因此,检验统计量 0.70530.7053 不在拒绝域内,不拒绝原假设 H0H_0

  4. 根据PP 值做出决策

    P=P(t2.6061μ=μ0)=0.498P =P(t \geq |-2.6061|| \mu=\mu_0)=0.498P>α=0.05P>\alpha=0.05 ,不拒绝原假设 H0H_0


本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!