本文最后更新于：2023年2月28日下午

1. 相关概念

假设检验 (hypothesis test)

先对总体参数提出某种假设,然后利用祥本信息判断假设是否成立的过程。

假设 (hypothesis)

对总体参数的具体数值做出的猜测陈述。

原假设 (null hypothesis)：通常将研究者想收集证据予以反对的假设，记作 $H_0$

备择假设 (alternative hypothesis)：通常将研究者想收集证据予以支持的假设，与原假设对立，记作 $H_1$

根据备择假设中对总体参数做出的假设区间（方向性）可以将假设分为：

单尾/单侧检验 (one-tailed test)：备择假设具有特定的方向性（含有符号“>”，"<"等）

双尾/双侧检验 (two-tailed test)：备择假设没有特定的方向性（含有符号“ $\neq$ ”等）

假设检验的决策

假设检验的结论与后果

第Ⅰ类错误 (type Ⅰ error)

当原假设为真时拒绝原假设，又称弃真错误，第Ⅰ类错误犯错概率记作 $\alpha$

第Ⅱ类错误 (type Ⅱ error)

当原假设为假时未拒绝原假设，又称取伪错误，第Ⅱ类错误犯错概率记作 $\beta$

显著性水平 (level of significance)

第Ⅰ类错误犯错概率，记作 $\alpha$

通常用显著性水平度量假设检验结论的可靠性

检验统计量 (test statistic)

用以对假设作出决策的样本统计量，实际上是总体参数的点估计量

标准化检验统计量通常简称为检验统计量（检验统计量标准化后可用标准正态分布校验，点估计量的抽样分布满足中心极限定理）

拒绝域 (rejection region)

能够拒绝原假设的检验统计量的所有可能取值的集合，由显著性水平 $\alpha$ 围成的面积

临界值 (critical value)

拒绝域的边界值

P值 (p-value)

也称观察到的显著性水平 (observed significance level)，第Ⅰ类错误犯错概率的实际观测值

左侧检验—— $H_0$ ： $\mu\geq\mu_0$ ； $H_1$ ： $\mu<\mu_0$

$P =P(z \leq z_{true}| \mu=\mu_0)$

右侧检验—— $H_0$ ： $\mu\leq\mu_0$ ； $H_1$ ： $\mu>\mu_0$

$P=P(z \geq z_{true}| \mu=\mu_0)$

双侧检验—— $H_0$ ： $\mu=\mu_0$ ； $H_1$ ： $\mu\neq\mu_0$

$P=2P(z \geq |z_{true}|| \mu=\mu_0)$

假设检验的步骤

选择总体参数，作出原假设 $H_0$ 和备择假设 $H_1$ ；确定显著性水平 $\alpha$
计算抽取的随机样本的检验统计量
由显著性水平 $\alpha$ 得到临界值，确定拒绝域
比较检验统计量与临界值，做出决策

检验统计量落入拒绝域，则拒绝原假设 $H_0$ ；

检验统计量未落入拒绝域，则不拒绝原假设 $H_0$ ；
或计算 $P$ 值，与给定显著性水平 $\alpha$ 比较，做出决策

单尾检验：

$P$ 值 $< \alpha$ ，则拒绝原假设 $H_0$ ；

$P$ 值 $> \alpha$ ，则不拒绝原假设 $H_0$ ；

双尾检验：

$P$ 值 $< \frac{\alpha}{2}$ ，则拒绝原假设 $H_0$ ；

$P$ 值 $> \frac{\alpha}{2}$ ，则不拒绝原假设 $H_0$ ；

理解：

当 $H_0$ 为真拒绝 $H_0$ 的概率小了( $\alpha$ )，则 $H_0$ 为假不拒绝 $H_0$ 的概率大了( $\beta$ )，因此拒绝 $H_0$

P值、α是曲线面积；计算出的检验统计量、临界值是随机变量的值

2. 总体均值的假设检验

graph LR;
0[均值] --- 1[大样本] ---> a[正态分布检验];
0 --- 2[小样本] --- 已知方差的正态总体 ---> a;
2 --- 未知方差的正态总体 ---> t检验

正态分布的检验

条件：

大样本或已知总体方差且总体正态分布的小样本

步骤：

假设->计算检验统计量->通过临界值或p值做出决策

例题

提出假设（左侧检验）

$H_0:\mu\geq1.35 ,H_1:\mu<1.35$
计算检验统计量

$\overline x =1.3152,s=0.3657$

标准化检验统计量
根据临界值做出决策

由显著性谁平 $\alpha=0.01$ ，查标准正态分布表得到 $z_\alpha=z_{0.01}=-2.33$ ，拒绝域为 $z\leq-2.33$

因此，检验统计量 $-2.6061$ 在拒绝域内，拒绝原假设 $H_0$
根据 $P$ 值做出决策

$P =P(z \leq -2.6061| \mu=\mu_0)=0.04579$ ， $P< \alpha=0.01$ ，拒绝原假设 $H_0$

t检验

目的：

通过比较不同数据的均值，研究两组数据之间是否存在显著差异。

条件：

未知总体方差且总体正态分布的小样本

步骤：

假设->计算检验统计量->通过临界值或p值做出决策

例题

提出假设（双侧检验）

$H_0:\mu=12 ,H_1:\mu\ne12$
计算检验统计量

$\overline x =11.89,s=0.4932$

$t$ 检验统计量
根据临界值做出决策

由显著性谁平 $\alpha=0.05$ ，自由度 $n-1=10-1=9$ ，查 $t$ 分布表得到 $t_\alpha(n-1)=t_{0.025}(9)=-2.262$ ，拒绝域为 $|t|\geq2.262$

因此，检验统计量 $0.7053$ 不在拒绝域内，不拒绝原假设 $H_0$
根据 $P$ 值做出决策

$P =P(t \geq |-2.6061|| \mu=\mu_0)=0.498$ ， $P>\alpha=0.05$ ，不拒绝原假设 $H_0$

机器学习

统计学

本博客所有文章除特别声明外，均采用 CC BY-SA 4.0 协议，转载请注明出处！

统计学(四) 方差分析上一篇

统计学(二) 参数估计下一篇

统计学(三) 假设检验

1. 相关概念

2. 总体均值的假设检验

正态分布的检验

t检验