统计学(三) 假设检验
本文最后更新于:2023年2月28日 下午
1. 相关概念
假设检验 (hypothesis test)
先对总体参数提出某种假设,然后利用祥本信息判断假设是否成立的过程。
假设 (hypothesis)
对总体参数的具体数值做出的猜测陈述。
- 原假设 (null hypothesis):通常将研究者想收集证据予以反对的假设,记作
- 备择假设 (alternative hypothesis):通常将研究者想收集证据予以支持的假设,与原假设对立,记作
根据备择假设中对总体参数做出的假设区间(方向性)可以将假设分为:
单尾/单侧检验 (one-tailed test):备择假设具有特定的方向性(含有符号“>”,"<"等)
双尾/双侧检验 (two-tailed test):备择假设没有特定的方向性(含有符号“”等)
假设检验的决策

第Ⅰ类错误 (type Ⅰ error)
当原假设为真时拒绝原假设,又称弃真错误,第Ⅰ类错误犯错概率记作
第Ⅱ类错误 (type Ⅱ error)
当原假设为假时未拒绝原假设,又称取伪错误,第Ⅱ类错误犯错概率记作
显著性水平 (level of significance)
第Ⅰ类错误犯错概率,记作
通常用显著性水平度量假设检验结论的可靠性
检验统计量 (test statistic)
用以对假设作出决策的样本统计量,实际上是总体参数的点估计量
标准化检验统计量通常简称为检验统计量(检验统计量标准化后可用标准正态分布校验,点估计量的抽样分布满足中心极限定理)
拒绝域 (rejection region)
能够拒绝原假设的检验统计量的所有可能取值的集合,由显著性水平 围成的面积
临界值 (critical value)
拒绝域的边界值

P值 (p-value)
也称观察到的显著性水平 (observed significance level),第Ⅰ类错误犯错概率的实际观测值
左侧检验—— :;:
右侧检验—— :;:
双侧检验—— :;:
假设检验的步骤
-
选择总体参数,作出原假设 和备择假设 ;确定显著性水平
-
计算抽取的随机样本的检验统计量
-
由显著性水平 得到临界值,确定拒绝域
-
比较检验统计量与临界值,做出决策
检验统计量落入拒绝域,则拒绝原假设 ;
检验统计量未落入拒绝域,则不拒绝原假设 ;
-
或计算 值,与给定显著性水平 比较,做出决策
单尾检验:
值 ,则拒绝原假设 ;
值 ,则不拒绝原假设 ;
双尾检验:
值 ,则拒绝原假设 ;
值 ,则不拒绝原假设 ;
理解:
当为真拒绝的概率小了(),则为假不拒绝的概率大了(),因此拒绝

2. 总体均值的假设检验
graph LR;
0[均值] --- 1[大样本] ---> a[正态分布检验];
0 --- 2[小样本] --- 已知方差的正态总体 ---> a;
2 --- 未知方差的正态总体 ---> t检验
正态分布的检验
条件:
大样本 或 已知总体方差且总体正态分布的小样本
步骤:

例题


-
提出假设(左侧检验)
-
计算检验统计量
标准化检验统计量

-
根据临界值做出决策
由显著性谁平 ,查标准正态分布表得到 ,拒绝域为
因此,检验统计量 在拒绝域内,拒绝原假设
-
根据 值做出决策
, ,拒绝原假设
t检验
目的:
通过比较不同数据的均值,研究两组数据之间是否存在显著差异。
条件:
未知总体方差且总体正态分布的小样本
步骤:

例题


-
提出假设(双侧检验)
-
计算检验统计量
检验统计量

-
根据临界值做出决策
由显著性谁平 ,自由度 ,查 分布表得到 ,拒绝域为
因此,检验统计量 不在拒绝域内,不拒绝原假设
-
根据 值做出决策
, ,不拒绝原假设
本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!

