假设检验
理论依据
参数假设检验所处理的问题是:总体的分布类型已知,对总体分布中的未知参数提出某种假设,然后利用样本(即数据)对假设进行检验,最后根据检验的结果对所提出的假设作出成立与否的判断
假设检验分为参数假设检验和非参数假设检验。
根据小概率原理:如果实际观测到的数据在某假设下出现的可能性很小,则认为该假设是错误的。
统计假设检验是具有概率性质的反证法。
基本概念
- 建立假设 - 提出一个关于总体分布的命题
- 原假设
- 对总体分布中的未知参数提出的关于参数的陈述,通常是不等式形式 - 备择假设
- 对总体分布中的未知参数提出的关于参数的陈述,通常是不等式形式 - 检验统计量 - 根据样本数据计算的一个统计量,用于检验假设
先假定原假设成立,然后根据样本数据构造一个合适的小概率事件
需要构造一个统计量,使得在原假设成立时,该统计量的分布是已知的,从而可以计算出该统计量的小概率 - 检验法则 - 根据检验统计量的取值,判断原假设的成立与否
- 拒绝域 - 使得原假设
被拒绝的取值区域 - 接受域 - 使得原假设
被接受的取值区域 - 显著性水平
- 假设检验中犯第一类错误的概率 - 第一类错误 - 原假设为真,但被拒绝
- 第二类错误 - 原假设为假,但被接受
利用此式,可以确定拒绝域的临界点
假设检验的基本步骤
- 建立假设 - 提出关于总体分布的原假设
和备择假设 - 构造检验统计量 - 根据样本数据构造一个统计量,使得在原假设成立时,该统计量的分布是已知的
- 确定拒绝域的形式 - 根据
和 确定拒绝域的形式 - 确定临界点 - 确定拒绝域的临界点,使得拒绝域的概率等于显著性水平
- 计算检验统计量的值 - 根据样本数据计算检验统计量的值,判断是否落入拒绝域
- 作出判断 - 根据检验统计量的值,判断原假设
的成立与否
两类错误
第一类错误和第二类错误
- 第一类错误:拒真概率 - 原假设为真,但被拒绝
- 第二类错误:取伪概率 - 原假设为假,但被接受
第一类错误和第二类错误的关系
我们通常规定第一类错误的概率为
要同时降低两类错误的概率,或者要在第一类错误的概率不变的条件下降低第二类的错误概率,需要增加样本容量。
关于零假设与备择假设的选择
另外,由于在做假设检验时,控制的是犯第一类错误的概率,因此选取后果严重的错误作为第一类错误,这也是选取原假设和备择假设的一个原则。
单个正态总体均值与方差的假设检验
均值 的假设检验
方差 已知 :
- 建立假设 -
, - 构造检验统计量 -
- 确定拒绝域的形式 -
,拒绝域为 - 确定临界点 -
- 计算检验统计量的值 - 计算
的值 - 作出判断 - 若
,则拒绝 ,否则接受
方差 已知 :
- 确定拒绝域的形式 -
,拒绝域为 - 确定临界点 -
方差 未知
样本方差
总结
检验 已知
以下方法用正态分布来检验均值的假设,所以称为
原假设 | 备择假设 | 检验统计量 | 拒绝域 |
---|---|---|---|
检验 未知
以下方法用
原假设 | 备择假设 | 检验统计量 | 拒绝域 |
---|---|---|---|
方差 的假设检验
均值 未知 :
样本方差
为了计算方便,通常取
有
故知
拒绝域为
等价的拒绝域为
均值 已知
利用该
总结
以下的检验都是用
检验 未知
原假设 | 备择假设 | 检验统计量 | 拒绝域 | 临界点 |
---|---|---|---|---|
检验 已知
原假设 | 备择假设 | 检验统计量 | 拒绝域 | 临界点 |
---|---|---|---|---|