Skip to content

假设检验

理论依据

参数假设检验所处理的问题是:总体的分布类型已知,对总体分布中的未知参数提出某种假设,然后利用样本(即数据)对假设进行检验,最后根据检验的结果对所提出的假设作出成立与否的判断

假设检验分为参数假设检验非参数假设检验

根据小概率原理:如果实际观测到的数据在某假设下出现的可能性很小,则认为该假设是错误的。

统计假设检验是具有概率性质的反证法。

基本概念

  1. 建立假设 - 提出一个关于总体分布的命题
  2. 原假设 H0 - 对总体分布中的未知参数提出的关于参数的陈述,通常是不等式形式
  3. 备择假设 H1 - 对总体分布中的未知参数提出的关于参数的陈述,通常是不等式形式
  4. 检验统计量 - 根据样本数据计算的一个统计量,用于检验假设
    先假定原假设 H0 成立,然后根据样本数据构造一个合适的小概率事件
    需要构造一个统计量,使得在原假设成立时,该统计量的分布是已知的,从而可以计算出该统计量的小概率
  5. 检验法则 - 根据检验统计量的取值,判断原假设的成立与否
  6. 拒绝域 - 使得原假设 H0 被拒绝的取值区域
  7. 接受域 - 使得原假设 H0 被接受的取值区域
  8. 显著性水平 α - 假设检验中犯第一类错误的概率
  9. 第一类错误 - 原假设为真,但被拒绝
  10. 第二类错误 - 原假设为假,但被接受
P{拒绝H0|H0为真}=P{W|H0}α

利用此式,可以确定拒绝域的临界点

假设检验的基本步骤

  1. 建立假设 - 提出关于总体分布的原假设 H0 和备择假设 H1
  2. 构造检验统计量 - 根据样本数据构造一个统计量,使得在原假设成立时,该统计量的分布是已知的
  3. 确定拒绝域的形式 - 根据 H0H1 确定拒绝域的形式
  4. 确定临界点 - 确定拒绝域的临界点,使得拒绝域的概率等于显著性水平 α
  5. 计算检验统计量的值 - 根据样本数据计算检验统计量的值,判断是否落入拒绝域
  6. 作出判断 - 根据检验统计量的值,判断原假设 H0 的成立与否

两类错误

第一类错误和第二类错误

  1. 第一类错误:拒真概率 - 原假设为真,但被拒绝
P{拒绝H0|H0为真}=P{W|H0}=α
  1. 第二类错误:取伪概率 - 原假设为假,但被接受
P{接受H0|H0为假}=P{A|H1}=1P{W|H1}

第一类错误和第二类错误的关系

我们通常规定第一类错误的概率为 α,即显著性水平,而第二类错误的概率为 β。 第二类错误的概率 β 与样本容量、显著性水平、总体参数真值等因素有关,通常是一个较小的值。 在一般情形下,αβ 不能同时减小,只能在两者之间取得平衡。

要同时降低两类错误的概率,或者要在第一类错误的概率不变的条件下降低第二类的错误概率,需要增加样本容量。

关于零假设与备择假设的选择

H0H1 的地位应当平等,但在控制第一类错误的情况下,,采取拒绝 H0 的决策变得较为慎重,即 H0 得到了较高的保护。 因而,通常把有把握的、不能轻易改变的或存在已久的状态作为原假设。

另外,由于在做假设检验时,控制的是犯第一类错误的概率,因此选取后果严重的错误作为第一类错误,这也是选取原假设和备择假设的一个原则。

单个正态总体均值与方差的假设检验

均值 μ 的假设检验

XN(μ,σ2)μ0 是一个已知的常数。

方差 σ2 已知 H0: μ=μ0

  1. 建立假设 - H0:μ=μ0H1:μμ0
  2. 构造检验统计量 - W=Xμ0σ/nN(0,1)
  3. 确定拒绝域的形式 - H1:μμ0,拒绝域为 |W|>zα/2
  4. 确定临界点 - P{|W|>zα/2}=α
  5. 计算检验统计量的值 - 计算 W 的值
  6. 作出判断 - 若 |W|>zα/2,则拒绝 H0,否则接受 H0

方差 σ2 已知 H0: μμ0

  1. 确定拒绝域的形式 - H1:μ>μ0,拒绝域为 W>zα
  2. 确定临界点 - P{W>zα}=α

方差 σ2 未知

样本方差 S2 代替 σ2T=Xμ0S/nt(n1)

总结

Z 检验 σ 已知

以下方法用正态分布来检验均值的假设,所以称为 Z 检验。

原假设 H0备择假设 H1检验统计量拒绝域
μ=μ0μμ0Z=Xμ0σ/nabs(Z)zα/2
μμ0μ>μ0Z=Xμ0σ/nZzα
μμ0μ<μ0Z=Xμ0σ/nZzα

t 检验 σ 未知

以下方法用 t 分布来检验均值的假设,所以称为 t 检验。

原假设 H0备择假设 H1检验统计量拒绝域
μ=μ0μμ0T=Xμ0S/nabs(T)tα/2(n1)
μμ0μ>μ0T=Xμ0S/nTtα(n1)
μμ0μ<μ0T=Xμ0S/nTtα(n1)

方差 σ2 的假设检验

XN(μ,σ2)σ02 是一个已知的常数。

均值 μ 未知 H0: σ2=σ02

样本方差 S2σ2 的无偏估计量。 s2 为样本方差的观测值,s2=1n1i=1n(XiX)2H0 成立时 s2σ02 的值应该接近于1。 需要两个界限,即 s2σ02 的下界 C1 和上界 C2,拒绝域为

W={s2σ02C1s2σ02C2}

为了计算方便,通常取 C1=χ1α/22(n1)C2=χα/22(n1)

H0 成立时,有

(n1)s2σ02χ2(n1)

P{(n1)s2σ02<(n1)C1}=α2,P{(n1)s2σ02>(n1)C2}=α2

故知

C1=χ1α/22(n1)n1,C2=χα/22(n1)n1

拒绝域为

W={s2σ02<χ1α/22(n1)n1s2σ02>χα/22(n1)n1}

等价的拒绝域为

W={(n1)s2σ02<χ1α/22(n1)(n1)s2σ02>χα/22(n1)}

均值 μ 已知

1σ02i=1n(Xiμ)2χ2(n)

利用该 χ2 分布来检验方差的假设。

总结

以下的检验都是用 χ2 分布来检验方差的假设,所以称为χ2检验。

χ2 检验 μ 未知

原假设 H0备择假设 H1检验统计量拒绝域临界点
σ2=σ02σ2σ02χ2(n1)=(n1)s2σ02{(n1)s2σ02<χ1α/22(n1)(n1)s2σ02>χα/22(n1)}χ1α/22(n1), χα/22(n1)
σ2σ02σ2>σ02{(n1)s2σ02>χα2(n1)}χα2(n1)
σ2σ02σ2<σ02{(n1)s2σ02<χ1α2(n1)}χ1α2(n1)

χ2 检验 μ 已知

原假设 H0备择假设 H1检验统计量拒绝域临界点
σ2=σ02σ2σ02χ2(n)=1σ02i=1n(Xiμ)2{1σ02i=1n(Xiμ)2<χ1α/22(n)1σ02i=1n(Xiμ)2>χα/22(n)}χ1α/22(n), χα/22(n)
σ2σ02σ2>σ02{1σ02i=1n(Xiμ)2>χα2(n)}χα2(n)
σ2σ02σ2<σ02{1σ02i=1n(Xiμ)2<χ1α2(n)}χ1α2(n)