金桔 
金币 
威望 
贡献 
回帖0
精华
在线时间 小时
 
 
 
 
 | 
	
1 单正态总体 
 
假设   是一个随机样本,服从正态分布   。 
 
考虑以下与参数   有关的假设检验。其中   与显著性水平   为预先设定且已知。 
A)   ; 
B)   ; 
C)   ; 
 
1.1 当   为已知参数 
 
A)   ; 
已知,样本均值   是关于   的一个无偏点估计。并且,从直觉出发,我们容易认同在   很大时应该拒绝零假设   。所以,我们可以把拒绝域写作如下形式:   。接下来的任务转变为求解临界值   。 
假设零假设为真,对   进行变形,可知检验统计量   服从如下分布 
  
拒绝域的形式可改写为:   。接下来的任务转变为求解   。 
已知显著性水平为   ,根据显著性水平的定义   
从而可以确定   。拒绝域确定为:   。 
 
  
 
阴影区域为拒绝域(来自清华大学王江典老师课件) 
 
进一步,得到功效函数   为 
  
其中,   为标准正态分布的分布函数。 
 
  
 
对功效函数的数值模拟(来自清华大学王江典老师课件) 
 
发现该功效函数有两个特别的性质:1)   ;2) 当   时,   单调递增。 此外,还可以引入样本方差   ,构造另一种形式的拒绝域:   。选取另一种检验统计量   ,当零假设为真时,服从如下分布 
  
此时,拒绝域形如:   。又已知显著性水平为   ,根据定义 
 从而可以确定   。 拒绝域为:   。 
此时的功效函数为 
  
比起第一种来说,非常复杂,但这种功效函数可以适用于   未知的情形。 
 
  
 
黑:一;红:二(来自清华大学王江典老师课件) 
 
B)   ; 
构造检验统计量为   ,所以对应的拒绝域形如:   。接下来的任务转变为求解   。已知显著性水平为   ,根据显著性水平的定义   
从而确定   。拒绝域为:   。 
进一步,得到功效函数为 
  
是单调递增函数,说明了我们刚刚得到的拒绝域是恰当的。 
 
  
 
(来自清华大学王江典老师课件) 
 
C)   ; 
此时也取检验统计量为   ,经过 B) 中类似的讨论,得到拒绝域   
 
  
 
(来自清华大学王江典老师课件) 
 
1.2 当   为未知参数 
 
此时,采取 1.1 A) 中的处理,将检验统计量中的   都替换为样本标准差   ,为   。此时得到各个检验的拒绝域分别为 
A)   ; 
B)   ; 
C)   ; 
以及各自的功效函数为 
  
 
这种基于   统计的假设检验,被称为单样本   检验 / One Sample   Test。 
 
  
 
(来自清华大学王江典老师课件) 
 
考虑以下与参数   有关的假设检验。其中   与显著性水平   为预先设定且已知。 
D)   ; 
E)   ; 
F)   ; 
 
1.3 当   为未知参数 
 
选取检测统计量为   
拒绝域应当形如   ,   ,   。基于显著性水平的定义   可以求解得到待定系数的具体取值。从而,每个检验的拒绝域的具体形式如下 
D)   ; 
E)   ; 
F)   ; 
 
1.4 当   为已知参数 
 
设   ,选取检测统计量为   
拒绝域应当形如   ,   ,   。基于显著性水平的定义   可以求解得到待定系数的具体取值。从而,每个检验的拒绝域的具体形式如下 
D)   ; 
E)   ; 
F)   ; 
 
这种基于   统计的假设检验,被称为  检验 /   Test。 
 
  
 
(来自清华大学王江典老师课件) 
 
<hr/>2 非正态总体 
 
假设   是一个随机样本,服从二项分布   。其中参数   未知。 
 
考虑以下与参数   有关的假设检验。其中   与显著性水平   为预先设定且已知。 
A)   ; 
B)   ; 
C)   ; 
 
2.1    
 
假设检验统计量为   。显然,   是一个关于   的无偏点估计,因此在   或者   很大时,我们直觉上会倾向于拒绝零假设,猜测拒绝域形如: 。 
已知,对于非随机检验,显著性水平   的定义为 
  
但是对于随机检验来说,在离散的分布下,   的概率可能刚好小于   ,   的概率又刚好大于   。从而不存在一个整数   能满足   。 
所以取随机检验函数   为   
我们可以这样理解随机检验函数: 
当   ,判定为接受   ; 
当   ,判定为拒绝   ; 
当   ,对   进行调整,抛一枚硬币,正面的概率为   ,抛到正面就判定为拒绝   。 得到功效函数   为 
  
因为   ,在取定   后,   与   的值是可计算的。因此,在确定了临界值   的一个具体取值后,根据上式我们可以确定   的取值。 
例如,如果我们选取一个样本,   ,   ,   。在零假设下有   
如果选取   ,那么   。于是随机检验函数为   
 
2.2    
 
同样地,我们选取检验统计量   ,并且拒绝域形如:   。同样有随机检验函数形如 
  
得到功效函数   
样本取定后,这些都是可计算的。 
 
2.3    
 
仍然选取检验统计量   ,拒绝域: 。 
随机检验函数形如   
根据显著性水平   的定义 
  
在样本取定后,这些都是可计算的。 
<hr/>3 双正态总体 
 
假设   是一个随机样本,服从正态分布   ;  也是一个随机样本,服从正态分布   。 
 
考虑以下与参数   有关的假设检验。其中   与显著性水平   为预先设定且已知。 
A)   ; 
B)   ; 
C)   ; 
 
3.1   和   均已知 
 
先考虑双边检验   。显然,   是一个关于   的无偏点估计。并且,当   很大时,我们会在直觉上倾向于拒绝零假设。并且此时拒绝域应当形如:   。 
具体地,我们将选取检验统计量为 
  
此时的拒绝域为:   。 
根据显著性水平的定义有 
  
所以,可以确定   。另外两种检验都可以通过类似的方法确定拒绝域。总体结果如下: 
A)   ; 
B)   ; 
C)   ; 
 
3.2   但未知 
 
这种情况被称为双样本   检验 / Two Sample   Test。选取检验统计量   为   
同样地,按照显著性水平的定义,可以得到各个检验的拒绝域分别为 
A)   ; 
B)   ; 
C)   ; 
 
  
 
(来自清华大学王江典老师课件) 
 
3.3   且未知 
 
选取检验统计量   为   
在零假设成立时,   不服从   分布,只能采用渐进的方法,近似于   分布。其中,自由度   为 
  
对上式四舍五入取最接近的整数。 
 
现在,考虑以下与参数   有关的假设检验。其中显著性水平   为预先设定且已知。 
D)   ; 
E)   ; 
F)   ; 
 
3.4   和   未知 
 
选取检验统计量   为 
  
拒绝域形如:   。 
根据显著性水平的定义 
  
所以,选取   和   。从而可以确定拒绝域的具体范围。同样地,另外两个假设检验也可以通过选取该检验统计量来求解拒绝域,总的结果如下: 
D)   ; 
E)   ; 
F)   ; 
 
3.5   和   已知 
 
设   和   。此时,选取检验统计量   为 
  
使用与 3.3 中一样的方法,得到各个假设检验的拒绝域如下: 
D)   ; 
E)   ; 
F)   ; 
 
  
 
(来自清华大学王江典老师课件) 
 
3.6 示例 
 
EX1:为研究正常成年男女血液红细胞平均数的差别,检验某地正常成年男子156人,女子74人,计算得到男女红细胞的平均数和样本标准差分别为:男,   万 ,   万 ;男,   万 ,   万 。假定正常男女红细胞数分别服从正态分布,且方差相同(但未知)。检验正常成年人红细胞数是否与性别有关(取显著水平   )。 
转化为统计学语言,即考虑如下假设检验:   。 
根据 3.2 中的讨论,易知此时的拒绝域为:   
直接带入题给数据,得到 
  
拒绝零假设,即正常成年人红细胞数确实与性别有关,P 值为   。 
 
EX2:为了考察一种安眠药的效果,记录了   个失眠患者服药前的每晚睡眠时间   和服用此安眠药后的每晚睡眠时间   。其中   是第   个患者不服用安眠药和服用安眠药每晚的睡眠时间,请分析该安眠药的效果。 
此时,   和   是两个不独立的随机样本,不能直接套用之前的讨论。设   ,于是将问题转化为如下假设检验:   。采用 1.2 中讨论的结果,拒绝域为: 
  
 
EX3:有两台测量材料中某种金属含量的光谱仪A和B,为鉴定它们的质量有无显著差异,对金属含量不同的 9 件材料样品进行测量,得到 9 对观测值为 
 
  
 
(来自清华大学王江典老师课件) 
 
根据试验结果,在   下,能否判断这两台光谱仪的质量有无显著差异? 
此时,仍然认为   和   是两个不独立的随机样本,设   ,将问题转化为如下假设检验:   。拒绝域为:   。 
带入数据:   。 
  
接受零假设,即认为这两台光谱仪的质量没有显著差异,P 值为   。 
 
EX4:有两批样本大小皆为 6 的电子器材,分别测量其电阻,得到两组数据:均值   和   ;样本标准差   和   。假设这两组电阻数据分别服从不同的正态分布,方差皆未知且两组样本独立。问:两批电子器材的电阻是否相同?取   。 
尽管方差均未知,但可以先检验两组方差是否相同,选取假设检验:   。根据 3.4 中的讨论,拒绝域为:   。 
带入题给数据   ,   ,   。 
  
接受零假设,即认为两个样本的方差相同但未知。 
此时,考虑电阻均值,选取假设检验:   。根据 3.2 中的讨论,拒绝域为 
  
带入题给数据:   。接受零假设,认为两批电子器材的电阻相同。 
<hr/>4 基于大样本定理的假设检验 
 
假设   是一个随机样本,服从分布   :期望的分布均值为   ,分布方差为   ;样本均值为   ,样本方差为   。考虑以下两个统计量的分布。 
1)   : 
如果   ,那么   ; 
如果   ,那么在   足够大时,根据 CLT 有   ; 
2)   : 
如果   ,那么   ; 
如果   ,那么在   足够大时,根据 CLT 和 Slutsky Thm 有   ; 
 
4.1 当   和   未知时,对   进行假设检验 
 
在 3.3 中我们曾简单讨论过,此时选取检验统计量   为   
在零假设成立时,   不服从任何已知的分布,所以在 3.3 中我们采取了渐进分布来处理。 
而当   足够大时,我们可以采取 CLT 和 Slutsky Thm 得到   在大样本下近似为   分布 
  
在零假设下,   。同样地,我们也可以得出大样本下的拒绝域为: 
A)   ; 
B)   ; 
C)   ; 
 
EX:3.6 中的 EX1,但方差未必相同,检验正常成年人红细胞数是否与性别有关(取显著水平   )。 
选取检验为:   ,此时不再是   检验。 
  
带入题给数据:   。 
  
拒绝零假设,P 值为   。 
 
4.2 对   的参数   进行假设检验 
 
假设   是一个随机样本,服从伯努利分布   。给定显著性水平   。 
根据 CLT 有 
  
在零假设下   
从而得到各个假设检验下的拒绝域为 
A)   ;; 
B)   ; 
C)   ; 
 
4.3 对   的参数   进行假设检验 
 
假设   是一个随机样本,服从柏松分布   。给定显著性水平   。 
根据 CLT 有 
  
在零假设下   
从而得到各个假设检验下的拒绝域为 
A)   ;; 
B)   ; 
C)   ; 
 
4.4 自举法 / Bootstrapping Method 
 
Bootstrapping Method 是一种统计学上的重采样技术,通过从原始样本中随机重复抽取,来构造伪样本,从而估计一个统计量的分布,并进一步评估估计值的变异性和置信区间。 
无需依赖大样本量或正态分布的假设,在小样本研究或非参数研究中特别有用。 
 
  
 
(来自清华大学王江典老师课件) 
 
EX:1882年,西蒙·纽科姆做了一个测量光速的实验。下面的数字代表了光从波托马克河西岸的迈尔堡到达3721米外华盛顿纪念碑脚下的一面固定镜子所花费的测量时间。 
 
  
 
(来自清华大学王江典老师课件) 
 
在给出数据的单位中,目前公认的“真实”光速是33.02,请分析这些数据是否支持目前公认的光速。 
运用 Bootstrapping Method 一般遵从以下流程:随机抽样若干个观察值,并进行替换,得到伪样本,计算 P 值。 
本题采用的 R 语言代码如下,感兴趣的知友可以跑一下: 
> speed <- c(28, -44, 29, 30, 26, 27, 22, 23, 33, 16, 24, 29, 24, 40, 21, 31, 34, -2, 25, 19) 
> hist(speed) 
 
> newspeed <- speed - mean(speed) + 33.02 
> mean(newspeed) 
 
> bstrap <~ cO 
> for (i in 1:1000){ 
+ newsample <- sample(newspeed, 20, replace=T) 
+ bstrap <- c(bstrap, mean(newsample))} 
> hist(bstrap) 
 
> (sum(bstrap < 21.75) + sum(bstrap > 44.29))/1000更多关于 Bootstrapping Method 的例子,可以参考以下知乎回答: 
商胜彭:Bootstrapping算法(附python代码)什么是Bootstrapping? |   
 
 
 |