相关文章推荐
玩滑板的小虾米  ·  将 Apache Beeline 与 ...·  5 月前    · 
文质彬彬的小刀  ·  Tableau JavaScript ...·  5 月前    · 
任性的小马驹  ·  Swagger错误 - ...·  11 月前    · 
没有腹肌的沙滩裤  ·  AttributeError: ...·  1 年前    · 
曾深爱过的八宝粥  ·  USBLPM - Windows ...·  1 年前    · 

推断统计是研究如何利用样本数据来推断总体特征的统计方法。比如,要了解一个地区的人口特征,不可能对每个人的特征一一进行测量,对产品的质量进行检验,往往是破坏性的,也不可能对每个产品进行测量。这就需要抽取部分个体即样本进行测量,然后根据获得的样本数据对所研究的总体特征进行推断,这就是推断统计要解决的问题。推论统计是统计学中研究年份较为短的一部分内容,举个例子,我们想研究教育背景是否会影响人的收入。然后我们可以找1000名30岁大学毕业生和1000名30岁初中毕业生。采集他们的工作以及收入情况。用推论统计方法进行数据处理,最后会得出类似这样儿的结论:“研究发现,大学毕业生组的收入显著高于初中毕业生组的收入,二者在0.01水平上具有显著性差异,说明大学毕业生的一些收入情况优于中学毕业生组,也就是学历会影响收入。”推断统计包括两方面的内容:总体参数估计和假设检验。

一、基本概念

总体&参数 vs 样本&估计
首先需要对总体(population)、参数(parameter)、样本(sample)和估计(estimator)概念进行说明。总体就是对某一现象或某一事物的所有可能情况的数据集合。但实际中由于时间、地点、预算、人力等客观条件的限制几乎无法获得数据的全集,只能经济适用地取得其中的一部分数据(及子集),这就是样本。而获取样本的过程即为抽样(sampling),这是一项严谨复杂的工作,这里就不展开说了。
了解完样本和总体,还需要明确一点:通常的描述统计工作都是针对样本数据进行的,准确地来说是在描述样本,而不是总体,但是可以基于样本数据的描述对总体的数据特征进行估计,这就是参数估计(parameter estimation)。参数(parameter)其实是描述总体数据的指标的统称,如总体均值、总体方差等。由于总体数据无法获得,这些参数实际是未知的,此时就只能通过样本数据对总体参数进行推断。这一过程就是参数估计,推断得出的数值就是参数的估计或估计值,如样本均值、样本方差等。

二、参数估计

参数估计包含两大部分,点估计及区间估计,点估计,是估计参数点的值,一个确定的值,区间估计就是估计参数的范围。所有的估计都是估计未知参数,点估计则是估计具体的某一个数值,而区间估计,则是估计这个参数有多大的概率(置信水平: \(1-{\alpha}\) \(\alpha\) 在假设检验的时候,它叫显著性水平,而置信水平刚好是1-显著水平,所以就用它了)落在某个区间(置信区间,置信下限,置信上限)范围。
有时候,我们不关注它到底有多大,只关注它到底多小,比如元件寿命,不关注它有多小,只关注它有多大,比如杂质含量。这样,就引出了单侧置信区间的概念,同样,也是估计这个参数有多大的概率 \(1-{\alpha}\) 落在区间上,和双侧区间的区别是,双侧区间因为要兼顾两边。

对于置信区间的基本计算方法如下:(1)判断是否正态总体;(2)找到枢轴量(简单的说,就是一个关于随机变量 \(X\) 及参数 \(\theta\) 的函数,它有自己单独的,与变量及参数都无关的分布,这样就可以用过这个分布来确定函数内的参数 \(\theta\) 的置信区间);(3)利用枢轴量的分布求出置信水平 \(1-{\alpha}\) 的置信区间,根据枢轴量函数计算出 \(\theta\) 的置信区间。
而卡方分布和F分布的两上枢轴量也是一个比例,它同样由两个分布双侧或单侧的比例确定,又因方差无负值,所以这个双侧和单侧是由小于某一个正值和大于某一个正值给出,不像正态分布和t分布一有正负值。于是,各种情况的置信区间求解如下图:

例1. 有10个样本,分别是175,176,173,175,174,173,173,176,173,179。标准差为1.5,求均值95%的置信区间。

z.test<-function(x,n,sigma,alpha){
mean<-mean(x)
ans<-c(
       mean-sigma*qnorm(1-alpha/2,mean=0,sd=1,lower.tail=TRUE)/sqrt(n),
       mean+sigma*qnorm(1-alpha/2,mean=0,sd=1,lower.tail=TRUE)/sqrt(n))
x<-c(175,176,173,175,174,173,173,176,173,179)
z.test(x,10,1.5,0.05)
z.test(x,10,1.5,0.05)
173.7703 175.6297

例2. 为比较两种农产品的产量,选择18块条件相似的试验田,采用相同的耕作方法做实验,结果播种甲种的8块试验田的单位面积产量和播种乙品种的10块试验田的单位面积产量分别如下所示
两种农产品的单位面积产量
甲品种 628 ,583,510,554,612,523,530,615
乙品种 535,433,398,470,567,480,498,560,503,426
假定每个品种的单位面积产量均服从正态分布,甲品种产量的方差为2140,乙品种产量的方差为3250,试求这两个品种平均面积产量差的置信区间(置信度95%)。

two.sample.ci <- function(x,y,conf.level,sigma1,sigma2){
  options(digits = 4)
  m = length(x)
  n = length(y)
  xbar=mean(x)-mean(y)
  alpha=1-conf.level
  zstar=qnorm(1-alpha/2)*(sigma1/m+sigma2/n)^(1/2)
  xbar+c(-zstar,+zstar)
x <- c(628,583,510,554,612,523,530,615)
y <- c(535,433,398,470,567,480,498,560,503,426)
sigma1=2140
sigma2=3250
two.sample.ci(x,y,0.95,sigma1,sigma2)
two.sample.ci(x,y,0.95,sigma1,sigma2)
[1]  34.67 130.08

三、假设检验

假设检验的计算程式(置信区间法)如下:(1)判断是否正态总体及建立假设;(2)找到枢轴量(在假设检验中叫检验统计量);(3利用枢轴量的分布求出置信水平的置信区间,根据枢轴量函数计算出的置信区间,若原假设的值落在置信区间之内,则不能拒绝原假设(注意,是不能拒绝原假设,不是接受原假设,这个是不一样的,不能拒绝的意思是不能判断,而接受则为可以判断,比如原假设是有只有1块钱在身上,不能拒绝原假设的意思是,我不知道你有没有1块钱在身上,你有可能没钱,有可能只有1块钱,也有可能有很多钱,而接收原假设的意思是,你只有1块钱,这个要非常注意,不能乱作判断!)

另外介绍另外两种常用的假设检验方法:
(1)临界值法
临界值法则是把假设代入检验统计量中计算,并把结果与Zα对比,若结果落在Zα以外(意为落在显著水平下认为不可能的范围),则拒绝原假设,接受备择假设,若不是,则不能拒绝原假设
(2)P值法
与临界值法的区别就是,把假设代入检验统计量中计算,并计算在这个结果下,P值的大小,由P值与显著水平α进行比较,若P值小于显著水平,则为显著拒绝原假设。另外,P值也代表着拒绝原假设的最小显著水平。
假设检验由检验统计量可以分为Z检验、t检验、χ2检验、F检验,单正态总体,双正态总体检验如下图:

例3. 某种原件的寿命X(以小时计)服从正态分布N(μ, σ)其中μ, σ2均未知。现测得16只元件的寿命如下:
159 280 101 212 224 379 179 264
222 362 168 250 149 260 485 170
问是否有理由认为元件的平均寿命大于255小时?
解:按题意,需检验 H0: μ ≤ 225 H1: μ > 225
此问题属于单边检验问题,可以使用R语言t.test
t.test(x,y=NULL,
alternative=c("two.sided","less","greater"),
mu=0,paired=FALSE,var.equal=FALSE,
conf.level=0.95)
其中x,y是又数据构成e向量,(如果只提供x,则作单个正态总体的均值检验,如果提供x,y则作两个总体的均值检验),alternative表示被则假设,two.sided(缺省),双边检验(H1:μ≠μ0),less表示单边检验(H1:μ<μ0),greater表示单边检验(H1:μ>μ0),mu表示原假设μ0,conf.level置信水平,即1-α,通常是0.95,var.equal是逻辑变量,var.equal=TRUE表示两样品方差相同,var.equal=FALSE(缺省)表示两样本方差不同。

 X<-c(159, 280, 101, 212, 224, 379, 179, 264,222, 362, 168, 250, 149, 260, 485, 170)
 t.test(X,alternative = "greater",mu=225)
One Sample t-test
data:  X
t = 0.66852, df = 15, p-value = 0.257
alternative hypothesis: true mean is greater than 225
95 percent confidence interval:
 198.2321      Inf
sample estimates:
mean of x 
    241.5 

例4. 有一批蔬菜种子的平均发芽率p0=0.85,现随即抽取500粒,用种衣剂进行浸种处理,结果有445粒发芽。试检验种衣剂对种子发芽率有无效果。
解:根据题意,所检验的问题为 H0:p=p0=0.85, H1:p≠p0
可以用R语言的binom.test

binom.test(x, n, p = 0.5, alternative = c("two.sided", "less", "greater"), conf.level = 0.95)
#其中x是成功的次数;或是一个由成功数和失败数组成的二维向量。n是试验总数,当x是二维向量时,此值无效。P是原假设的概率。
binom.test(445,500,p=0.85)

推断性统计用来研究研究如何根据样本数据去推断总体数量特征。统计学中的描述派和推断派在本世纪二十至四十年代的对峙辩论,基本上可以说是以统计推断思想的迅速发展而告终结的。但到了六十年代,随着贝叶斯统计思想的勃兴,人们又回过头来从更为客观的角度上去认识整个统计学和其中的各种不同思想,并力图寻找到各种统计思想所赖以存在其根本意义一致的统计认识对象和认识方法,这就是我们所说的总体规律和概率论。这两点已成为西方各种统计思想流派所共同坚持的最本质的东西,是整个统计学的两个内核。但是,这种“泛性”统计学的观点仍然是建立在各种统计思想流派具有显著差别的基础之上的。

1.(推断性统计部分(二)---参数估计)[https://blog.csdn.net/gdyflxw/article/details/53374874]
2.(推断性统计部分(三)—假设检验)[https://blog.csdn.net/gdyflxw/article/details/53390353]
3.(R语言参数估计笔记及例题)[https://blog.csdn.net/weixin_45987577/article/details/124301075]