皇冠信用hg3088 皇冠信用hg3088 皇冠信用hg3088

方差分析--T检验与F检验的异同

其实在之前的文章中,关于t检验的解释比较多,而且方差分析和t检验的功效和效果很相似,网上也不是很详细。先说一下我的理解。

这里所说的t检验是双样本t,即两组的个数,看两组数据对应的整体差异;方差检验也是看两组(及以上)是否有差异,那么其实两者是一样的吗?毛呢布?

事实上,在某种程度上是一样的。以下分为两个维度:测试的组数和组内方差

案例1:组内只有两组方差相等

在这种情况下,t 检验和 F 检验相等

让我们看看F检验的原理。F 检验着眼于 F 分布组间差异检验,而 F

值为 SSB/SSW。对于 SSB 和 SSW,您可以参考可汗学院。有一节专门讨论组间平方和 (SSB) 和组内平方和 (SSW)。如果我们把组间平方和理解为两组间的差差,组内的平方和理解为两组内不同数据的差,那么简单来说,在两个数据相同的前提下不同,是组间差异大还是组内差异大?如果组间差异很大,那么这两组数据本身不一致的概率就很大,对应的F值也比较大;

然后看两组的t检验。t检验的前提是两组数据是从不同样本中抽取的数据,并且样本都符合正态分布,然后用这两个样本来推断两个总体之间是否存在差异; 例如,我有一罐黑米和一罐白米。为了看两罐米饭的密度有没有差别,我每次用小勺子十次观察密度,然后用小勺子十次来确定整体如果要使用t检验,前提是由于随机误差,两缸大米在提取时的密度会有随机误差,那么每次提取的密度都会呈现正态分布,还有另外一个假设,即,两勺饭的分散程度相等,即方差相等。因此,方差相等或方差相等的前提是t检验的必要前提。F 检验不需要方差同质性,或者它本身检查方差的差异。

根据前面的定义,如果两组的方差相等,由于F检验的F值是SSB/SSW,所以组内的方差相等,如果两组有变异组间差异检验,那么就是都是由于组间的差异,F检验自然变成了t检验,下面附上F检验和t检验的代码和结果(数据参考《R与ASReml-R统计分析教程》中的数据):

重量

16.68 20.67 18.42 18 17.44 15.95 18.68 23.22 21.42 19 18.92 不适用

df

一个

b

var.test(a,b)

t.test(a,b,var.equal=T,paired=F)

t检验的结果是:

两个样本 t 检验

数据:a 和 b

t = -2.1808,df = 9,p 值 = 0.0571

备择假设:均值的真实差异不等于 0

95% 置信区间:

-4.86513222 0.08913222

样本估计:

x 的平均值 y 的平均值

17.860 20.248

F测试:

合身

摘要(适合)

结果:

Df Sum Sq Mean Sq F 值 Pr(>F)

V1 15.55 15.55 4.756 0.0571。

残差 9 29.43 3.27

---

意义。代码:0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1''1

1 个观察因缺失而被删除

可以看出p值都是0.0571,是相等的,因为前提是在t检验中加入了var.test,然后设置了参数var.equal=T。下面看一下不等方差:

案例2,两组数据不等方差

这种情况下,如果忽略方差相等的前提,比如我重新做一组数据,先检查一下防刮:

重量

16.68 20.67 18.42 18 17.44 30 18.68 23.22 21.42 19 18.92 82

df

一个

b

var.test(a,b)

查看测试结果:

F检验比较两个方差

数据:a 和 b

F = 0.038913,num df = 5,denom df = 5,p 值 = 0.002832

备择假设:真实方差比不等于 1

95% 置信区间:

0.005445095 0.278085194

样本估计:

方差比

0.03891273

p 为 0.002832,因此方差不均匀;

但随后我们对方差的相等性进行 t 检验:

t.test(a,b,var.equal=T,paired=F)

两个样本 t 检验

数据:a 和 b

t = -0.98304,df = 10,p 值 = 0.3488

备择假设:均值的真实差异不等于 0

95% 置信区间:

-33.77097 13.09431

样本估计:

x 的平均值 y 的平均值

20.20167 30.54000

看到两组均值相等的概率很高;

不均匀方差的调整 t 检验:

t.test(a,b,var.equal=F,paired=F)

韦尔奇二样本 t 检验

数据:a 和 b

t = -0.98304,df = 5.3885,p 值 = 0.3676

备择假设:均值的真实差异不等于 0

95% 置信区间:

-36.79643 16.11976

样本估计:

x 的平均值 y 的平均值

20.20167 30.54000

P值为0.3676,比以前略大;

F测试:

合身

摘要(适合)

Df Sum Sq Mean Sq F 值 Pr(>F)

V1 321 320.6 0.966 0.349

残差 10 3318 331.8

p 为 0.349;这相当于方差相等的 t 检验。

我是这样理解的:

t 检验的前提是方差是齐次的。只有当方差齐次时,t检验的结果才能反映两组数据之间是否存在差异。否则,如果方差不齐,组内的差异也会被考虑在内,因此判断的概率更高。松动的; 而F检验实际上是组间差异和组内差异的比较,所以本质上类似于等方差的t检验概念。但实际上,当方差不相等时,无法进行t检验,结果不具有统计显着性。

案例 3 和 4:在多个组的情况下,方差是同质的,并且多个组之间的方差不相等

t检验一般适用于两组,所以在多维情况下,t检验不适用,而F检验可以判断多组、一组多变量和多组(单因素、协方差、二因素)之间的交互作用没有重复,两个因素有重复等),然后通过两两比较分析,用duncan和tukey等方法确定。