关于统计学的检验做一个总结【备查】

2023-12-13 17:39:05

在统计的假设检验中,有许许多多的检验方法,各个方法适用于什么?具体的数理基础知识是什么?有哪些常见的检验方法做一个总结。

1.Z检验

Z检验是一种统计检验,用于确定两个样本均值之间的差异是否在统计上显著,特别是当样本量较大(通常 n > 30)时。Z检验假设总体方差是已知的,并假设数据呈正态分布。Z检验统计量的计算公式取决于检验的具体类型,例如单样本Z检验、两样本Z检验等。以下是一些常见的Z检验统计量的计算公式:

1.1 单样本Z检验(比较单个样本的均值与已知的总体均值)

Z = X ˉ ? μ σ / n Z = \frac{\bar{X} - \mu}{\sigma / \sqrt{n}} Z=σ/n ?Xˉ?μ?

X ˉ \bar{X} Xˉ是样本均值, μ \mu μ是已知的总体均值, σ \sigma σ是总体标准差, n n n 是样本大小。

1.2 两样本Z检验(比较两个独立样本的均值差异):

Z = X ˉ 1 ? X ˉ 2 σ 1 2 / n 1 + σ 2 2 / n 2 Z = \frac{\bar{X}_1 - \bar{X}_2}{\sqrt{\sigma^2_1/n_1 + \sigma^2_2/n_2}} Z=σ12?/n1?+σ22?/n2? ?Xˉ1??Xˉ2??

?
X 1 ˉ \bar{X_1} X1?ˉ? X 2 ˉ \bar{X_2} X2?ˉ?分别是两个样本的均值, σ 1 2 \sigma^2_1 σ12? σ 1 2 \sigma^2_1 σ12? 是两个总体的方差, n 1 n_1 n1? n 2 n_2 n2?分别是两个样本的大小。

在实际应用中,由于总体方差往往是未知的,因此更常使用T检验而不是Z检验。如果总体方差未知且样本量较小,使用T检验更为合适。只有在总体方差已知或样本量非常大(大样本条件下,样本方差可以作为总体方差的良好估计)时,才适合使用Z检验。

2.T检验

.T统计量(T-statistic)通常用于假设检验中,特别是在T检验中。T统计量的计算公式依赖于测试的具体类型(例如单样本T检验、独立样本T检验、配对样本T检验等)。以下是一些常见的T统计量计算公式:

2.1 单样本T检验(检验样本均值与已知总体均值的差异):

T = X ˉ ? μ s / n T = \frac{\bar{X} - \mu}{s / \sqrt{n}} T=s/n ?Xˉ?μ?
X ˉ \bar{X} Xˉ是样本均值, μ \mu μ 是已知的总体均值, s s s是样本标准差, n n n是样本大小。

2.2 独立样本T检验(比较两个独立样本均值的差异):

T = X ˉ 1 ? X ˉ 2 s p 2 ( 1 n 1 + 1 n 2 ) T = \frac{\bar{X}_1 - \bar{X}_2}{\sqrt{s^2_p(\frac{1}{n_1} + \frac{1}{n_2})}} T=sp2?(n1?1?+n2?1?) ?Xˉ1??Xˉ2??
其中, X ˉ 1 \bar{X}_1 Xˉ1? X ˉ 2 \bar{X}_2 Xˉ2?分别是两个样本的均值, n 1 n_1 n1? n 2 n_2 n2?是两个样本的大小, s p 2 s^2_p sp2?是两个样本方差的合并估计。

2.3 配对样本T检验(比较两个相关或配对样本均值的差异):

T = D ˉ s D / n T = \frac{\bar{D}}{s_D / \sqrt{n}} T=sD?/n ?Dˉ?
D ˉ \bar{D} Dˉ 是差异得分的平均值(第一个样本的观察值与第二个样本的观察值之间的差), S D S_D SD?是差异得分的标准差, n n n是差异得分的数量。

这些公式的应用取决于您的数据特点和检验目的。在使用这些公式之前,确保数据满足T检验的基本假设,如正态分布性和方差齐性(对于独立样本T检验)。

3.F检验统计量

F检验是一种用于比较两个样本方差的统计检验,通常用于方差分析(ANOVA),以检验两个或多个群体均值之间是否存在显著差异。F统计量的计算方式取决于你正在进行的特定类型的F检验,比如单因素ANOVA、双因素ANOVA等。下面是一些常见的F检验统计量的计算公式:

3.1 单因素ANOVA(用于比较三个或更多群体的均值):

其中,
M S b e t w e e n MS_{between} MSbetween?(组间均方)是组间方差的估计,即各组均值与总均值之差的平方和除以自由度(组数减1)。
M S w i t h i n MS_{within} MSwithin?(组内均方)是组内方差的估计,即各组内各个数据与该组均值之差的平方和除以相应的自由度(总样本数减组数)。

3.2 双因素ANOVA(用于比较两个独立因素对变量的影响):

F = M S f a c t o r M S e r r o r F=\frac{MS_{factor}}{MS_{error}} F=MSerror?MSfactor??
?
其中, M S f a c t o r MS_{factor} MSfactor?是因素(比如处理方式、时间等)的均方,而 M S e r r o r MS_{error} MSerror?是误差的均方。这里的具体计算方式会因设计(是否有重复、因素间是否有交互作用等)而异。

F检验的关键在于比较组间方差和组内方差。如果组间方差显著大于组内方差,F值会相对较大,这可能表明组间存在显著差异。在实际应用中,通常会使用统计软件来计算F值,并根据自由度和显著性水平查F分布表来确定统计显著性。

4. LR检验(似然比检验)、LM检验(拉格朗日乘数检验)和Wald检验

4.1 LR检验(似然比检验)

LR检验(似然比检验):

用途:比较两个嵌套模型(即一个模型是另一个模型的特殊情况)的拟合优度。
原理:计算两个模型的对数似然函数值的差异。更具体地说,比较完整模型(没有参数限制)和受限模型(有参数限制)的对数似然值。
计算公式:

L R = ? 2 ( ln ? ( L 0 ) ? ln ? ( L 1 ) ) LR = -2(\ln(L_0) - \ln(L_1)) LR=?2(ln(L0?)?ln(L1?))

?
L 0 L_0 L0? L 1 L_1 L1?分别是受限模型和完整模型的似然函数值。

4.2 LM检验

用途:检验模型中的参数约束是否成立,尤其适用于样本量较小时的线性模型。
原理:基于被约束模型的残差和无约束模型的参数估计。检验的核心是看在约束条件下模型残差是否显著增加。
计算公式:依赖于具体的模型和约束条件,通常涉及到残差和参数估计的梯度。

4.3 Wald检验

用途:用于检验一个或多个参数的值。
原理:比较估计参数与其假设值之间的差异,考虑到参数估计的标准误差。
计算公式:

W a l d = ( θ ^ ? θ 0 ) T ? ( Var ( θ ^ ) ) ? 1 ? ( θ ^ ? θ 0 ) Wald = (\hat{\theta} - \theta_0)^T \cdot (\text{Var}(\hat{\theta}))^{-1} \cdot (\hat{\theta} - \theta_0) Wald=(θ^?θ0?)T?(Var(θ^))?1?(θ^?θ0?)

θ 0 ^ \hat{\theta_0} θ0?^? 是估计的参数向量,

? θ 0 \theta_0 θ0?是假设的参数值,

var ( θ 0 ^ ) \text{var}(\hat{\theta_0}) var(θ0?^?) 是参数估计的方差协方差矩阵。

这三种检验各有特点和适用条件。LR检验适用于大样本且对模型的分布假设不是很严格;LM检验适用于样本量较小且模型较简单的情况;而Wald检验适用于大样本和参数估计较为精确的情况。在实际应用中,需要根据具体的模型和数据选择最合适的检验方法。

5.其他检验

除了T检验、F检验和Z检验之外,还有许多其他的统计检验方法,它们用于不同类型的数据和不同的假设检验场景。以下是一些常见的统计检验:

5.1 卡方检验(Chi-Square Test)

用于检验类别数据的分布是否符合预期分布,或者两个类别变量之间是否独立。

5.2 Mann-Whitney U检验

一种非参数检验,用于比较两个独立样本的中位数是否存在显著差异。

5.3 Wilcoxon符号秩检验

用于比较两个相关样本、配对样本或重复测量数据的中位数差异。

5.4 Kruskal-Wallis H检验

非参数方法,用于比较三个或更多独立样本的总体中位数是否存在显著差异。

5.5 ANOVA(方差分析)

用于比较三个或更多样本均值的统计检验,分为单因素ANOVA和多因素ANOVA。

5.6 多重比较检验

如Tukey的HSD(诚实显著差异)测试,用于在ANOVA发现显著差异后,确定哪些组之间存在差异。

5.7 Fisher精确检验

当样本量较小时,用于检验两个类别变量之间是否独立的方法。

5.8 Spearman等级相关系数

用于衡量两个变量之间的非线性关系强度。

5.9 McNemar检验

用于相关或配对名义(分类)数据。

5.10 Cochran’s Q检验

用于比较三个或更多相关样本的名义(分类)数据。

文章来源:https://blog.csdn.net/weixin_43213884/article/details/134974914
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。