假设检验总结以及如何用python进行假设检验（scipy）

hongsqi

2019-12-07

几种常见的假设检验总结如下：

假设检验名称	Z检验	t检验	χ2检验	F检验
原假设	H₀: μ≥μ₀H₀: μ≤μ₀H₀: μ=μ₀（样本和总体均值） H₀: μ₁-μ₂≥0 H₀: μ₁-μ₂≤0 H₀: μ₁-μ₂=0 （两总体均值） H₀: μ_d≥0 H₀: μ_d≤0 H₀: μ_d=0 （两总体前后差值均值）		H₀: σ²≥σ₀²H₀: σ²≤σ₀²H₀: σ²=σ₀²（样本和总体方差） H₀: σ₁²≤σ₂²H₀: σ₁²=σ₂²（两总体方差，即方差齐性） H₀: 两类别型变量相互独立（独立性检验） H₀: 总体服从某个概率分布（拟合优度检验） H₀: 总体均值相等（方差分析）--- 通常用于三个及以上的总体
备择假设	H_a: μ<μ₀H_a: μ>μ₀H_a: μ≠μ₀（样本和总体均值） H_a: μ₁-μ₂<0 H_a: μ₁-μ₂>0 H_a: μ₁-μ₂≠0 （两总体均值） H_a: μ_d<0 H_a: μ_d>0 H_a: μ_d≠0 （两总体前后差值均值）		H_a: σ²<σ₀²H_a: σ²>σ₀²H_a: σ²≠σ₀²（样本和总体方差） H_a: σ₁²>σ₂²H_a: σ₁²≠σ₂²（两总体方差） H_a: 两类别型变量不独立（独立性检验） H_a: 总体不服从某个概率分布（拟合优度检验） H_a: 总体均值不全相等（方差分析）
检验类型	左尾右尾双尾		左尾右尾双尾
检验先决条件	σ已知，样本量大于等于30	σ未知，样本量小于30（当总体服从正态分布时），样本量大于等于30（当总体不服从正态分布时）	无	总体近似正态分布（两总体方差）总体近似正态分布，总体方差相似（方差分析）
检验统计量	（样本和总体均值）（两总体均值）	（样本和总体均值）（两总体均值，独立样本，两总体方差不相等）（两总体均值，独立样本，两总体方差相等）（两总体前后差值均值，配对样本）	（样本和总体方差）（独立性检验）（拟合优度检验）	（两总体方差）（单因素方差分析）
决策方法	临界值法：如果z ≤ -z_α，则拒绝原假设（左尾）如果z ≥ z_α，则拒绝原假设（右尾）如果z ≤ -z_α_/2或 z ≥ z_α_/2，则拒绝原假设（双尾）（如果置信区间不包含μ₀，则拒绝原假设） p值法：如果p值≤α，则拒绝原假设	临界值法：如果t ≤ -t_α，则拒绝原假设（左尾）如果t ≥ t_α，则拒绝原假设（右尾）如果t ≤ -t_α_/2或 t ≥ t_α_/2，则拒绝原假设（双尾）（如果置信区间不包含μ₀，则拒绝原假设） p值法：如果p值≤α，则拒绝原假设	临界值法：如果χ² ≤ χ²_(1-_α₎，则拒绝原假设（左尾）如果χ² ≥ χ²_α，则拒绝原假设（右尾）如果χ² ≤ χ²_(1-_α₎或 χ² ≥ χ²_α，则拒绝原假设（双尾）（如果置信区间不包含σ₀²，则拒绝原假设） p值法：如果p值≤α，则拒绝原假设	临界值法：如果F ≥ F_α，则拒绝原假设（右尾）如果F ≥ F_α_/2，则拒绝原假设（双尾） p值法：如果p值≤α，则拒绝原假设
	注：p值法可以显示实际显著性，而临界值法不能。
python命令		1，单样本t检验：scipy.stats.ttest_1samp (a, popmean) 返回：t检验统计量的具体值和相应的p值（双尾） 2，配对t检验：scipy.stats.ttest_rel(a,b) 返回：t检验统计量的具体值和相应的p值（双尾） 3，独立样本t检验： scipy.stats.ttest_ind (a, b, equal_var=True) 或 scipy.stats.ttest_ind_from_stats (mean1, std1,nobs1,mean2, std2,nobs2, equal_var=True) --- 方差相等 scipy.stats.ttest_ind(a, b, equal_var=False) 或 scipy.stats.ttest_ind_from_stats (mean1, std1,nobs1,mean2,std2,nobs2, equal_var=False)--- 方差不相等返回：t检验统计量的具体值和相应的p值（双尾）	1，拟合优度检验：scipy.stats.chisquare (f_obs, f_exp=None, ddof=0) 返回：卡方统计量的具体值和相应的p值 2，独立性检验：scipy.stats.chi2_contingency (observed, correction=True) 返回：卡方统计量的具体值，相应的p值，自由度，期望频率	1，方差齐性检验：scipy.stats.levene (sample1,sample2,...) 返回：F统计量的具体值和相应的p值 2，单因素方差分析：scipy.stats.f_oneway (sample1,sample2,...) 返回：F统计量的具体值和相应的p值