这是《Python统塥骈橄摆计分析》系列文章的第一篇,该系列文章致力于使用Python进行一般的统计分析,比如T检验、方差分析、回归分析、主成分、聚类、等等。Python有很多统计包可以帮助我们实现我们的目的,《Python统计分析》系列文章用到的包包括但不仅限于:pandas、numpy、scipy、Statsmodels。很多人都知道我写过所有这些包的教程,而《Python统计分析》系列文章可以把以前的内容综合运用起来,所以需要你对这些模块有一定的了解,但不需要精通。
今天这篇文章介绍一下如何使用Python进行独立样本T检验,因为T检验还算比较简单的算法,当作是入门吧。
引入相关的模块,ttest_ind是用于独立样本t检验的(independent samples t test),pandas主要用到它的DataFrame
我们可以看到数据包含三列,最后一列group表示不同的组,只有1、2两组
我们可以得到这样的数据
检验的结果得到一个tuple,第一个元素是t值,第二个元素是p值,根据p值就知道两列数据均值差异不显著
结果得到的是tuple构成的tuple,第一个tuple元素表示t值,根据结果我们就知道t(scoreA)=1.366,t(scoreB)=0.601,另一个tuple就不解释了吧![Python统计分析:[1]独立样本T检验](https://exp-picture.cdn.bcebos.com/de9bfa3b3b86022121aba7e2d8bbf82065fb7250.jpg)
检验结果为p>0.05所以,可以认为方差是相等的。![Python统计分析:[1]独立样本T检验](https://exp-picture.cdn.bcebos.com/5e4e9c2b74ee1c32dce4659807f1d8a727334b50.jpg)