第五章卡方检验

不是所有的样本都可以计算平均数和方差的;

例如属性资料的样本,和一些计数资料的样本

属性资料 计数资料
用1. 统计次数法;2. 评分法 服从二项分布,则可以利用二项分布的公式来研究其概率分布,有时可近似成正态分布
将其转化为计数资料 无论是否服从二项分布,都可以使用χ2检验来研究其概率分布

χ2检验(chi-square test)

①一个样本的方差同质性检验;

②适合性检验;只有右尾检验

③独立性检验;只有右尾检验

image-20220324162959712

•对于计数资料或属性资料,其观测值Oi与理论值Ei通过以上公式计算后,应该趋向于服从自由度df=k-1的χ2分布。

•如果观测值Oi偏离理论值Ei,χ2增大,与χ2分布只有右侧拖着长尾吻合;

χ2检验的步骤

•1. 提出零假设:观测值等于理论值,或者说两者的差异是由抽样误差引起的;备择假设:观测值不等于理论值,即两者的差异是真实存在的。

•2. 确定显著水平α,一般取0.05或0.01。

•3. 根据公式计算χ2。

•4. 进行统计推断。从附表4查出χ2α的值,如果χ2大于χ2α,则拒绝零假设;否则接受零假设。

PS:

  1. 理论值非常小时,上式计算的χ2将偏离χ2分布,所以在Ei≤5时,需要进行并组

  2. 自由度df=1时,需要进行连续性矫正;当df>1时,是否进行连续性矫正差别不大。

    image-20220324165151777
适合性检验compatibility test 独立性检验
比较观测值与理论值是否符合的假设检验,也叫拟合优度检验(goodness of fit test) 独立性检验是研究两个或两个以上因子彼此之间是相互独立的还是相互影响的一类统计方法,也理解成两个样本之间的适合性检验。
二项分布的适合性检验根据二项分布公式计算理论频数 注意理论值≤5时应该并组。image-20220324170136248通过样本估计了一个参数,需要df-1 自由度df=(r-1)(c-1)
正态分布的适合性检验先根据频数分布表,计算样本的平均数和方差image-20220324170508861通过样本估计了两个参数,df-2
Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐