双变量相关分析根据变量的数据类型不同而不同。当数值数据和数值数据计算相关性时,指标为相关系数;数值数据和类别数据计算相关性时,指标为相关比;类别数据和类别数据计算相关性时,指标为克里姆相关系数。

1 计算公式

按照变量的类型有三种分析相关性指标。

数值数据和数值数据计算相关性时,指标为相关系数

数值数据和类别数据计算相关性时,指标为相关比

类别数据和类别数据计算相关性时,指标为克里姆相关系数

在这里插入图片描述

2 相关分析

2.1 相关系数

数据为数值类型

现在假设我们有以下数据,求化妆品费和装置费(服装费)之间相关性
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2.2 相关比

如下年龄为数值数据,品牌为类别数据。求”年龄“和”喜欢的服装品牌“之间相关性
在这里插入图片描述
计算:
整理上表,按每个类别分组
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
相关比的意义:
在这里插入图片描述

2.2 克莱姆相关系数

克里姆相关系数也可称为克莱姆的关联系数或独立系数

如下交叉表,性别为类别数据,希望的表白方式也为类别数据。求”性别“和”希望的表白方式“之间相关性
在这里插入图片描述
计算:
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
参考:
漫画统计学

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐