统计学定义:
统计学是一门收集,处理,分析,解释并从中得出结论的科学。

核心:数据

数据分析步骤:收集数据=》处理数据=》分析数据=》解释数据

统计学运用在分析数据的方法分为两大类:
描述性数据方法。总体规模、对比关系、集中趋势、离散程度、偏态、 峰态、......
推断性数据分析方法。估计、假设检验、列联分析、方差分析、相关分析、 回归分析、......
描述统计、推断统计两大类


统计学的对象是数据
数据有两种形式:数字和文字。

如何区分文字和数字:是否可以运算。

将数据按照计量尺度不同分三种:

计量尺度为四种:分类尺度、顺序尺度、间隔尺度、比率尺度

注:间隔尺度和比率尺度的区别在于

间隔尺度:对事物类别或次序之间距离的测度,通常用自然或物理单位作为计量尺度,没有绝对零点,且可以相加减,但不能乘除;

定比尺度:有绝对零点,可以加减乘除运算。

分类型数据:数据表现为类别,文字型数据。

顺序型数据:数据表现为类别,文字型数据。

数值型数据:结果表现为具体的数字。

分类型和顺序型数据称为:定性数据。

数值型数据称为:定量数据。

数据的分类:

分法 低级————>高级
两类 定性 定量
三类 分类 顺序 数值
四类 分类 顺序 定距 定比

低级数据的方法高级数据可以用,而高级数据的方法低级数据不可用

数据预处理概念:

数据预处理是在对数据分类或分组之前所做的必要处理,内容包括数据的审核、筛选、排序等

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐