一、数据的预处理

1.1 缺失值处理

1602289eb2cb487087feb3f80eb57f1d.png

1.2 异常值

280b9f2bb6314004941d636f12950068.png

1.3 数据的变换

b435a0227c8e4fd6a21a9ee33395fc86.png

1.4 数据的描述性统计分析

179379ab67564e37b00d7d24e8da7879.png

 此部分前几年有篇优秀论文写的很好,可以参考。

1.5 数据的可视化

d0360e8317f04ee893970f739403ef76.png

1.6 数据降维

638e847f07904a90a6d1b45e78fe8c0a.png

二、回归分析(重点)

28a6cb33dee54a3ab26cab09c7a119e0.png

 三、机器学习

f6b1213ef9b445dcae0923c03cf2724b.png

四、其他数据建模方法

d94cdf347dd8434f94f427e96ac2e54d.png

五、葡萄酒评价问题(重点)

5.1 问题重述

c053525566854b5f8f2b534918ec61d1.png

5.2 问题一求解

用t检验对显著性差异进行评判,用方差对结果进行评判。

5.3 问题二求解

分级即分类,该问题为一个聚类问题,该论文用了K均值聚类,层次聚类,模糊C聚类对问题进行分类。针对理化指标,用了PCA进行降维后再聚类;针对质量,直接对数据运用三种聚类方法进行分类,最后对两种分类结果进行分析。

5.3 问题三求解(重点)

ba02c4ca6df549e3bb6638347f8d32ba.png

5.3 问题四求解

c57614ccb92d42e98b61b13d2c11c23c.png

 

 

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐