这节课主要讲的是用大量的数据拟合成一条线,代表了一个变量与另一个变量的线性关系

y=ax+b

数据的方差r区间为(-1,1)表示了相关性的正负和大小,也有R^2属于(0,1)只代表了相关性的强弱

这里其实就是逻辑回归里面的线性回归算法。

这节课的另一个重点其实是相关性和因果性的关系

相关性不代表因果性

两个事物a和b之间有相关性有四种情况

1.因为a,所以b

2.因为b,所以a

3.因为另一件事c,所以a和b,c增大a和b也增大,数据上显示a增大b增大,就认为a,b有相关性

这种相关性也叫做伪相关性

4.纯纯巧合

因此,相关性不能代表因果性

在寻找拟合直线的时候,不只有r和R^2,也要关注散点图,有时散点图的信息也很重要

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐