【每日一更】＜吴恩达-机器学习＞多变量线性回归&学习率&特征值

爱吃糖的范同学

831人浏览 · 2021-12-14 22:39:58

爱吃糖的范同学 · 2021-12-14 22:39:58 发布

一、Linear Regression with multiple variable - 多变量线性回归:

二、Gradient descent for multiple carables - 多变量梯度下降:

三、Feature Scaling - 特征缩放：

1.特征缩放方法：

2.归一化和标准化的区别：

四、Learning rate - 学习率:

五、Features and polynomial regression:

一、Linear Regression with multiple variable - 多变量线性回归:

Multivariate linear regression:

二、Gradient descent for multiple carables - 多变量梯度下降:

三、Feature Scaling - 特征缩放：

1.特征缩放方法：

有一些时候，只对数据进行中心化和缩放是不够的，还需对数据进行白化（whitening）处理来消除特征间的线性相关性。

2.归一化和标准化的区别：

归一化（normalization）：归一化是将样本的特征值转换到同一量纲下，把数据映射到[0,1]或者[-1, 1]区间内。
标准化（standardization）：标准化是将样本的特征值转换为标准值（z值），每个样本点都对标准化产生影响。

四、Learning rate - 学习率:

首先我们简单回顾下什么是学习率，在梯度下降的过程中更新权重时的超参数，即下面公式中的 $\alpha$ ： $\theta = \theta - \alpha \frac{\partial }{\partial \theta } J(\theta )$
学习率越低，损失函数的变化速度就越慢，容易过拟合。虽然使用低学习率可以确保我们不会错过任何局部极小值，但也意味着我们将花费更长的时间来进行收敛，特别是在被困在局部最优点的时候。而学习率过高容易发生梯度爆炸，loss振动幅度较大，模型难以收敛。下图是不同学习率的loss变化，因此，选择一个合适的学习率是十分重要的。

五、Features and polynomial regression:

可以通过选择不同的特征值，来对数据进行拟合！

DAMO开发者矩阵

DAMO开发者矩阵，由阿里巴巴达摩院和中国互联网协会联合发起，致力于探讨最前沿的技术趋势与应用成果，搭建高质量的交流与分享平台，推动技术创新与产业应用链接，围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐

【论文阅读】SONIC: Supersizing Motion Tracking for Natural Humanoid Whole-Body Control

SONIC是一个多模态人形机器人控制框架，可将文本、音乐、运动规划等不同来源的动作意图转换为实时关节控制命令。它采用编码器-FSQ量化器-解码器结构，通过三个并行MLP编码器将多种运动输入映射到共享潜在空间，再经FSQ量化器生成通用token，最后由控制解码器输出29个关节的目标位置。训练时结合PPO算法和辅助损失函数（如重建损失、token对齐等），在仿真环境中优化控制策略。相比GMT、Any2

DAMO开发者矩阵

GSV9001S@普及型4K视频处理芯片｜轻量化物理AI可视化普惠落地核心（普及型工控/教育/边缘终端专用）

DAMO开发者矩阵

【AI编程思考：第五篇】学习检索增强生成（RAG）——从原理到实战

本文系统介绍了检索增强生成（RAG）技术，帮助大型语言模型突破知识局限。主要内容包括：1）RAG核心原理：通过检索私有知识库获取相关片段，再交由LLM生成基于事实的回答；2）工作流程分索引（文档分块、嵌入向量、存储）和查询（语义检索、重排序、生成）两阶段；3）关键技术：嵌入向量实现语义计算、分块策略优化、向量数据库选择及混合搜索方案；4）实践建议：通过构建PDF聊天机器人项目掌握全流程，推荐4-6