3. 机器学习-线性回归

悟道心

764人浏览 · 2025-12-10 08:37:47

悟道心 · 2025-12-10 08:37:47 发布

3. 机器学习-线性回归

1）是什么

线性回归是一种监督学习算法，用于建立输入特征与连续目标变量之间的线性关系模型。其核心假设是：输出 y 可以通过输入特征的加权和加上一个偏置项来近似表示。数学形式为：
在这里插入图片描述

✅ 小结：线性回归用一条“直线”（或超平面）拟合数据，目标是预测连续数值。

2）为什么

线性回归被广泛使用，不仅因为其实现简单，更因其具备良好的可解释性和坚实的统计理论基础。它能快速提供特征对结果的影响方向和强度（通过系数大小和符号），常被用作基准模型。此外，它是许多高级模型（如岭回归、Lasso、逻辑回归）的基础。

✅ 小结：线性回归简单、高效、可解释，是理解更复杂模型的起点。

3）什么时候用

当目标变量是连续值，且特征与目标之间存在近似线性关系时，线性回归非常适用。典型场景包括房价预测、销售额估算、温度建模等。它也适合需要透明决策过程的领域（如金融、医疗），以及作为初步探索性建模工具。

✅ 小结：适用于连续目标、线性关系、强调可解释性或作为基线模型的场景。

4）什么时候不用

若数据呈现明显非线性模式、存在大量异常值、特征高度相关（多重共线性），或任务本质是分类而非回归，则线性回归效果不佳。此外，在误差方差不恒定（异方差）或样本量极小时，其假设前提被破坏，结果不可靠。

✅ 小结：非线性、异常值多、共线性强、分类任务或违反基本假设时，应避免使用。

5）总结

线性回归是机器学习的基石之一，兼具实用性与教学价值。它在满足基本假设的前提下表现稳健，但面对复杂现实数据时可能力不从心。合理使用需结合数据探索、诊断检验（如残差分析）和模型对比。

✅ 最终小结：线性回归是“简单但不简陋”的工具——用得好，事半功倍；用得不当，误导结论。始终先验证假设，再决定是否采用。

概念

3.1 损失函数

损失函数用于量化模型预测值与真实值之间的误差，是优化过程的核心目标。不同的损失函数对误差的敏感程度不同，直接影响模型的行为。

小结 🎯：损失函数定义了“什么是好预测”，需根据数据特性和任务目标合理选择。

3.1.1 最小二乘法 LS

在这里插入图片描述

小结 🔹：理论扎实、计算直接，但对异常值敏感，适用于噪声较小的场景。

3.1.2 均方误差 MSE

在这里插入图片描述

小结 🔸：放大较大误差，适合对严重偏差零容忍的任务，但易受离群点干扰。

3.1.3 平均绝对值误差 MAE

在这里插入图片描述

小结 🟢：稳健、直观，抗异常值能力强，但优化过程不如 MSE 光滑。

3.2 寻找最小损失函数

确定损失函数后，需通过优化方法求解最优参数。主要分为解析法和迭代法两类。

小结 ⚙️：方法选择取决于数据规模、特征维度和计算资源。

3.2.1 正规方程法(解析法)

在这里插入图片描述

小结 🔷：高效精确，但仅适用于小规模、低维且无共线性的数据。

3.2.2 梯度下降法（迭代法）

在这里插入图片描述

小结 🔄：通用性强，是现代机器学习的基础优化工具，需调好学习率并监控收敛。

3.3 回归模型评估方法

在这里插入图片描述

小结 📊：高训练分数 ≠ 好模型，泛化能力才是关键。

3.4 拟合问题

模型复杂度需与数据匹配：太简单 → 欠拟合；太复杂 → 过拟合。

小结 ⚖️：理想模型在偏差与方差之间取得平衡。

3.4.1 欠拟合

模型无法捕捉基本趋势，训练与测试误差均高。

小结 📉：表现“学不会”，可通过增强模型或增加有效特征改善。

3.4.2 过拟合

模型在训练集上表现极佳，但在新数据上大幅退步。

小结 📈：表现“死记硬背”，需简化模型或引入正则化。

3.4.3 正则化

在这里插入图片描述

小结 🛡️：有效控制模型复杂度，提升泛化能力，是应对过拟合的标准手段。

DAMO开发者矩阵

DAMO开发者矩阵，由阿里巴巴达摩院和中国互联网协会联合发起，致力于探讨最前沿的技术趋势与应用成果，搭建高质量的交流与分享平台，推动技术创新与产业应用链接，围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐

AI 前沿日报 | 2026年6月30日

•🌊 全球首个隐空间世界模型：打通长时序双向物理因果链，将视觉、触觉与力觉融合，机器人从"摸到世界"进化到"预感世界"。1. 模型竞争白热化：GPT-5.6 vs Fable 5 正面交锋，"分批释放"成前沿模型发布新常态，安全与监管同步加码。2. Agent 从工具走向经济参与者：AI 不再只是生成内容，开始承担交易角色，但"画矩阵"的战略直觉仍是人类护城河。3. 具身智能加速落地：从实验室到

DAMO开发者矩阵

ROS动作通信超全详解：原理、流程、实战代码与场景对比

动作通信（Action）是ROS专为长时任务、可中断、带进度反馈设计的异步客户端/服务端通信机制，融合了话题通信和服务通信的核心优势，是机器人运动控制、导航任务的核心通信方式。通俗类比：广播播报，单向持续推送，不管对方是否接收打电话问答，一问一答，阻塞等待结果，无法中断、无进度反馈带进度条、可随时取消的任务委托，下发任务后实时回传进度，任务结束返回最终结果，支持中途终止任务Goal（目标）：客户端