吴恩达机器学习 - 第八章逻辑回归的代价函数以及具体实现

夏驰和徐策

504人浏览 · 2025-04-11 11:08:04

夏驰和徐策 · 2025-04-11 11:08:04 发布

📘 吴恩达机器学习 - 第八章逻辑回归的代价函数以及具体实现

“代价函数不是神经网络的附庸，而是评判其学习是否成功的裁判。”
—— 徐策（逻辑王子）

🧠 8.1 逻辑回归的代价函数

在线性回归中，我们采用的是均方误差（MSE）作为代价函数。然而，当模型的输出目标为 0 或 1 时（例如是否患病、是否为垃圾邮件等分类问题），我们必须抛弃均方误差，转而引入新的、更适合概率判别的度量标准。

在逻辑回归中，我们用的是 对数损失函数（Log Loss）：

其中：

这个代价函数有如下优点：

对数性质：当模型预测越接近真实标签时，损失越小；
凸性：代价函数是凸的，有助于优化算法收敛到全局最优。

✂️ 8.2 简化版代价函数（向量化表达）

吴恩达在视频中演示了如何对逻辑回归的代价函数进行向量化简化，使其便于实现：

其中：

Y∈Rm×1Y \in \mathbb{R}^{m \times 1}，表示所有真实标签组成的向量；
H=sigmoid(X⋅θ)∈Rm×1H = sigmoid(X \cdot \theta) \in \mathbb{R}^{m \times 1}，表示所有预测概率组成的向量。

这样，整个代价函数计算过程可高度并行化，适合在 GPU 上高效训练。

🔁 换个角度直观理解一下

逻辑回归的代价函数其实是在惩罚“自信但错”的预测：

如果你预测是 1，结果也是 1 → 代价接近 0；
如果你预测是 1，结果却是 0 → 代价爆炸（log(0) 趋近于 -∞）；
如果你预测接近 0.5，系统认为你“模棱两可”，惩罚较轻。

这正体现了人类对“错误判断”天然的惩罚机制。

🧪 代码实现（基于 Python）

import numpy as np

def sigmoid(z):
    return 1 / (1 + np.exp(-z))

def compute_cost(theta, X, y):
    m = len(y)
    h = sigmoid(X @ theta)
    epsilon = 1e-5  # 防止 log(0)
    cost = -(1/m) * (y.T @ np.log(h + epsilon) + (1 - y).T @ np.log(1 - h + epsilon))
    return cost

✅ 总结一句话：

逻辑回归的代价函数，不只是优化目标，它是机器理解分类“对错”的逻辑边界。

DAMO开发者矩阵

DAMO开发者矩阵，由阿里巴巴达摩院和中国互联网协会联合发起，致力于探讨最前沿的技术趋势与应用成果，搭建高质量的交流与分享平台，推动技术创新与产业应用链接，围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐

人手拧灯泡，Allegro Hand零样本学会：TactAlign如何用rectified flow打通触觉异构鸿沟？

DAMO开发者矩阵

解锁新赛道！模板机在清洁智能配件领域的创新应用

DAMO开发者矩阵

基于Python Socket的机器人动作通讯仿真实现

本项目完成了一个基于 TCP Socket 的机器人动作通讯仿真系统。通过该项目，可以直观看到机器人控制端和机器人端之间的通信过程，也能理解动作指令从发送、解析、执行到状态反馈的完整流程。虽然本项目是软件仿真，但其通信思想可以扩展到真实机器人系统中。例如后续可以将 TCP 通信替换为串口、ROS2 Topic 或 MQTT，也可以将当前的机器人状态更新逻辑对接到实体机器人底盘控制程序中。