李宏毅《机器学习》笔记：6.深度学习简介

羊老羊

498人浏览 · 2021-09-24 00:31:07

羊老羊 · 2021-09-24 00:31:07 发布

2021.09.23
LeeML-Notes：P13

文章目录

6.0 深度学习的三个步骤
6.1 神经网络
- 6.1.1 完全连接前馈神经网络
- 6.1.2 完全连接前馈神经网络整体结构
6.2 模型评估：总损失
6.3 选择最优函数

6.0 深度学习的三个步骤

在这里插入图片描述

神经网络
模型评估
选择最优函数

6.1 神经网络

6.1.1 完全连接前馈神经网络

前馈（feedforward）也可以称为前向，信号流动是单向的，没有反馈，从输入逐层传播直到输出
完全连接，如上图layer1与layer2之间两两都有连接，所以叫做Fully Connect；
一个神经元的计算过程

.
*注意w矩阵的形式

6.1.2 完全连接前馈神经网络整体结构

全连接前馈网络，基本结构：输入层，隐藏层，输出层，神经元

输入层（Input Layer）：1层
隐藏层（Hidden Layer）：N层
输出层（Output Layer）：1层

计算方法就像是嵌套

6.2 模型评估：总损失

损失示例

对于模型的评估，我们一般采用损失函数来反应模型的好差，所以对于神经网络来说，我们采用交叉熵（cross entropy）函数来对 $y和\hat{y}$ 的损失进行计算，接下来我们就是调整参数，让交叉熵越小越好。

交叉熵：https://blog.csdn.net/wistonty11/article/details/120416080

总损失

这里只是展示了1个数字1的损失量。对于损失，我们不单单要计算一笔数据的，而 是要计算整体所有训练数据的损失，然后把所有的训练数据的损失都加起来，得到一个总体损失L。接下来就是在function set里面找到一组函数能最小化这个总体损失L，或者是找一组神经网络的参数θ，来最小化总体损失L。

6.3 选择最优函数

如何找到最优的函数和最好的一组参数呢，我们用的就是梯度下降。

参数 $\theta$ 中包含了很多参数 $w_1,w_2....b_1....$
接下来计算梯度（也就是每个参数对于total loss L的偏导数)

计算过程参考本文《逻辑回归_5.2.3步骤三：find the best function》
和《李宏毅《机器学习》笔记：7.反向传播》

DAMO开发者矩阵

DAMO开发者矩阵，由阿里巴巴达摩院和中国互联网协会联合发起，致力于探讨最前沿的技术趋势与应用成果，搭建高质量的交流与分享平台，推动技术创新与产业应用链接，围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐

人手拧灯泡，Allegro Hand零样本学会：TactAlign如何用rectified flow打通触觉异构鸿沟？

DAMO开发者矩阵

解锁新赛道！模板机在清洁智能配件领域的创新应用

DAMO开发者矩阵

基于Python Socket的机器人动作通讯仿真实现

本项目完成了一个基于 TCP Socket 的机器人动作通讯仿真系统。通过该项目，可以直观看到机器人控制端和机器人端之间的通信过程，也能理解动作指令从发送、解析、执行到状态反馈的完整流程。虽然本项目是软件仿真，但其通信思想可以扩展到真实机器人系统中。例如后续可以将 TCP 通信替换为串口、ROS2 Topic 或 MQTT，也可以将当前的机器人状态更新逻辑对接到实体机器人底盘控制程序中。