深度学习：神经元与大脑的工作原理，需求预测，神经网络层，更复杂的神经网络，推理：预测与前向传播（算法）

南宫惠泽

558人浏览 · 2026-03-22 15:12:27

南宫惠泽 · 2026-03-22 15:12:27 发布

一.神经元与大脑的工作原理：

最简单总结（你记这个就够）
大脑神经元：电化学、脉冲、会生长、会适应、超级节能。
人工神经元：加权求和 + 激活函数，靠梯度下降学习。
关系：人工神经元是大脑神经元的极度简化抽象模型，不是复刻。

二.需求预测：

上述中最基础的 “神经元”（单个神经元），本质上就是逻辑回归模型：
输入（Input）：x=price：这里用商品价格作为唯一输入特征。
激活函数（Activation）：
使用 Sigmoid 函数：a=f(x)=1/（1+e的−(wx+b)1次幂）
作用：将线性组合 wx+b 的结果压缩到 (0, 1) 区间，输出一个概率值。
输出（Output）：a：表示 “该商品成为畅销品（top seller）” 的概率。
核心思想：单个神经元就是一个二分类器，通过输入特征计算事件发生的概率。

从单个神经元扩展到单隐藏层神经网络的结构：
输入层（Input Layer）：
输入特征从 1 个扩展到多个：price、shipping cost、marketing、material，共 4 个特征。
隐藏层（Hidden Layer）：
包含 3 个神经元，每个神经元学习一个抽象概念：
第一个神经元：学习 “可负担性（affordability）”
第二个神经元：学习 “品牌认知度（awareness）”
第三个神经元：学习 “感知质量（perceived quality）”
这些中间输出称为激活值（activations），是对原始特征的抽象表示。
输出层（Output Layer）：
接收隐藏层的激活值，最终输出 “成为畅销品” 的概率。
核心思想：神经网络通过隐藏层，自动从原始数据中学习更高级、更抽象的特征，从而提升模型的表达能力。

展示了 ** 深度神经网络（DNN）** 的架构：
多隐藏层：
神经网络可以包含多个隐藏层，图中展示了 2 层和 3 层隐藏层的结构。
每一层的神经元数量（units）可以不同。
前向传播（Forward Propagation）：
数据从输入层流入，经过每一个隐藏层的计算，最后从输出层输出。
每一层的输出作为下一层的输入。
网络架构（Neural Network Architecture）：
隐藏层的数量和每层神经元的数量，是影响模型性能和复杂度的关键超参数。
层数越多，模型能学习的特征就越复杂，但也更容易过拟合，训练难度也越大。
table { border-collapse: collapse; width: 100%; }
th, td { border: 1px solid #ccc; padding: 8px; text-align: left; }

概念	核心要点
神经元	逻辑回归的推广，输入特征 → 线性组合 → 激活函数 → 概率输出。
激活函数	Sigmoid 函数将输出映射到 (0,1)，用于概率预测。
隐藏层	位于输入和输出层之间，用于学习抽象特征，是神经网络的核心。
深度神经网络	包含多个隐藏层的网络，能学习更复杂的模式。
前向传播	数据在网络中从左到右流动计算的过程。

三.神经网络层：

这是一个典型的前馈神经网络单层计算示例，用来演示从输入到激活值的前向传播过程。

在上述的权重和偏置中的w的右上标【 l 】表示的是第几层，这个可以让我们快速的辨别数据所在的层数
对于隐藏层中的各个神经元而言我们根据不同的激活值和不同的权重和偏置可以计算出各个不同的输出结果我们将隐藏层中得出的结果传递到输出层中进行输出

且对于输出的形式而言其输出是将隐藏层得出的结果数据组合成一个激活向量后以向量的方式再layer2即输出层进行输出。

关键知识点
1.前向传播：从输入层开始，逐层计算激活值，直到输出层。
2.参数共享：同一层的神经元共享输入，但各自有独立的权重和偏置。
3.非线性激活：Sigmoid 函数引入非线性，让神经网络可以拟合复杂模式。
4.层间传递：上一层的激活向量就是下一层的输入向量。

这张图展示了如何从神经网络的输出概率，得到最终的二分类（是 / 否）预测结果。

关键知识点
1.概率到类别：神经网络输出层（Sigmoid）先给出概率值，再通过阈值判断得到离散类别，这是二分类任务的标准做法。
2.阈值选择：默认阈值为 0.5，在实际应用中可根据业务需求（如更关注召回率或精确率）调整阈值。
任务场景：这类结构常用于 “是 / 否” 型二分类问题，例如判断商品是否畅销、邮件是否为垃圾邮件、肿瘤是否为恶性等。

四.更复杂的神经网络：

所谓的更复杂的神经网络指的是有更多隐藏层的神经网络，因此该部分内容与我们前面所学的内容相差不大，
主要的点在于对于多个隐藏层而言，上一层的结果值（激活值）作为下一层的输入值由于对于各个隐藏层而言存在不同的特征值，因此我们是延续上一层的数据而不是替换，因此最终我们可以根据sigmoid函数的通用形式来写出多个隐藏层激活值的通用形式即：

因此我们便可以更快的得出各个隐藏层计算完后的激活值

五.推理：预测与前向传播（算法）：

关键知识点
前向传播方向：从左到右逐层计算激活值，这是与反向传播（从右到左更新参数）的核心区别。
二分类任务：这里将 “识别数字 1” 作为正类，其他数字作为负类，是多分类任务的简化入门版本。
概率输出：输出层使用 Sigmoid 函数，直接得到样本属于正类的概率，符合二分类任务的概率解释。