深度学习之TensorFlow（三）回归算法

Siri_only · 2020-02-29 19:10:03 发布

用来确定一个事件的概率。通常来说，事件可被表示为类别因变量。事件的概率用 logit 函数（Sigmoid 函数）表示：
$P(Yhat=1∣X=x)=11+e−(b+WT+X)P(Y_{hat}=1|X=x)={1 \over {1+e^{-({b+W^T+X})}}}$
现在估计权重W={w1,w2,…wn}和偏置项b.使用最大似然估计量或随机梯度下降估计系数。
损失函数： $loss=∑i=1PYilog⁡(Yhati)+(1−Yi)log⁡(1−Yhati)loss=\sum_{i=1}^{P}Y_i\log(Y_{{hat}_i})+(1-Y_i)\log(1-Y_{{hat}_i})$
逻辑回归用分类问题，对于多类型逻辑回归，交叉熵损失函数定义为：
$loss=∑i=1P∑j=1KYijlog⁡(Yhatij)loss=\sum_{i=1}^{P}\sum_{j=1}^{K}Y_{ij}\log(Y_{{hat}_{ij}})$

大量特征输入，需要正则化保证模型的简约。正则化帮助防止数据过拟合，也可以用来获得一个凸损失函数，有两种类型正则化。
数据高度共线，L1正则化工作，与所有系数的绝对值
和相关的附加惩罚被添加到损失函数，
$L1_penalty=λ∑i=1n∣Wi∣L1\_penalty=\lambda\sum_{i=1}^{n}|W_i|$
L2正则化提供了另一种解决方法，输入特征巨大时，适用。
惩罚项是所有系数平方之和。
$L2_penalty=λ∑i=1n∣Wi2∣L2\_penalty=\lambda\sum_{i=1}^{n}|W_{i}^{2}|$
$λ\lambda$ 是正则化参数。