深度学习之数学基础：偏导数

铭瑾熙

1536人浏览 · 2024-05-06 00:59:34

铭瑾熙 · 2024-05-06 00:59:34 发布

1.导数和偏导数

1.1 导数偏导计算

导数定义:

导数(derivative)代表了在自变量变化趋于无穷小的时候，函数值的变化与自变量的变化的比值。几何意义是这个点的切线。物理意义是该时刻的（瞬时）变化率。

注意：在一元函数中，只有一个自变量变动，也就是说只存在一个方向的变化率，这也就是为什么一元函数没有偏导数的原因。在物理学中有平均速度和瞬时速度之说。平均速度有

$v=\frac{s}{t}$

其中 $v$ 表示平均速度， $s$ 表示路程， $t$ 表示时间。这个公式可以改写为

$\bar{v}=\frac{\Delta s}{\Delta t}=\frac{s(t_0+\Delta t)-s(t_0)}{\Delta t}$

其中 $Δs\Delta s$ 表示两点之间的距离，而 $Δt\Delta t$ 表示走过这段距离需要花费的时间。当 $Δt\Delta t$ 趋向于0（ $Δt→0\Delta t \to 0$ ）时，也就是时间变得很短时，平均速度也就变成了在 $t_0$ 时刻的瞬时速度，表示成如下形式：

$v(t_0)=\lim_{\Delta t \to 0}{\bar{v}}=\lim_{\Delta t \to 0}{\frac{\Delta s}{\Delta t}}=\lim_{\Delta t \to 0}{\frac{s(t_0+\Delta t)-s(t_0)}{\Delta t}}$

实际上，上式表示的是路程 $s$ 关于时间 $t$ 的函数在 $t=t_0$ 处的导数。一般的，这样定义导数：如果平均变化率的极限存在，即有

$\lim_{\Delta x \to 0}{\frac{\Delta y}{\Delta x}}=\lim_{\Delta x \to 0}{\frac{f(x_0+\Delta x)-f(x_0)}{\Delta x}}$

则称此极限为函数 $y = f (x)$ 在点 $x_0$ 处的导数。记作 $f'(x_0)$ 或 $y′∣x=x0y'\vert_{x=x_0}$ 或 $dydx∣x=x0\frac{dy}{dx}\vert_{x=x_0}$ 或 $df(x)dx∣x=x0\frac{df(x)}{dx}\vert_{x=x_0}$ 。

通俗地说，导数就是曲线在某一点切线的斜率。

偏导数:

既然谈到偏导数(partial derivative)，那就至少涉及到两个自变量。以两个自变量为例， $z = f (x, y) $ ，从导数到偏导数，也就是从曲线来到了曲面。曲线上的一点，其切线只有一条。但是曲面上的一点，切线有无数条。而偏导数就是指多元函数沿着坐标轴的变化率。

注意：直观地说，偏导数也就是函数在某一点上沿坐标轴正方向的的变化率。

设函数 $z = f (x, y) $ 在点 $x_0,y_0)$ 的领域内有定义，当 $y=y_0$ 时， $z $ 可以看作关于 $x $ 的一元函数 $f(x,y_0)$ ，若该一元函数在 $x=x_0$ 处可导，即有

$\lim_{\Delta x \to 0}{\frac{f(x_0+\Delta x,y_0)-f(x_0,y_0)}{\Delta x}}=A$

函数的极限 $A$ 存在。那么称 $A$ 为函数 $z = f (x, y)$ 在点 $x_0,y_0)$ 处关于自变量 $x$ 的偏导数，记作 $f_x(x_0,y_0)$ 或 $∂z∂x∣y=y0x=x0\frac{\partial z}{\partial x}\vert_{y=y_0}^{x=x_0}$ 或 $∂f∂x∣y=y0x=x0\frac{\partial f}{\partial x}\vert_{y=y_0}^{x=x_0}$ 或 $zx∣y=y0x=x0z_x\vert_{y=y_0}^{x=x_0}$ 。

偏导数在求解时可以将另外一个变量看做常数，利用普通的求导方式求解，比如 $z=3x^2+xy$ 关于 $x$ 的偏导数就为 $z_x=6x+y$ ，这个时候 $y$ 相当于 $x$ 的系数。

某点 $x_0,y_0)$ 处的偏导数的几何意义为曲面 $z = f (x, y)$ 与面 $x=x_0$ 或面 $y=y_0$ 交线在 $y=y_0$ 或 $x=x_0$ 处切线的斜率。

1.2 导数和偏导数有什么区别？

导数和偏导没有本质区别，如果极限存在，都是当自变量的变化量趋于0时，函数值的变化量与自变量变化量比值的极限。

一元函数，一个 $y$ 对应一个 $x$ ，导数只有一个。

二元函数，一个 $z$ 对应一个 $x$ 和一个 $y$ ，有两个导数：一个是 $z$ 对 $x$ 的导数，一个是 $z$ 对 $y$ 的导数，称之为偏导。

求偏导时要注意，对一个变量求导，则视另一个变量为常数，只对改变量求导，从而将偏导的求解转化成了一元函数的求导。

DAMO开发者矩阵

DAMO开发者矩阵，由阿里巴巴达摩院和中国互联网协会联合发起，致力于探讨最前沿的技术趋势与应用成果，搭建高质量的交流与分享平台，推动技术创新与产业应用链接，围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐

ros小车自动充电硬件架构与 IsaacLab 强化学习仿真部署

文章摘要：本文探讨了机器人开发中的两大核心挑战：高容错自动充电系统设计与灵巧手强化学习仿真部署。自动充电硬件架构：采用固定端弹簧顶针+移动端铜垫方案，避免机械损伤。通过肖特基二极管防止电池倒灌短路，结合微动开关实现“冷插拔”时序控制，确保电气安全。 IsaacLab灵巧手仿真优化：传统CAD模型直接导入会导致算力爆炸，需对URDF文件进行轻量化（凸分解、阻尼注入）和碰撞网格优化。提供S