PyTorch深度学习实践（一）

首先定义前馈线性模型forward，然后定义了损失函数loss，接着用for循环穷举参数w，最后根据所得的数据绘制图像，可以观察到当w等于2时loss最小。前面的线性模型只有一个参数w，可以在合适的区间使用穷举的方法搜索参数w，但当模型有很多参数时，这种方法就不合适了。和线性回归相比多了sigmoid函数，损失函数也变成了BCE（交叉熵损失函数）。于是便引入了一个更好的方法——梯度下降算法来找到最

xiao-chong

513人浏览 · 2025-03-02 14:15:34

xiao-chong · 2025-03-02 14:15:34 发布

笔记来源：《PyTorch深度学习实践》完结合集_哔哩哔哩_bilibili

一、线性模型

首先定义前馈线性模型forward，然后定义了损失函数loss，接着用for循环穷举参数w，最后根据所得的数据绘制图像，可以观察到当w等于2时loss最小。

二、梯度下降算法

前面的线性模型只有一个参数w，可以在合适的区间使用穷举的方法搜索参数w，但当模型有很多参数时，这种方法就不合适了

于是便引入了一个更好的方法——梯度下降算法来找到最优的参数w。

上图公式是梯度下降算法的核心公式

下面还是继续使用线性模型的那个例子计算：

代码实现过程：

这里的for循环是循环的训练次数。

在深度学习中常用的是随机梯度下降

三、反向传播

当神经网络层数比较多，参数比较多的时候，我们就不能像之前一样能直接写出梯度的解析式，这时需要使用反向传播来计算：

四、用PyTorch实现线性回归

代码：

import torch
x_data=torch.tensor([[1.0],[2.0],[3.0]])
y_data=torch.tensor([[2.0],[4.0],[6.0]])
class LinearModel(torch.nn.Module):
    def __init__(self):
     super(LinearModel,self).__init__()
     self.linear=torch.nn.Linear(1,1)

    def forward(self,x):
       y_pred=self.linear(x)
       return y_pred
model=LinearModel() 
#损失函数   
criterion=torch.nn.MSELoss(size_average=False)       
#优化器
optimizer=torch.optim.SGD(model.parameters(),lr=0.01)
for epoch in range(100):
   y_pred=model(x_data)
   loss=criterion(y_pred,y_data)
   print(epoch,loss)
   optimizer.zero_grad() #所有梯度归零
   loss.backward()
   optimizer.step() #权重更新

print("w= ",model.linear.weight.item()) 
print("b= ",model.linear.bias.item())

结果：

代码中一些函数的调用方式：

五、逻辑斯蒂回归

这个叫回归实际上是个分类问题。

import torch
import torch.nn.functional as F
x_data=torch.tensor([[1.0],[2.0],[3.0]])
y_data=torch.tensor([[0.0],[0.0],[1.0]])
class LogisticRegressionModle(torch.nn.Module):
  def __init__(self):
    super(LogisticRegressionModle,self).__init__()
    self.linear=torch.nn.Linear(1,1)

  def forward(self,x):
    y_pred=F.sigmoid(self.linear(x))
    return y_pred
modle= LogisticRegressionModle() 
criterion=torch.nn.BCELoss(size_average=False)
optimizer=torch.optim.SGD(modle.parameters(),lr=0.01)
for epoch in range(1000):
  y_pred=modle(x_data)
  loss=criterion(y_pred,y_data)
  print(epoch,loss.item())
  optimizer.zero_grad() 
  loss.backward()
  optimizer.step()

和线性回归相比多了sigmoid函数，损失函数也变成了BCE（交叉熵损失函数）。

DAMO开发者矩阵

DAMO开发者矩阵，由阿里巴巴达摩院和中国互联网协会联合发起，致力于探讨最前沿的技术趋势与应用成果，搭建高质量的交流与分享平台，推动技术创新与产业应用链接，围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐

越疆焊接机器人实测：免示教到底是不是噱头？8年集成商的选型避坑指南

如果你问我，高端制造中哪些协作机器人达到工业级可靠性？我的建议是，一定要看那些经过大厂验证、有底层核心技术的品牌。目前国内市场上，越疆确实跑到了前面。据我了解，在2025年协作机器人全球出货量第一的宝座上，越疆占了很重的位置，并且已经拿下了80余家世界500强客户。而且对于大家关心的安全性，他们也率先通过了ISO 10218:2025国际最新安全标准认证。所以，如果你厂里正被“招工难、换型慢、品质