pytorch因为多线程原因导致内存不足

转载

mob6454cc613c41 2024-09-12 13:49:04

文章标签 pytorch 学习笔记 MSE 损失函数 文章分类 PyTorch 人工智能

p30：1.均方差（Mean Squared Error,MSE）：

pytorch因为多线程原因导致内存不足_笔记

（1）注意区分MSE和L2范数：

pytorch因为多线程原因导致内存不足_笔记_02

L2范数要开根号，而MSE不需要开根号。

pytorch因为多线程原因导致内存不足_学习_03

用torch.norm函数求MSE的时候不要忘记加上pow(2)。

求导：

pytorch因为多线程原因导致内存不足_MSE_04

pytorch实现自动求导：第一种方法：torch.autograd.grad()

pytorch因为多线程原因导致内存不足_pytorch_05

设置w需要求导有两种方法：

（1）在创建w之后，用

pytorch因为多线程原因导致内存不足_pytorch_06

来设置w需要求导。

（2）在创建w的时候，用w=torch.tensor([1],requires_grad=True)来设置w需要求导。

用torch.autograd.grad(y,[w:放需要对谁求导])实现求导，如果w设置的是需要求导，那么可以正常求导，否则会报错。

pytorch求MSE：

pytorch因为多线程原因导致内存不足_损失函数_07

第一个参数是预测值，第二个参数是求预测值的表达式。

第二种方法：mse.backward()

pytorch因为多线程原因导致内存不足_学习_08

使用mse.backward()反向传播，将计算出的梯度结果放到每一个求导对象（如w）上，即通过w.grad即可返回w的梯度信息。

注意：w.norm()返回的是L2范数，w.grad.norm()返回的是梯度的norm。

总结：

pytorch因为多线程原因导致内存不足_损失函数_09

torch.autograd.grad会返回一个tensor，而loss.backward()不会返回结果，而是赋给了每一个维度，可通过w1.grad查看相应的梯度。

2.Cross Entropy Loss：可用于二分类，多分类，可以和softmax函数搭配起来使用，讲逻辑回归时会详细讲解。

p31：1.softmax：满足每个值都是区间[0,1]内的，并且所有值的和是等于1的。因此softmax十分适合于多分类问题（将概率值的最大值对应的索引作为label）。softmax还有一个额外的效果：将原来大的放的更大，将原来小的压缩的更小。比如：原来y1=2.0,y2=1.0,y1=2y2，而经过softmax函数处理之后，y1=0.7,y2=0.2,y1=3.5y2，3.5>2.0，所以将原来大的放的更大了。softmax的函数定义为：

pytorch因为多线程原因导致内存不足_笔记_10

对softmax函数求导：

（1）当i=j时：

pytorch因为多线程原因导致内存不足_pytorch_11

（2）else：

pytorch因为多线程原因导致内存不足_笔记_12

总结：

pytorch因为多线程原因导致内存不足_MSE_13

pytorch实现：

pytorch因为多线程原因导致内存不足_MSE_14

（1）p.backward():把梯度信息写道相应的维度，同时也会清除图中的梯度信息，即执行完该语句后再次执行p.backward()会报错。

（2）如果设置了p.backward(retain_grad=True)，那么执行完该语句后再执行p.backward()就不会报错了，但如果第三次执行p.backward()而第二次p.backward()中没有设置retain_grad=True，那么第三次执行会报错。即retain_grad=True只能使梯度信息保持一次。

（3）注意：无论是backward函数还是autograd.grad函数，loss函数都必须是1维且长度为1的（即shape为[1]），如果是1维但长度为3，则说明你的计算出错了，不对。

（4）p=F.softmax(a,dim=0)会自动建图。

p32：1.符号表示：

pytorch因为多线程原因导致内存不足_笔记_15